Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Это содержимое относится к: версии 4.0 (GA)checkmarkПредыдущие версии: | blue-checkmark v3.1 (GA) версии 3.0 (GA)синяя галочка версии 2.1 (GA)синяя галочка
Это содержимое относится к: версия 3.1 (GA)Последняя версия: checkmark | Предыдущие версии:синяя галочка v3.0синяя галочкаверсии 2.1
purple-checkmarkЭто содержимое относится к: версия 3.0 (GA)checkmarkПоследние версии:purple-checkmarkверсия 4.0 (GA) версии 3.1Предыдущая версия:синяя галочкаверсия 2.1
Это содержимое относится к: версии 2.1 Последняя версия:синяя галочка
Azure AI Document Intelligence — это облачная служба ИИ Azure , которую можно использовать для создания интеллектуальных решений для обработки документов. Большие объемы данных, охватывающие различные типы данных, хранятся в формах и документах. Аналитика документов позволяет эффективно управлять скоростью сбора и обработки данных. Аналитика документов является ключевым фактором для улучшения операций, принятия обоснованных решений на основе данных и просвещенных инноваций. Сведения о доступе к регионам см. в разделе "Доступность продукта по регионам".
| ✔️ Модели анализа документов | ✔️ Предварительно созданные модели | ✔️ Пользовательские модели |
Модели анализа документов
Модели анализа документов (общего извлечения) позволяют извлекать текст из форм и документов и возвращать структурированное содержимое, готовое для бизнеса для действий, использования или разработки вашей организации.
Чтение | Извлеките печатный и рукописный текст.
Макет | Извлечение текста, таблиц и структуры документов.
Чтение | Извлеките печатный и рукописный
текст.
Макет | Извлечение текста, таблиц
и структуры документов.
Общий документ | Извлечение пар "текст", "структура" и
"ключ-значение".
Предварительно созданные модели
Предварительно созданные модели можно использовать для добавления интеллектуальной обработки документов в приложения и потоки без необходимости обучения и создания собственных моделей.
Финансовые услуги и юридические услуги
Банковский оператор | Извлеките сведения о счете и сведения из банковских инструкций.
Проверка | Извлеките соответствующие сведения из проверок.
Контракт | Извлечение соглашений и сведений о стороне.
Кредитная карта | Извлеките сведения о платной карте.
Счет | Извлеките сведения о клиенте и поставщике.
Оплата заглушки | Извлечение сведений о заглушки оплаты.
Получение | Извлеките сведения о транзакции продаж.
Налог США
Унифицированный налог США | Извлечение из любых поддерживаемых налоговых форм США.
Налог США W-2 | Извлечение сведений о компенсации с налогом.
Налог США 1098 | Извлеките сведения о вариантах 1098.
Налог США 1099 | Извлеките сведения о вариантах 1099.
Налог США 1040 | Извлеките сведения о вариантах 1040.
Ипотека США
Ипотека США 1003 | Извлечение сведений о приложении кредита.
Ипотека США 1004 | Извлечение информации из оценки.
Ипотека США 1005 | Извлеките сведения из проверки занятости.
Ипотека США 1008 | Извлечение сведений о передаче кредита.
Раскрытие ипотеки США | Извлеките окончательные условия закрытия кредита.
Личная идентификация
Карточка медицинского страхования | Извлеките сведения о страховании.
Удостоверение | Извлеките сведения о проверке.
Свидетельство о браке | Извлеките сертифицированные сведения о браке.
Счет | Извлеките сведения о клиенте
и поставщике.
Получение | Извлеките сведения о транзакции продаж
.
Удостоверение | Извлечение сведений об идентификации
и проверке.
Карточка медицинского страхования | Извлеките сведения о медицинском страховании.
Визитная карточка | Извлечение сведений о бизнес-контакте.
Контракт | Извлечение соглашений
и сведений о стороне.
Налог США W-2 | Извлечение сведений о компенсации с налогом
.
Налог США 1098 | Извлеките сведения о вариантах 1098.
Пользовательские модели
Пользовательские модели обучены с помощью помеченных наборов данных для извлечения отдельных данных из форм и документов, относящихся к вашим вариантам использования. Вы можете объединить автономные пользовательские модели для создания составных моделей.
Модели извлечения полей документа
✔️ Модели извлечения полей документов обучены извлекать помеченные поля из документов.
Настраиваемый нейрон | Извлеките данные из документов смешанного типа.
Пользовательский шаблон | Извлеките данные из статических макетов.
Пользовательский состав | Извлечение данных с помощью коллекции моделей.
Пользовательские модели классификации
✔️ Пользовательские классификаторы определяют типы документов перед вызовом модели извлечения.
Настраиваемый классификатор | Определите назначенные типы документов (классы) перед вызовом модели извлечения.
Возможности надстройки
Аналитика документов поддерживает дополнительные функции, которые можно включить или отключить в зависимости от сценария извлечения документов:
Функции анализа
Идентификатор модели | Извлечение содержимого | Поля запроса | Paragraphs | Роли абзаца | Метки выделения | Tables | Пары "Ключ-значение" | Languages | Barcodes | Анализ документов | Formulas* | Шрифт стиля* | Высокое разрешение* | Pdf-файл, доступный для поиска |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read |
✓ | ✓ | O | O | O | O | O | O | ||||||
prebuilt-layout |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
prebuilt-contract |
✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice |
✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1004 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1005 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w4 |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (различные) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1095A |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1095C |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1098 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (различные) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Включен O - Необязательный
* - Премиум функции влечет за собой дополнительные расходы
Модели и варианты разработки
Используйте аналитику документов для автоматизации обработки документов в приложениях и рабочих процессах, улучшения стратегий на основе данных и обогащения возможностей поиска документов. Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть параметры разработки.
Read
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданное чтение | • Извлечение текста из документов. ● Извлечение данных. |
• Оцифровка любого документа ● Соответствие и аудит ● Обработка рукописных заметок перед переводом |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Layout
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданный макет | ● Извлечение текста и сведений о макете из документов. ● Извлечение данных. |
• Индексирование документов и извлечение по структуре ● Анализ финансовых и медицинских отчетов |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Общий документ (устаревший в 2023-10-31-preview)
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданный документ | ● Извлечение пар текста, макета и ключа и значения из документов. • Извлечение данных и полей. |
• Извлечение пары "ключ-значение" | Обработка формы| Сбор и анализ данных опроса |
● REST APIАналитики документов |
Invoice
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданная счет-фактура | • Извлечение ключевых сведений из счетов. • Извлечение данных и полей. |
• Автоматическая регистрация налогов и отчетность по счетам с оплатой счетов |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Receipt
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданная квитанция | • Извлечение ключевых сведений из квитанций. • Извлечение данных и полей. • Модель квитанций версии 3.0 поддерживает обработку одностраничных квитанций о отелях. |
• Управление затратами● Анализ данных о поведении потребителей● Программа лояльности клиентов● Обработка возврата товаров● Автоматическая запись налогов и отчеты |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Удостоверение (идентификатор)
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-idDocument | • Извлеките ключевые сведения из паспортов и идентификаторов. • Типы документов. • Извлеките подтверждения, ограничения и классификации транспортных средств из лицензий водителя США. |
• Знают, что ваш клиент (KYC) финансовые услуги рекомендации по соответствию требованиям по управлению медицинскими учетными записями● Контрольные точки идентификации и шлюзы ● Регистрация отеля |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Check
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданная проверка | • Извлечение сведений о ключе из проверок. • Извлечение данных и полей. |
• Управление кредитами● Автоматизированное управление кредитором |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Оплата заглушки
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданная paystub | • Извлеките ключевые сведения из заглушки оплаты. • Извлечение данных и полей. |
• Проверка сведений о заработной плате сотрудников● Обнаружение мошенничества для трудоустройства ● Автоматическая налоговая обработка |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Банковский оператор
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-bankStatement | • Извлечение ключевых сведений из банковских инструкций. • Извлечение данных и полей. |
• Варианты использования налоговой обработки● Автоматизированное управление учетом● Управление кредитным дебетом● Обработка документации по кредитам |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Карточка медицинского страхования
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-healthInsuranceCard.us | • Извлеките ключевые сведения из карт медицинского страхования США. • Извлечение данных и полей. |
• Проверка охвата и прав на соответствие требованиям ● Прогнозное моделирование ● Аналитика на основе значений |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Модель контракта
Идентификатор модели | Description | Варианты разработки |
---|---|---|
предварительно созданный контракт | • Извлечение соглашения о контракте и сведений о стороне. • Извлечение данных и полей. |
● Document Intelligence Studio ● REST API● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Python ● Пакет SDK java для Java |
Модель кредитной карты
Идентификатор модели | Description | Варианты разработки |
---|---|---|
предварительно созданная кредитная карта | • Извлечение соглашения о контракте и сведений о стороне.
• Извлечение данных и полей. |
● Document Intelligence Studio ● REST API● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Python ● Пакет SDK java для Java |
Модель сертификата о браке
Идентификатор модели | Description | Варианты разработки |
---|---|---|
prebuilt-marriageCertificate.us | • Извлечение соглашения о контракте и сведений о стороне.
• Извлечение данных и полей. |
● Document Intelligence Studio ● REST API● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Python ● Пакет SDK java для Java |
Форма ипотеки США 1003
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.1003 | • Извлеките ключевые сведения из 1003 приложений по кредитам.
• Извлечение данных и полей. |
Требования к документации по Fannie Mae и Freddie Mac | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма ипотеки США 1004
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.1004 | • Извлеките ключевую информацию из 1004 оценки.
• Извлечение данных и полей. |
• Требования к документации Fannie Mae и Freddie Mac ● Единый отчет о жилой оценке, чтобы помочь кредитору или клиенту с рыночной стоимостью субъекта собственности |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма ипотеки США 1005
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.1005 | • Извлеките ключевые сведения из проверки занятости в 1005 году.
• Извлечение данных и полей. |
• Требования к документации Fannie Mae и Фредди Mac — проверка документа о занятости, чтобы определить квалификацию в качестве потенциального моргагора |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма ипотеки США 1008
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.1008 | • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи.
• Извлечение данных и полей. Обработка подзаписи кредита с помощью сводных данных |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма раскрытия ипотеки США
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи.
• Извлечение данных и полей. |
Окончательные требования к ипотечным кредитам | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Модель налогового налога США W-2
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-tax.us.w2 | Извлечение ключевых сведений из налоговых форм IRS US W2 (годы 2018-2021). |
● Автоматизированное управление налоговыми документами ● Обработка заявки на ипотечный кредит |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Формы налога США 1098 (и варианты)
Идентификатор модели | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1098{variation } |
Извлеките ключевые сведения из вариантов формы 1098. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Формы налога США 1099 (и варианты)
Идентификатор модели | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1099{variation } |
Извлеките сведения из вариантов формы 1099. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Формы налога США 1040 (и варианты)
Идентификатор модели | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1040{variation } |
Извлеките сведения из вариантов формы 1040. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Унифицированные налоговые формы США
Идентификатор модели | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us | Извлеките информацию из любой поддерживаемой налоговой формы США. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Визитная карточка
Идентификатор модели | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданная бизнес-карта | • Извлечение ключевых сведений из визитных карточек. • Извлечение данных и полей. |
Руководитель продаж и управление маркетингом | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Обзор пользовательской модели
About | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Пользовательская модель | Извлеките сведения из форм и документов в структурированные данные на основе модели, созданной из набора репрезентативных наборов документов для обучения. | Извлеките отдельные данные из форм и документов, относящихся к вашему бизнесу и вариантам использования. | ● Document Intelligence Studio ● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Java SDK для JavaScript ● Пакет SDK для JavaScript для Python |
Настраиваемый нейронный
Note
Чтобы обучить пользовательскую нейронную модель, задайте buildMode
для свойства значение neural
. Дополнительные сведения см. в разделе "Обучение нейронной модели".
About | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Пользовательская нейронная модель | Извлеките помеченные данные из структурированных (опросов, анкет), полуструктурированных (счетов, заказов на покупку) и неструктурированных документов (контракты, письма). | Извлечение текстовых данных, флажков и табличных полей из структурированных и неструктурированных документов. |
Document Intelligence Studio ● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для JavaScript для JavaScript ● Пакет SDK для Python |
Пользовательский шаблон
Note
Чтобы обучить пользовательскую модель шаблона, задайте buildMode
для свойства значение template
. Дополнительные сведения см. в разделе "Обучение модели шаблона".
About | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Пользовательская модель шаблона | Извлеките помеченные значения и поля из структурированных и полуструктурированных документов. |
Извлеките ключевые данные из высокоструктурированных документов с определенными визуальными шаблонами или общими визуальными макетами и формами. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python sdk для Java ● Пакет SDK java для JavaScript |
Пользовательский состав
About | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Создание пользовательских моделей | Составная модель создается на основе коллекции настраиваемых моделей, которые назначаются одной модели, созданной из ваших типов форм. | Полезно при обучении нескольких моделей и их группировке для анализа аналогичных типов форм, таких как заказы на покупку | ● Document Intelligence Studio ● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Java SDK для JavaScript ● Пакет SDK для JavaScript для Python |
Пользовательская модель классификации
About | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Модель составной классификации | Пользовательские модели классификации объединяют функции макета и языка для обнаружения, идентификации и классификации документов в входном файле. | • Пакет приложения на кредит, содержащий формы приложений, оплатить скольжения и банковские инструкции ● Коллекция отсканированных счетов |
● REST API Аналитики документов |
Azure AI Document Intelligence — это облачная служба ИИ Azure для разработчиков для создания интеллектуальных решений для обработки документов. Аналитика документов применяет оптическое распознавание символов (OCR) на основе машинного обучения вместе с технологиями распознавания документов для извлечения текста, таблиц, структуры и пар "ключ-значение" из документов. Вы также можете пометить и обучить пользовательские модели для автоматизации извлечения данных из структурированных, полуструктурированных и неструктурированных документов. Дополнительные сведения о каждой модели см. в статьях о концепциях.
Тип модели | Имя модели |
---|---|
Модель анализа документов | • Модель анализа макета |
Предварительно созданные модели | • Модель выставления счетов: модель квитанции● Модель документа идентификации (ID) ● Модель визитной карточки |
Пользовательские модели | • Пользовательская модель● Составная модель |
Это содержимое относится к: версии 2.1 Последняя версия:синяя галочка
Модели аналитики документов и варианты разработки
Tip
Для повышения качества и расширенного качества модели попробуйте в Студии аналитики документов версии 3.0:
- Студия версии 3.0 поддерживает любую модель, обученную с помощью маркированных данных версии 2.1.
- Дополнительные сведения о миграции с версии 2.1 на версию 3.0 см. в руководстве по миграции API.
Чтобы узнать больше о каждой модели и просмотреть ссылки на API, используйте ссылки в следующей таблице.
Конфиденциальность и безопасность данных
Как и во всех службах ИИ, разработчики, использующие Аналитику документов, должны учитывать политики Майкрософт по данным клиентов. Дополнительные сведения см. в разделе "Данные", "Конфиденциальность" и "Безопасность" для аналитики документов.
Связанный контент
- Выберите модель аналитики документов.
- Обработайте собственные формы и документы с помощью Document Intelligence Studio.
- Завершите краткое руководство по анализу документов и создайте приложение для обработки документов на выбранном языке разработки.
- Обработайте собственные формы и документы с помощью средства аналитики документов.
- Завершите краткое руководство по анализу документов и создайте приложение для обработки документов на выбранном языке разработки.