Модели обработки документов

Это содержимое относится к:версии 4.0 (GA) | Предыдущие версии:версии 3.1 (GA) версии 3.0 (вывод из эксплуатации)версии 2.1 (вывод из эксплуатации)

Это содержимое относится к:версии 3.1 (GA) | Последняя версия:версии 4.0 (GA) | Предыдущие версии:версии 3.0версии 2.1

Это содержимое относится к:red-checkmarkверсии 3.0 (удаление)Последние версии:purple-checkmarkверсия 4.0 (GA)purple-checkmarkверсия 3.1Предыдущая версия:blue-checkmarkверсия 2.1 (удаление)

Это содержимое относится к:версия 2.1 | Последняя версия:версия 4.0 (GA)

Azure Аналитика документов в средстве Foundry поддерживает различные модели, которые можно использовать для добавления интеллектуальной обработки документов в приложения и потоки. Вы можете использовать предварительно созданную модель для конкретного домена или обучить пользовательскую модель, адаптированную к конкретным бизнес-потребностям и вариантам использования. Интеллектуальный анализ документов можно использовать с помощью REST API или клиентских библиотек для Python, C#, Java и JavaScript.

Примечание

Проекты обработки документов, включающие финансовые данные, защищенные данные о работоспособности, персональные данные или высокочувствительные данные, требуют тщательного внимания. Обязательно соблюдайте все национальные или региональные и отраслевые требования.

Общие сведения о модели

В следующей таблице показаны общедоступные модели для каждого стабильного API.

Тип модели	Модель	2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
Модели анализа документов	Прочитать	✔️	✔️	✔️	Недоступно
Модели анализа документов	Макет	✔️	✔️	✔️	✔️
Модели анализа документов	Общий документ**	Поддерживается в Модель макета	✔️	✔️	Недоступно
Предварительно созданные модели	Банковский контроль	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Банковская выписка	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	payStub	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Контракт	✔️	✔️	Недоступно	Недоступно
Предварительно созданные модели	Карточка медицинского страхования	✔️	✔️	✔️	Недоступно
Предварительно созданные модели	Удостоверение личности	✔️	✔️	✔️	✔️
Предварительно созданные модели	Счет	✔️	✔️	✔️	✔️
Предварительно созданные модели	Получения	✔️	✔️	✔️	✔️
Предварительно созданные модели	Унифицированный налог США*	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Налог США 1040*	✔️	✔️	Недоступно	Недоступно
Предварительно созданные модели	Налог США 1095*	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Налог США 1098*	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Налог США 1099*	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Налог W2 США	✔️	✔️	✔️	Недоступно
Предварительно созданные модели	Налог сша W4	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	США ипотека 1003 URLA	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Американская ипотека 1004 URAR	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Ипотека США 1005	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Сводка по ипотеке США 1008	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Раскрытие информации о закрытии ипотеки США	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Свидетельство о браке	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Кредитная карта	✔️	Недоступно	Недоступно	Недоступно
Предварительно созданные модели	Визитная карточка	Устаревший	✔️	✔️	✔️
Пользовательская модель классификации	Настраиваемый классификатор	✔️	✔️	Недоступно	Недоступно
Пользовательская модель извлечения	Настраиваемая нейронная сеть	✔️	✔️	✔️	Недоступно
Пользовательская модель извлечения	Пользовательский шаблон	✔️	✔️	✔️	✔️
Пользовательская модель извлечения	Пользовательская сборка	✔️	✔️	✔️	✔️
Все модели	Возможности надстройки	✔️	✔️	Недоступно	Недоступно

* Содержит подмодели. Сведения о поддерживаемых вариантах и подтипах см. в сведениях о модели.
** Все возможности для общей модели документов доступны в модели макета. Общая модель больше не поддерживается.

Задержки

Задержка — это время, необходимое для обработки и обработки входящего запроса сервера API и доставки исходящего ответа клиенту. Время анализа документа зависит от размера (например, количества страниц) и связанного содержимого на каждой странице. Аналитика документов — это мультитенантная асинхронная служба, в которой задержка для аналогичных документов сравнима, но не всегда идентична. Иногда вариативность задержки и производительности связана с любой микрослужбой, без отслеживания состояния, которая обрабатывает изображения и большие документы в большом масштабе. Несмотря на то, что мы постоянно масштабируем оборудование и емкость и возможности масштабирования, могут возникнуть проблемы с задержкой во время выполнения.

Возможность дополнения

Для аналитики документов доступны следующие возможности надстройки. Для всех моделей, кроме модели визитной карточки, аналитика документов теперь поддерживает возможности надстроек, чтобы обеспечить более сложный анализ. Эти необязательные возможности можно включить и отключить в зависимости от сценария извлечения документов. Для версии API 2023-07-31 (GA) и более поздних версий API доступны следующие возможности надстройки:

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
queryFields (недоступно для налоговых моделей США)
searchablePDF (доступно только для модели чтения)

Возможность дополнения	Бесплатное дополнение	2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
Извлечение свойств шрифта	дополнение	✔️	✔️	Недоступно	Недоступно
Извлечение формул	Плагин	✔️	✔️	Недоступно	Недоступно
Извлечение высокого разрешения	Дополнение	✔️	✔️	Недоступно	Недоступно
Извлечение штрихкодов	Бесплатный	✔️	✔️	Недоступно	Недоступно
Обнаружение языка	Бесплатный	✔️	✔️	Недоступно	Недоступно
Пары «ключ-значение»	Бесплатный	✔️	Недоступно	Недоступно	Недоступно
Поля запроса	дополнение*	✔️	Недоступно	Недоступно	Недоступно
Pdf-файл, доступный для поиска	Надстройка*	✔️	Недоступно	Недоступно	Недоступно

Функции анализа моделей

Идентификатор модели	Извлечение содержимого	Поля запроса	Параграфы	Роли абзаца	Метки выделения	Таблицы	Пары "Ключ-значение"	Языки	Штрихкоды	Анализ документов	Формулы*	Шрифт стиля*	Высокое разрешение*	Pdf-файл, доступный для поиска
`prebuilt-read`	✓		✓					O	O		O	O	O	O
`prebuilt-layout`	✓	✓	✓	✓	✓	✓	O	O	O		O	O	O
`prebuilt-contract`	✓	✓	✓	✓	✓			O	O	✓	O	O
`prebuilt-healthInsuranceCard.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-idDocument`	✓	✓						O	O	✓	O	O	O
`prebuilt-invoice`	✓	✓			✓	✓	O	O	O	✓	O	O	O
`prebuilt-receipt`	✓	✓						O	O	✓	O	O	O
`prebuilt-marriageCertificate.us`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-creditCard`	✓	✓						O	O	✓	O	O	O
`prebuilt-check.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-payStub.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-bankStatement`	✓	✓						O	O	✓	O	O	O
`prebuilt-mortgage.us.1003`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1004`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1005`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1008`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.closingDisclosure`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.w2`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.w4`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1040` (различные)	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1095A`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1095C`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1098`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1098E`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1098T`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1099` (различные)	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1099SSA`	✓	✓						O	O	✓	O	O	O
`{ customModelName }`	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

✓ - Включен O - Необязательный

* - Премиум функции влечет за собой дополнительные расходы

Поля запросов ценятся по-другому, чем другие функции надстройки. Дополнительные сведения см. в разделе "Цены".

Координаты ограничивающего прямоугольника и многоугольника

Ограничивающий прямоугольник (polygon в версиях 3.0 и более поздних версиях) — это абстрактный прямоугольник, который окружает текстовые элементы в документе. Ограничивающая рамка используется для ориентира при обнаружении объектов.

Ограничивающий прямоугольник указывает позицию с помощью плоскости координат x и y, представленной в массиве из четырех числовых пар. Каждая пара представляет угол поля в следующем порядке: верхний левый, верхний правый, нижний правый, нижний левый.
Координаты изображения представлены в пикселях. Для PDF координаты представлены в дюймах.

Поддержка языка

Универсальные модели в Аналитике документов, основанные на глубоком обучении, поддерживают многие языки. Модели могут извлекать многоязычный текст из изображений и документов, включая текстовые строки с смешанными языками. Поддержка языка зависит от функциональных возможностей службы аналитики документов. Полный список см. в следующих статьях:

Региональная доступность

Аналитика документов широко доступна во многих из 60+ глобальных инфраструктурных регионов Azure.

Чтобы помочь выбрать регион, который лучше всего подходит для вас и ваших клиентов, см. Azure географии.

Сведения о модели

В этом разделе описываются выходные данные, которые можно ожидать от каждой модели. Вы можете расширить выходные данные большинства моделей с помощью функций надстройки.

Чтение OCR

API чтения использует оптическое распознавание символов (OCR) для анализа и извлечения строк и слов, их расположений, обнаруженных языков и стиля рукописного ввода при обнаружении.

Этот пример документа был обработан с помощью Document Intelligence Studio.

Снимок экрана: пример документа, обработанный с помощью Document Intelligence Studio Read.

Дополнительные сведения: чтение модели

Анализ макета

Модель анализа макета анализирует и извлекает текст, таблицы, знаки выделения и другие элементы структуры, такие как заголовки, заголовки разделов, заголовки страниц и нижние колонтитулы страницы.

Этот пример документа был обработан с помощью Document Intelligence Studio.

Снимок экрана: пример страницы газеты, обрабатываемой с помощью Document Intelligence Studio.

Дополнительные сведения: модель макета

Карточка медицинского страхования

Модель карты медицинского страхования объединяет мощные возможности OCR с моделями глубокого обучения для анализа и извлечения ключевых сведений из карт медицинского страхования США.

Этот пример карты медицинского страхования США был обработан с помощью Document Intelligence Studio.

Дополнительные сведения: модель карты медицинского страхования

Налоговые документы США

Модели налоговых документов США анализируют и извлекают ключевые поля и элементы строки из выбранной группы налоговых документов. API поддерживает анализ налоговых документов США на английском языке различных форматов и качества, включая захваченные телефоном изображения, сканированные документы и цифровые PDF-файлы. В настоящее время поддерживаются следующие модели:

Модель	Описание	Идентификатор модели
Форма W-2 для налогов США	Извлечение сведений о налогооблагаемой компенсации.	`prebuilt-tax.us.w2`
Форма W-4 для налогообложения США	Извлечение сведений о налогооблагаемой компенсации.	`prebuilt-tax.us.w4`
Налог США 1040	Извлечение сведений о проценте по ипотеке.	`prebuilt-tax.us.1040` (варианты)
Налог США 1095	Извлеките сведения о медицинском страховании.	`prebuilt-tax.us.1095` (варианты)
Налог США 1098	Извлечение сведений о процентах по ипотеке.	`prebuilt-tax.us.1098` (варианты)
Налог США 1099	Извлечение дохода, полученного из источников, отличных от работодателя.	`prebuilt-tax.us.1099` (варианты)

Этот пример документа W-2 был обработан с помощью Document Intelligence Studio.

Снимок экрана: пример документа W-2.

Дополнительные сведения: модели налоговых документов

Ипотечные документы США

Модели ипотечных документов США анализируют и извлекают ключевые поля, включающие заемщик, кредит и информацию о собственности из выбранной группы ипотечных документов. API поддерживает анализ документов ипотеки на английском языке США различных форматов и качества, включая захваченные телефоном изображения, сканированные документы и цифровые PDF-файлы. В настоящее время поддерживаются следующие модели.

Модель	Описание	Идентификатор модели
Лицензионное соглашение 1003 End-User	Извлечение сведений о кредите, заемщике и собственности.	`prebuilt-mortgage.us.1003`
1004 Единый отчет об оценке жилых помещений (URAR)	Извлечение сведений о кредите, заемщике и собственности.	`prebuilt-mortgage.us.1004`
1005 Проверка занятости	Извлечение кредита, заемщика, сведений о собственности.	`prebuilt-mortgage.us.1005`
Сводный документ 1008	Извлеките данные о заемщике, продавце, недвижимости, ипотеке и андеррайтинге.	`prebuilt-mortgage.us.1008`
Заключительное раскрытие информации	Извлечение затрат на закрытие сделки, транзакционных затрат и деталей кредита.	`prebuilt-mortgage.us.closingDisclosure`

Этот образец документа закрытия по раскрытию информации был обработан с помощью Document Intelligence Studio.

Снимок экрана, показывающий пример документа завершения раскрытия.

Дополнительные сведения: модели ипотечных документов

Контракт

Модель контракта анализирует и извлекает ключевые поля и элементы линии из договорных соглашений, включая стороны, юрисдикции, идентификатор контракта и название. В настоящее время модель поддерживает документы контракта на английском языке.

Этот пример контракта был обработан с помощью Document Intelligence Studio.

Снимок экрана: извлечение модели контракта с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

Проверка банка США

Модель контракта анализирует и извлекает ключевые поля из чеков банков США, включая сведения о чеке, сведения о счете, сумму и назначение.

Этот пример проверки банка был обработан с помощью Document Intelligence Studio.

Снимок экрана: извлечение модели проверки банка с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

Выписка из банка в США

Модель анализа банковских выписок анализирует и извлекает ключевые поля и позиции строк из выписок банков США, включая номер счета, сведения о банке, детали выписки и сведения о транзакциях.

Этот пример банковской выписки был обработан с помощью Document Intelligence Studio.

Снимок экрана, который показывает извлечение модели банковской выписки с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

payStub

Модель payStub анализирует и извлекает ключевые поля и элементы строки из документов и файлов с информацией, связанной с заработной платы.

Этот пример расчетного листка был обработан с помощью Document Intelligence Studio.

Снимок экрана: извлечение модели payStub с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

Счет

Модель счета автоматизирует обработку счетов для извлечения имени клиента, адреса выставления счетов, срока оплаты, суммы, позиций в счете и других ключевых данных.

Этот пример счета был обработан с помощью Document Intelligence Studio.

Дополнительные сведения: модель счета

Квитанция

Используйте модель чеков для сканирования торговых чеков на предмет имени продавца, дат, позиций, количества и итогов в печатных и рукописных чеках. Версия 3.0 также поддерживает обработку квитанций об одностраничных отелях.

Этот пример квитанции был обработан с помощью Document Intelligence Studio.

Дополнительные сведения: модель получения квитанций

Удостоверение личности

Используйте модель удостоверения (ID) для обработки лицензий водителя США (все 50 штатов и округа Колумбия) и биографические страницы из международных паспортов (за исключением виз и других документов для путешествий) для извлечения ключевых полей.

Этот пример лицензии водителя США был обработан с помощью Document Intelligence Studio.

Дополнительные сведения: модель идентификационных документов

Свидетельство о браке

Используйте модель сертификата брака для обработки сертификатов брака США для извлечения ключевых полей, в том числе отдельных лиц, даты и расположения.

Этот пример сертификата о браке США был обработан с помощью Document Intelligence Studio.

Дополнительные сведения: модель документов удостоверения личности

Кредитная карта

Используйте модель кредитной карты для обработки кредитных и дебетовых карт для извлечения ключевых полей.

Этот пример кредитной карты был обработан с помощью Document Intelligence Studio.

Дополнительные сведения: модель удостоверяющих документов

Пользовательские модели

Пользовательские модели широко классифицируются по двум типам. Пользовательские модели классификации, поддерживающие классификацию типа документа и пользовательские модели извлечения, которые могут извлекать определенную схему из определенного типа документа.

Схема, показывающая типы пользовательских моделей и связанные режимы сборки модели.

Пользовательские модели документов анализируют и извлекают данные из форм и документов, относящихся к вашей организации. Они распознают поля формы в вашем уникальном контенте и извлекают пары "ключ-значение" и данные таблицы. Чтобы приступить к работе, вам потребуется только один пример типа формы.

Версия 3.0 и более поздние пользовательские модели поддерживают обнаружение подписей в пользовательских шаблонах (форме) и межстраничных таблицах как в шаблонах, так и в нейронных моделях. Обнаружение подписи ищет наличие подписи, а не удостоверение пользователя, который подписывает документ. Если модель возвращает неподписанный для обнаружения подписей, это означает, что модель не обнаружила подпись в определенном поле.

Этот пример пользовательского шаблона был обработан с помощью Document Intelligence Studio.

Снимок экрана, на котором анализируется пользовательская форма с помощью Document Intelligence.

Дополнительные сведения: настраиваемая модель

Настраиваемое извлечение

Пользовательская модель извлечения представлена в двух вариантах: пользовательский шаблон и пользовательская нейронная сеть. Чтобы создать пользовательскую модель извлечения, разметьте набор данных документов с нужными для извлечения значениями и обучите модель на размеченном наборе данных. Чтобы приступить к работе, вам потребуется только пять примеров одной формы или типа документа.

Этот пример пользовательского извлечения был обработан с помощью Document Intelligence Studio.

Снимок экрана: анализ пользовательской модели извлечения в Document Intelligence Studio.

Дополнительные сведения: пользовательская модель шаблона

Дополнительные сведения: настраиваемая нейронная модель

Настраиваемый классификатор

С помощью пользовательской модели классификации можно определить тип документа перед вызовом модели извлечения. Модель классификации доступна начиная с API 2023-07-31 (GA). Для обучения пользовательской модели классификации требуется по крайней мере два отдельных класса и не менее пяти выборок для каждого класса.

Дополнительные сведения: пользовательская модель классификации

Составные модели

Собранная модель создаётся путём объединения коллекции пользовательских моделей в одну модель, построенную на основе ваших типов форм. Вы можете назначить несколько пользовательских моделей к составной модели, которые могут вызываться с использованием одного идентификатора модели. Вы можете назначить до 200 обученных пользовательских моделей одной составной модели.

Этот образец модели находится в Document Intelligence Studio.

Снимок экрана, на котором показана панель пользовательской модели Document Intelligence Studio Compose.

Дополнительные сведения: настраиваемая модель

Требования к входным данным

Поддерживаются следующие форматы файлов.

Модель	PDF	Изображение: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Прочитать	✔	✔	✔
Макет	✔	✔	✔
Общий документ	✔	✔
Предварительно собранный	✔	✔
Настраиваемое извлечение	✔	✔
Настраиваемая классификация	✔	✔	✔

Фотографии и сканы: для получения наилучших результатов предоставьте одну четкую фотографию или высококачественный скан на каждый документ.
PDF и TIFF: для PDF и TIFF можно обрабатывать до 2000 страниц. (С подпиской на бесплатный уровень обрабатываются только первые две страницы.)
Размер файла: размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
Размеры изображения: размеры должны находиться в диапазоне от 50 пикселей до 10 000 пикселей x 10 000 пикселей.
Блокировки паролей. Если pdf-файлы заблокированы паролем, необходимо удалить блокировку перед отправкой.
Высота текста: минимальная высота извлеченного текста составляет 12 пикселей для изображения 1024 x 768 пикселей. Это измерение соответствует примерно 8-точечному тексту при 150 точках на дюйм.
Обучение пользовательской модели: максимальное количество страниц для обучающих данных составляет 500 для пользовательской модели шаблона и 50 000 для пользовательской нейронной модели.
Обучение пользовательской модели извлечения: общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
Обучение пользовательской модели классификации: общий размер обучающих данных составляет 1 ГБ, не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с максимум 10 000 страниц.
Типы файлов Office (DOCX, XLSX, PPTX): максимальная длина строки составляет 8 миллионов символов.

Примечание

Инструмент разметки образцов не поддерживает формат файла BMP. Ограничение связано с инструментом, а не с сервисом интеллектуального анализа документов.

Миграция версий

Узнайте, как использовать аналитику документов версии 3.0 в приложениях, выполнив действия, описанные в руководстве по миграции Document Intelligence версии 3.1.

Модель	Описание
Анализ документов
Макет	Извлеките информацию о тексте и макете из документов.
Предварительно собранный
Счет	Извлеките ключевые сведения из счетов на английском языке и испанском языке.
Получения	Извлеките ключевые сведения из квитанций на английском языке.
Удостоверение личности	Извлеките ключевые сведения из лицензий водителя США и международных паспортов.
Визитная карточка	Извлеките ключевые сведения из визитных карточек на английском языке.
Настраиваемые
Пользовательские	Извлеките данные из форм и документов, относящихся к вашему бизнесу. Специализированные модели обучены для ваших специфичных данных и случаев использования.
Составлено	Создайте коллекцию пользовательских моделей и объедините их в единую модель, созданную на основе ваших типов форм.

Макет

API макета анализирует и извлекает текст, таблицы и заголовки, метки выделения и сведения о структуре из документов.

Этот пример документа был обработан с помощью средства маркировки образца.

Снимок экрана: анализ макета с помощью средства

Дополнительные сведения: модель макета

Счет

Модель счета анализирует и извлекает ключевые сведения из счетов о продажах. API анализирует счета в различных форматах и извлекает ключевые сведения, такие как имя клиента, адрес выставления счетов, дата выполнения и сумма.

Этот пример счета был обработан с помощью средства маркировки образца.

Снимок экрана, на котором показан пример анализа счета-фактуры с помощью инструмента для маркировки образцов.

Дополнительные сведения: модель счета

Квитанция

Модель квитанций анализирует и извлекает ключевые сведения из печатных и рукописных квитанций о продажах.

Этот пример чека был обработан с помощью инструмента маркировки образцов.

Дополнительные сведения: модель получения квитанций

Документ удостоверяющий личность

Модель документа идентификатора анализирует и извлекает ключевые сведения из следующих документов:

Лицензии водителя США (все 50 штатов и округ Колумбия)
Биографические страницы из международных паспортов (за исключением виз и других документов для путешествий). API анализирует и извлекает документы, удостоверяющие личность.

Этот пример водительского удостоверения США был создан с помощью средства маркировки примеров.

Снимок экрана, показывающий образец удостоверения личности.

Дополнительные сведения: модель удостоверяющих документов

Визитная карточка

Модель визитной карточки анализирует и извлекает ключевые сведения из изображений визитных карточек.

Этот образец визитки был обработан с помощью инструмента для маркировки образцов.

Снимок экрана: пример визитной карточки.

Дополнительные сведения: модель визитных карточек

Настраиваемые

Пользовательские модели анализируют и извлекают данные из форм и документов, относящихся к вашему бизнесу. API — это программа машинного обучения, обученная распознавать поля формы в отдельном содержимом и извлекать пары ключей и значений и табличные данные. Чтобы приступить к работе, вам потребуется только пять примеров одного типа формы. Вы можете обучить настраиваемую модель с помощью помеченных наборов данных или без нее.

Этот пример настраиваемой модели был обработан с помощью средства создания примеров меток.

Снимок экрана, на котором показан инструмент аналитики документов, который анализирует настраиваемую область форм.

Дополнительные сведения: настраиваемая модель

Собранная настраиваемая модель

Собранная модель создаётся путём объединения коллекции пользовательских моделей в одну модель, построенную на основе ваших типов форм. Вы можете назначить несколько пользовательских моделей к составной модели, которые могут вызываться с использованием одного идентификатора модели. Вы можете назначить до 100 обученных настраиваемых моделей в одну составную модель.

Эта созданная область модели была обработана с помощью средства "Пример меток".

Снимок экрана, на котором показана панель пользовательской модели Document Intelligence Studio Compose.

Дополнительные сведения: настраиваемая модель

Извлечение данных модели

Модель	Извлечение текста	Метки выделения	Таблицы	Параграфы	Роли абзаца	Пары ключ-значение	Поля
Макет	✓	✓	✓	✓	✓
Счет	✓	✓	✓	✓		✓	✓
Получения	✓			✓			✓
Удостоверение личности	✓			✓			✓
Визитная карточка	✓			✓			✓
Настраиваемая форма	✓	✓	✓	✓			✓

Требования к входным данным

Поддерживаются следующие форматы файлов.

Модель	PDF	Изображение: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Прочитать	✔	✔	✔
Макет	✔	✔	✔
Общий документ	✔	✔
Предварительно собранный	✔	✔
Настраиваемое извлечение	✔	✔
Настраиваемая классификация	✔	✔	✔

Фотографии и сканы: для получения наилучших результатов предоставьте одну четкую фотографию или высококачественный скан на каждый документ.
PDF и TIFF: для PDF и TIFF можно обрабатывать до 2000 страниц. (С подпиской на бесплатный уровень обрабатываются только первые две страницы.)
Размер файла: размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
Размеры изображения: размеры должны находиться в диапазоне от 50 пикселей до 10 000 пикселей x 10 000 пикселей.
Блокировки паролей. Если pdf-файлы заблокированы паролем, необходимо удалить блокировку перед отправкой.
Высота текста: минимальная высота извлеченного текста составляет 12 пикселей для изображения 1024 x 768 пикселей. Это измерение соответствует примерно 8-точечному тексту при 150 точках на дюйм.
Обучение пользовательской модели: максимальное количество страниц для обучающих данных составляет 500 для пользовательской модели шаблона и 50 000 для пользовательской нейронной модели.
Обучение пользовательской модели извлечения: общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
Обучение пользовательской модели классификации: общий размер обучающих данных составляет 1 ГБ, не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с максимум 10 000 страниц.
Типы файлов Office (DOCX, XLSX, PPTX): максимальная длина строки составляет 8 миллионов символов.

Примечание

Инструмент разметки образцов не поддерживает формат файла BMP. Ограничение исходит от инструмента, а не от Document Intelligence.

Миграция версий

Вы можете узнать, как использовать аналитику документов версии 3.0 в приложениях, выполнив действия, описанные в руководстве по миграции Document Intelligence версии 3.1.

Обработайте собственные формы и документы с помощью Document Intelligence Studio.
Завершите краткое руководство по анализу документов и создайте приложение для обработки документов на выбранном языке разработки.

Обработайте собственные формы и документы с средством для маркировки документов с помощью искусственного интеллекта.
Завершите краткое руководство по анализу документов и создайте приложение для обработки документов на выбранном языке разработки.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2025-11-18

Модели обработки документов

Общие сведения о модели

Задержки

Возможность дополнения

Функции анализа моделей

Координаты ограничивающего прямоугольника и многоугольника

Поддержка языка

Региональная доступность

Сведения о модели

Чтение OCR

Анализ макета

Карточка медицинского страхования

Налоговые документы США

Ипотечные документы США

Контракт

Проверка банка США

Выписка из банка в США

payStub

Счет

Квитанция

Удостоверение личности

Свидетельство о браке

Кредитная карта

Пользовательские модели

Настраиваемое извлечение

Настраиваемый классификатор

Составные модели

Требования к входным данным

Миграция версий

Макет

Счет

Квитанция

Документ удостоверяющий личность

Визитная карточка

Настраиваемые

Собранная настраиваемая модель

Извлечение данных модели

Требования к входным данным

Миграция версий

Связанное содержимое

Обратная связь

Дополнительные ресурсы