Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Внимание
Для версий аналитики документов версии 4.0 предварительная версия и переход к нерекомендуемой модели общего документа (предварительно созданного документа). Чтобы извлечь пары "ключ-значение", метки выделения, текст, таблицы и структура из документов, используйте следующие модели:
| Функция | версия | Идентификатор модели |
|---|---|---|
Layout модель с включенным необязательным параметром features=keyValuePairs строки запроса. |
• v4:2024-11-30 • v3.1:2023-07-31 (GA) |
prebuilt-layout |
| Модель документа общего назначения | • v3.1:2023-07-31 (GA)• v3.0:2022-08-31 (GA) • версии 2.1 (GA) |
prebuilt-document |
Это содержимое относится к: версия 3.1 (GA) | blue-checkmarkpurple-checkmarkПредыдущая версия:v3.0
Это содержимое относится к: версии 3.0 (GA)
checkmarkПоследние версии:флажокv4.0 (GA)фиолетовый флажокверсии 3.1
Общая модель документов объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для извлечения пар ключей, таблиц и выделений из документов. Общий документ доступен с API версии 3.1 и версии 3.0. Дополнительные сведения см . в руководстве по миграции.
Функции и возможности документа общего назначения
Общая модель документов — это предварительно обученная модель; Для этого не требуются метки или учебные курсы.
Один API извлекает из документов пары "ключ-значение", метки выделения, текст, таблицы и структуру.
Модель документа общего назначения поддерживает структурированные, частично структурированные и неструктурированные документы.
Знаки выделения определяются как поля со значением
:selected:или:unselected:.
Пример документа, обработанный в Студии аналитики документов
Извлечение пары "ключ-значение"
API общих документов поддерживает большинство типов форм и анализирует документы и извлекает ключи и связанные значения. Это оптимальный вариант для извлечения из документов стандартных пар "ключ-значение". Модель документа общего назначения можно использовать в качестве альтернативы обучению настраиваемой модели без меток.
Варианты разработки
Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:
| Функция | Ресурсы | Идентификатор модели |
|---|---|---|
| Модель документа общего назначения | • Аналитика • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для |
предварительно созданный документ |
Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:
| Функция | Ресурсы | Идентификатор модели |
|---|---|---|
| Модель документа общего назначения | • Аналитика • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для |
предварительно созданный документ |
Требования к входным данным
Поддерживаются следующие форматы файлов.
| Модель | Изображение: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Читать | ✔ | ✔ | ✔ |
| Макет | ✔ | ✔ | ✔ |
| Документ общего назначения | ✔ | ✔ | |
| Готовое | ✔ | ✔ | |
| Настраиваемая функция извлечения | ✔ | ✔ | |
| Настраиваемая классификация | ✔ | ✔ | ✔ |
- Фотографии и сканы: для получения наилучших результатов укажите одну чистую фотографию или высококачественную проверку на документ.
- PDF и TIFFs: для PDF-файлов и TIFFs можно обрабатывать до 2000 страниц. (С подпиской на бесплатный уровень обрабатываются только первые две страницы.)
- Размер файла: размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
- Размеры изображения: размеры должны находиться в диапазоне от 50 пикселей до 10 000 пикселей x 10 000 пикселей.
- Блокировки паролей. Если pdf-файлы заблокированы паролем, необходимо удалить блокировку перед отправкой.
- Высота текста: минимальная высота извлеченного текста составляет 12 пикселей для изображения 1024 x 768 пикселей. Это измерение соответствует примерно 8-точечным тексту в 150 точек на дюйм.
- Обучение пользовательской модели: максимальное количество страниц для обучающих данных составляет 500 для пользовательской модели шаблона и 50 000 для пользовательской нейронной модели.
- Обучение пользовательской модели извлечения: общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
- Обучение пользовательской модели классификации: общий размер обучающих данных составляет 1 ГБ, не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с максимум 10 000 страниц.
- Типы файлов Office (DOCX, XLSX, PPTX): максимальная длина строки составляет 8 миллионов символов.
Извлечение данных модели общих документов
Попробуйте извлечь данные из форм и документов с помощью Document Intelligence Studio.
Вам потребуются следующие ресурсы:
Подписка Azure — ее можно создать бесплатно.
Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (
F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.
Примечание.
Document Intelligence Studio и общая модель документов доступны с ПОМОЩЬЮ API версии 3.0.
На домашней странице Document Intelligence Studio выберите общие документы.
Вы можете проанализировать пример документа или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:
Пары "ключ-значение"
Пары "ключ-значение" — это отдельные фрагменты внутри документа, которые определяют метку или ключ и связанный с ними ответ или значение. В структурированной форме эти пары могут быть меткой и значением, которое пользователь указал для данного поля. В неструктурированном документе они могут быть датой подписания договора на основании текста в абзаце. Модель искусственного интеллекта предназначена для извлечения идентифицируемых ключей и значений на основе широкого спектра типов документов, форматов и структур.
Ключи также могут существовать в изоляции, когда модель обнаруживает, что ключ существует, но с ним не связано ни одно значение, или при обработке необязательных полей. Например, поле промежуточного имени можно оставить пустым в форме в некоторых экземплярах. Пары "ключ-значение" всегда представляют собой фрагменты текста, содержащиеся в документе. Для документов, в которых одно и то же значение описано разными способами, например клиент или пользователь, связанный ключ является клиентом или пользователем (в зависимости от контекста).
Извлечение данных
| Модель | Извлечение текста | Пары "ключ-значение" | Метки выделения | Таблицы | Общие имена |
|---|---|---|---|---|---|
| Документ общего назначения | ✓ | ✓ | ✓ | ✓ | ✓* |
✓ * — доступно только в 2023-07-31 версиях API версии 3.1 и более поздних версий API.
Поддерживаемые языки и языковые стандарты
См. страницу "Поддержка языка" — модели анализа документов для полного списка поддерживаемых языков.
Рекомендации
Так как ключи являются диапазонами текста, извлеченных из документа, для полуструктурированных документов ключи необходимо сопоставить с существующим словарем ключей.
Могут отображаться пары "ключ-значение" с ключом, но без значения (например, если пользователь не указал в форме адрес электронной почты).
Следующие шаги
Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию 3.1 в приложениях и рабочих процессах.
Изучите наш REST API.