Модель квитанции аналитики документов
Внимание
- Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
- Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
- Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
- Восточная часть США
- Западная часть США2
- Западная Европа
- Северная часть США
Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: версия 3.1 (GA) версии 3.0 (GA) версии 2.1 (GA)
Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (предварительная версия) | Предыдущие версии: версии 3.0 версии 2.1
Это содержимое относится к: версия 3.0 (GA) | Последние версии: v4.0 (предварительная версия) версии 3.1 | Предыдущая версия: версия 2.1
Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |
Модель квитанции аналитики документов объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевых сведений из квитанций о продажах. Квитанции могут иметь различные форматы и качество, они могут быть не только печатными, но и рукописными. API извлекает ключевые сведения, такие как имя и номер телефона продавца, дата транзакции, налог, итоговая сумма транзакции, и возвращает структурированные данные JSON.
Поддерживаемые типы квитанций:
- Термический
- Кредитная карта
- Gas
- Парковка
- Отель
- сторонними
- Коммуникации
- Развлечения
- Перелет
- Обучение
- Аптека или медицинское
Извлечение данных квитанции
Оцифровка квитанций включает преобразование различных типов квитанций, включая сканированные, сфотографированные и печатные копии, в цифровой формат для упрощенной обработки нижестоящего потока. Примеры включают управление затратами, анализ поведения потребителей, автоматизацию налогов и т. д. Использование технологии аналитики документов с OCR (оптическое распознавание символов) может извлекать и интерпретировать данные из этих различных форматов квитанций. Обработка аналитики документов упрощает процесс преобразования, но также значительно сокращает необходимое время и усилия, что упрощает эффективное управление данными и получение.
Пример квитанции, обработанный с помощью Document Intelligence Studio:
Пример квитанции, обрабатываемый с помощью средства проверки меток аналитики документов:
Варианты разработки
Аналитика документов версии 4.0 (2024-07-31-preview) поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель получения | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-receipt |
Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель получения | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-receipt |
Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель получения | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-receipt |
Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы |
---|---|
Модель получения | • Средство аналитики документов • REST API • пакет SDK для клиентской библиотеки • Контейнер Docker аналитики документов |
Требования к входным данным
Поддерживаемые форматы файлов:
Модель PDF Изображение: JPEG/JPG
, ,BMP
PNG
TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLЧитать ✔ ✔ ✔ Макет ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Документ общего назначения ✔ ✔ Готовое ✔ ✔ Настраиваемая функция извлечения ✔ ✔ Настраиваемая классификация ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и
4
МБ для бесплатного уровня (F0).Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту
8
точки в 150 точек на дюйм (DPI).Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и
1
ГБ для нейронной модели.Для обучения пользовательской модели классификации общий размер обучающих данных составляет
1
ГБ не более 10 000 страниц. Для 2024-07-31-preview и более поздних версий общий размер обучающих данных составляет2
ГБ с максимальным количеством 10 000 страниц.
- Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
- Поддерживаемая квота на страницы для PDF и TIFF: Аналитика документов может обрабатывать до 2000 страниц для подписчиков уровня "Стандартный" или только первые две страницы для подписчиков бесплатного уровня.
- Поддерживаемый размер файла: менее 50 МБ; минимум пикселей 50 x 50 пикселей; максимум пикселей 10 000 x 10 000 пикселей.
Извлечение данных модели квитанций
Узнайте, как аналитика документов извлекает данные, включая время и дату транзакций, сведения о продавце и суммы из квитанций. Вам потребуются следующие ресурсы:
Подписка Azure — ее можно создать бесплатно.
Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (
F0
), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.
Примечание.
Document Intelligence Studio доступна с API версии 3.1 и версии 3.0 и более поздними версиями.
На домашней странице Document Intelligence Studio выберите "Квитанции".
Вы можете проанализировать пример квитанции или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:
Средство разработки меток аналитики документов
Перейдите к инструменту аналитики документов.
На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .
Выберите тип формы для анализа из раскрывающегося меню.
Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:
В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.
В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.
В поле ключа вставьте ключ, полученный из ресурса аналитики документов.
Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.
Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.
Примечание.
Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.
Поддерживаемые языки и языковые стандарты
Полный список поддерживаемых языков см. на странице поддержки языка предварительно созданных моделей.
Извлечение полей
Имя. | Тип | Описание | Стандартизованные выходные данные |
---|---|---|---|
ReceiptType | Строка | Тип уведомления о продажах | Itemized |
MerchantName | Строка | Имя продавца, выдавшего квитанцию | |
MerchantPhoneNumber | phoneNumber | Указанные номера телефонов продавца | +1 xxx xxx xxxx |
MerchantAddress | Строка | Указанный адрес продавца | |
TransactionDate | Дата | Дата выдачи квитанции | гггг-мм-дд |
TransactionTime | Время | Время выдачи квитанции | чч-мм-сс (24 часа) |
Итог | Число (долл. США) | Полная сумма транзакции по квитанции | Число с плавающей точкой и двумя десятичными знаками |
Промежуточный итог | Число (долл. США) | Промежуточная сумма квитанции, часто перед вычетом налогов | Число с плавающей точкой и двумя десятичными знаками |
Налоги | Число (долл. США) | Общий налог на получение (часто налог на продажу или эквивалентный). Переименовано в TotalTax в версии 2022-06-30. | Число с плавающей точкой и двумя десятичными знаками |
Совет | Число (долл. США) | Чаевые покупателя | Число с плавающей точкой и двумя десятичными знаками |
Товаров | Массив объектов | Извлеченные позиции с именем, количеством, ценой за единицу и общей ценой | |
Имя. | Строка | Описание элемента. Переименовано в Description в версии 2022-06-30. | |
Количество | Число | Количество по каждой позиции | Число с плавающей точкой и двумя десятичными знаками |
Цена, | Число | Отдельная цена за единицу по каждой позиции | Число с плавающей точкой и двумя десятичными знаками |
Общая стоимость | Число | Общая цена позиции | Число с плавающей точкой и двумя десятичными знаками |
Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели квитанций в нашем примере репозитория GitHub.
Руководство по миграции и REST API версии 3.1
- Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию 3.1 в приложениях и рабочих процессах.
Следующие шаги
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.