Поделиться через


Модель квитанции аналитики документов

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
  • Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
    • Восточная часть США
    • Западная часть США2
    • Западная Европа
    • Северная часть США

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: флажоксиняя галочка версия 3.1 (GA) версии 3.0 (GA) синяя галочка версии 2.1 (GA) синяя галочка

Это содержимое относится к: версия 3.1 (GA) | Последняя версия: фиолетовый флажокфлажок версия 4.0 (предварительная версия) | Предыдущие версии: синяя галочка версии 3.0синяя галочка версии 2.1

Это содержимое относится к: версия 3.0 (GA) | Последние версии: флажок фиолетовый флажок v4.0 (предварительная версия) фиолетовый флажок версии 3.1 | Предыдущая версия: синяя галочка версия 2.1

Это содержимое относится к: версия 2.1 Последняя версия: флажоксиняя галочка версия 4.0 (предварительная версия) |

Модель квитанции аналитики документов объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевых сведений из квитанций о продажах. Квитанции могут иметь различные форматы и качество, они могут быть не только печатными, но и рукописными. API извлекает ключевые сведения, такие как имя и номер телефона продавца, дата транзакции, налог, итоговая сумма транзакции, и возвращает структурированные данные JSON.

Поддерживаемые типы квитанций:

  • Термический
  • Кредитная карта
  • Gas
  • Парковка
  • Отель
  • сторонними
  • Коммуникации
  • Развлечения
  • Перелет
  • Обучение
  • Аптека или медицинское

Извлечение данных квитанции

Оцифровка квитанций включает преобразование различных типов квитанций, включая сканированные, сфотографированные и печатные копии, в цифровой формат для упрощенной обработки нижестоящего потока. Примеры включают управление затратами, анализ поведения потребителей, автоматизацию налогов и т. д. Использование технологии аналитики документов с OCR (оптическое распознавание символов) может извлекать и интерпретировать данные из этих различных форматов квитанций. Обработка аналитики документов упрощает процесс преобразования, но также значительно сокращает необходимое время и усилия, что упрощает эффективное управление данными и получение.

Пример квитанции, обработанный с помощью Document Intelligence Studio:

Снимок экрана: пример квитанции, обработанный в Студии аналитики документов.

Пример квитанции, обрабатываемый с помощью средства проверки меток аналитики документов:

Снимок экрана: пример квитанции, обработанный с помощью средства маркировки образца формы.

Варианты разработки

Аналитика документов версии 4.0 (2024-07-31-preview) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель получения Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-receipt

Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель получения Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-receipt

Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель получения Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-receipt

Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы
Модель получения Средство
аналитики документов • REST API
пакет SDK
для клиентской библиотеки • Контейнер Docker аналитики документов

Требования к входным данным

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, , BMPPNGTIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Читать
    Макет ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).

  • Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту 8 точки в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1 ГБ не более 10 000 страниц. Для 2024-07-31-preview и более поздних версий общий размер обучающих данных составляет 2 ГБ с максимальным количеством 10 000 страниц.

  • Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
  • Поддерживаемая квота на страницы для PDF и TIFF: Аналитика документов может обрабатывать до 2000 страниц для подписчиков уровня "Стандартный" или только первые две страницы для подписчиков бесплатного уровня.
  • Поддерживаемый размер файла: менее 50 МБ; минимум пикселей 50 x 50 пикселей; максимум пикселей 10 000 x 10 000 пикселей.

Извлечение данных модели квитанций

Узнайте, как аналитика документов извлекает данные, включая время и дату транзакций, сведения о продавце и суммы из квитанций. Вам потребуются следующие ресурсы:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

Примечание.

Document Intelligence Studio доступна с API версии 3.1 и версии 3.0 и более поздними версиями.

  1. На домашней странице Document Intelligence Studio выберите "Квитанции".

  2. Вы можете проанализировать пример квитанции или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Средство разработки меток аналитики документов

  1. Перейдите к инструменту аналитики документов.

  2. На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .

    Снимок экрана: процесс анализа результатов модели макета.

  3. Выберите тип формы для анализа из раскрывающегося меню.

  4. Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:

  5. В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.

    Снимок экрана с раскрывающимся меню расположения источника.

  6. В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.

  7. В поле ключа вставьте ключ, полученный из ресурса аналитики документов.

    Снимок экрана: раскрывающееся меню

  8. Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.

  9. Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.

    Снимок экрана: операция анализа результатов модели макета.

Примечание.

Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.

Поддерживаемые языки и языковые стандарты

Полный список поддерживаемых языков см. на странице поддержки языка предварительно созданных моделей.

Извлечение полей

Имя. Тип Описание Стандартизованные выходные данные
ReceiptType Строка Тип уведомления о продажах Itemized
MerchantName Строка Имя продавца, выдавшего квитанцию
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца +1 xxx xxx xxxx
MerchantAddress Строка Указанный адрес продавца
TransactionDate Дата Дата выдачи квитанции гггг-мм-дд
TransactionTime Время Время выдачи квитанции чч-мм-сс (24 часа)
Итог Число (долл. США) Полная сумма транзакции по квитанции Число с плавающей точкой и двумя десятичными знаками
Промежуточный итог Число (долл. США) Промежуточная сумма квитанции, часто перед вычетом налогов Число с плавающей точкой и двумя десятичными знаками
Налоги Число (долл. США) Общий налог на получение (часто налог на продажу или эквивалентный). Переименовано в TotalTax в версии 2022-06-30. Число с плавающей точкой и двумя десятичными знаками
Совет Число (долл. США) Чаевые покупателя Число с плавающей точкой и двумя десятичными знаками
Товаров Массив объектов Извлеченные позиции с именем, количеством, ценой за единицу и общей ценой
Имя. Строка Описание элемента. Переименовано в Description в версии 2022-06-30.
Количество Число Количество по каждой позиции Число с плавающей точкой и двумя десятичными знаками
Цена, Число Отдельная цена за единицу по каждой позиции Число с плавающей точкой и двумя десятичными знаками
Общая стоимость Число Общая цена позиции Число с плавающей точкой и двумя десятичными знаками

Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели квитанций в нашем примере репозитория GitHub.

Руководство по миграции и REST API версии 3.1

  • Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию 3.1 в приложениях и рабочих процессах.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.