Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Это содержимое относится к:
версии 4.0 (GA) | Предыдущие версии:
версии 3.1 (GA)
версии 3.0 (вывод из эксплуатации)
версии 2.1 (вывод из эксплуатации)
Это содержимое относится к:
версии 3.1 (GA) | Последняя версия:
версии 4.0 (GA) | Предыдущие версии:
версии 3.0
версии 2.1
Это содержимое относится к:
версия 2.1 | Последняя версия:
версия 4.0 (GA)
Модель обработки документов для анализа квитанций объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевой информации из кассовых чеков. Квитанции могут быть различными форматами и качеством, включая печатные и рукописные квитанции. API извлекает ключевые сведения, такие как имя продавца, номер телефона продавца, дата транзакции, налог и сумма транзакций, а также возвращает структурированные данные JSON. Модель квитанций версии 4.0 (GA) поддерживает другие поля, в том числе ReceiptType, TaxDetails.NetAmountTaxDetails.DescriptionTaxDetails.RateиCountryRegion, а также извлечение таблиц НДС по общим квитанциям отеля.
Извлечение данных из квитанции
Оцифровка квитанций включает преобразование различных типов квитанций, включая сканированные, сфотографированные и печатные копии, в цифровой формат для упрощенной обработки нижестоящего потока. Примеры включают управление затратами, анализ поведения потребителей, автоматизацию налогов и т. д. Использование технологии аналитики документов с OCR (оптическое распознавание символов) может извлекать и интерпретировать данные из этих различных форматов квитанций. Обработка аналитики документов упрощает процесс преобразования, но также значительно сокращает необходимое время и усилия, что упрощает эффективное управление данными и получение.
Пример квитанции, обработанный с помощью Document Intelligence Studio:
Образец квитанции, обработанный с помощью средства разметки данных аналитики документов:
Варианты разработки
Аналитика документов версии 4.0: 2024-11-30 (GA) поддерживает следующие средства, приложения и библиотеки:
| Функция | Ресурсы | Идентификатор модели |
|---|---|---|
| Модель получения | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
предварительно созданная квитанция |
Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:
| Функция | Ресурсы | Идентификатор модели |
|---|---|---|
| Модель получения | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
предварительно созданная квитанция |
Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:
| Функция | Ресурсы | Идентификатор модели |
|---|---|---|
| Модель получения | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
предварительно созданная квитанция |
Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:
| Функция | Ресурсы |
|---|---|
| Модель получения | • Средство маркировки документов • REST API • SDK библиотека клиента • Контейнер Docker для разметки документов |
Требования к входным данным
Поддерживаются следующие форматы файлов.
| Модель | Изображение: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Прочитать | ✔ | ✔ | ✔ |
| Макет | ✔ | ✔ | ✔ |
| Общий документ | ✔ | ✔ | |
| Предварительно собранный | ✔ | ✔ | |
| Настраиваемое извлечение | ✔ | ✔ | |
| Настраиваемая классификация | ✔ | ✔ | ✔ |
- Фотографии и сканы: для получения наилучших результатов предоставьте одну четкую фотографию или высококачественный скан на каждый документ.
- PDF и TIFF: для PDF и TIFF можно обрабатывать до 2000 страниц. (С подпиской на бесплатный уровень обрабатываются только первые две страницы.)
- Размер файла: размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
- Размеры изображения: размеры должны находиться в диапазоне от 50 пикселей до 10 000 пикселей x 10 000 пикселей.
- Блокировки паролей. Если pdf-файлы заблокированы паролем, необходимо удалить блокировку перед отправкой.
- Высота текста: минимальная высота извлеченного текста составляет 12 пикселей для изображения 1024 x 768 пикселей. Это измерение соответствует примерно 8-точечному тексту при 150 точках на дюйм.
- Обучение пользовательской модели: максимальное количество страниц для обучающих данных составляет 500 для пользовательской модели шаблона и 50 000 для пользовательской нейронной модели.
- Обучение пользовательской модели извлечения: общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
- Обучение пользовательской модели классификации: общий размер обучающих данных составляет 1 ГБ, не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с максимум 10 000 страниц.
- Типы файлов Office (DOCX, XLSX, PPTX): максимальная длина строки составляет 8 миллионов символов.
- Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
- Поддерживаемая квота на страницы для PDF и TIFF: Аналитика документов может обрабатывать до 2000 страниц для подписчиков уровня "Стандартный" или только первые две страницы для подписчиков бесплатного уровня.
- Поддерживаемый размер файла: менее 50 МБ; минимум пикселей 50 x 50 пикселей; максимум пикселей 10 000 x 10 000 пикселей.
Извлечение данных модели чека
Узнайте, как аналитика документов извлекает данные, включая время и дату транзакций, сведения о продавце и суммы из квитанций. Вам потребуются следующие ресурсы:
Подписка Azure — вы можете создать её бесплатно.
Экземпляр Document Intelligence на портале Microsoft Azure. Вы можете использовать бесплатную ценовую категорию (
F0) для пробной службы. После развертывания ресурса выберите "Перейти к ресурсу" , чтобы получить ключ и конечную точку.
Примечание
Document Intelligence Studio доступна с API версии 3.1 и версии 3.0 и более поздними версиями.
На домашней странице Document Intelligence Studio выберите "Квитанции".
Вы можете проанализировать пример квитанции или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:
Средство разметки образцов для анализа документов
Перейдите к инструменту аналитики документов.
На домашней странице инструмента выберите элемент Использовать предварительно созданную модель для получения данных.
Выберите тип формы для анализа из раскрывающегося меню.
Выберите URL-адрес файла, который вы хотите проанализировать из следующих параметров:
В поле "Источник" выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку "Получить ".
В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.
В поле ключа вставьте ключ, полученный из ресурса аналитики документов.
Выберите "Выполнить анализ". Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.
Просмотрите результаты: пары "ключ-значение", извлеченные элементы строк, выделенный текст и обнаруженные таблицы.
Примечание
Инструмент маркировки образцов не поддерживает формат файла BMP. Это ограничение средства, а не службы аналитики документов.
Поддерживаемые языки и локали
Для получения полного списка поддерживаемых языков см. на странице поддержки языков готовых моделей.
Извлечение полей
Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели receipt в нашем примере репозитория GitHub
| Имя | Тип | Описание | Стандартные выходные данные |
|---|---|---|---|
| Тип квитанции | Строка | Тип квитанции о продажах | Составление по пунктам |
| MerchantName | Строка | Имя продавца, выдавшего квитанцию | |
| НомерТелефонаПродавца | номер телефона | Указанный номер телефона продавца | +1 xxx xxx xxxx |
| АдресТорговца | Строка | Указанный адрес продавца | |
| Дата транзакции | Дата | Дата выдачи квитанции | гггг-мм-дд |
| ВремяТранзакции | Время | Время выдачи квитанции | hh-mm-ss (24-часовой формат) |
| Всего | Число (USD) | Итоговая сумма транзакции на чеке | Число с плавающей запятой с двумя десятичными знаками |
| Промежуточный итог | Число (USD) | Промежуточный итог квитанции, часто перед применением налогов | Десятичное число с двумя знаками после запятой (float) |
| Налог | Число (USD) | Общий налог на получение (часто налог на продажу или эквивалентный). Переименовано в TotalTax в версии 2022-06-30. | Двух десятичный с плавающей запятой |
| Совет | Число (USD) | Чаевые, добавленные покупателем | Число с плавающей запятой с двумя десятичными знаками |
| Элементы | Массив объектов | Извлеченные позиции с именем, количеством, ценой за единицу и общей стоимостью. | |
| Имя | Строка | Описание элемента. Переименовано в Description в версии 2022-06-30. | |
| Количество | Номер | Количество каждого элемента | Число с плавающей запятой с двумя десятичными знаками |
| Цена | Номер | Отдельная цена каждого единицы элемента | Двух десятичный с плавающей запятой |
| ОбщаяЦена | Номер | Общая цена позиции в списке | Двух десятичный с плавающей запятой |
Руководство по миграции и REST API версии 3.1
- Следуйте руководству по миграции с помощью аналитики документов версии 3.1 , чтобы узнать, как использовать версию 3.1 в приложениях и рабочих процессах.
Дальнейшие действия
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Попробуйте обработать собственные формы и документы с помощью средства маркировки образцов для интеллектуального анализа документов.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.