Новые возможности аналитики документов Azure

Это содержимое относится к:checkmarkверсии 4.0 (GA)checkmarkверсии 3.1 (GA)checkmarkверсии 3.0 (GA)checkmarkверсии 2.1 (GA)

Служба аналитики документов обновляется на постоянной основе. Добавьте эту страницу в закладки, чтобы быть в курсе заметок о выпуске, усовершенствований функций и новой документации.

Важно

Предварительная версия API будет прекращена к 06.30.2026, а API версии 3.0 2022-08-31 (GA) будет прекращена к 03.30.2029. Если вы по-прежнему используете API предварительной версии или связанные версии пакета SDK, обновите код, чтобы нацелиться на последнюю версию 2024-11-30 (GA)API.

Март 2026 г.

Обновленные предварительно созданные модели налоговой формы

Предварительно созданные модели для налоговых форм США были обновлены для поддержки налоговых форм 2025 года. Улучшено качество моделей для более эффективного извлечения информации из документов с несколькими копиями (например, несколько форм W-2 или 1099 в одном документе). Теперь вы можете извлечь данные из многоформовых заявок в одном запросе и получить более комплексное покрытие полей.

Июнь 2025 г.

Теперь доступен контейнер "Аналитика документов" версии 4.0 для чтения!
Этот образ контейнера включает востребованные функции чтения, такие как возможность поиска в PDF-файлах! Дополнительные сведения см. в следующем разделе:

Апрель 2025 г.

Теперь доступен контейнер макета Document Intelligence версии 4.0!
Дополнительные сведения см. в следующем разделе:

Декабрь 2024 г.

Теперь пакеты SDK для языка программирования Document Intelligence версии 4.0 доступны в общедоступной версии (GA).

Последние клиентские библиотеки по умолчанию используют версию службы REST API 2024-11-30 (GA).

Дополнительные сведения см. в клиентских библиотеках для следующих поддерживаемых языков программирования:

Ноябрь 2024 г.

REST API аналитики документов версии 4.0: 2024-11-30 REST API (GA) теперь общедоступен (GA)! REST API версии 4.0 включает следующие изменения:

  • Batch API

    • Batch API теперь поддерживает все модели, включая все модели чтения, макеты, предсозданные вертикали и пользовательские модели.
    • Пакетный API поддерживает функцию LIST, чтобы пользователи могли перечислять пакетные задания за последние семь дней.
    • Пакетный API поддерживает функцию DELETE для явного удаления пакетной задачи для соблюдения требований GDPR и сохранения конфиденциальности.
    • GetAnalyzeBatchResult поддерживает resultId в ответ на перечисление всех resultIds.
  • Доступный для поиска PDF-файл. Предварительно созданная модель чтения теперь поддерживает форматы изображений (JPEG/JPG, PNG, BMP, TIFF, HEIF) и расширение языка, включая китайский, японский и корейский для выходных данных PDF.

  • Пользовательская модель классификации

    • Пользовательская модель классификации поддерживает добавочное обучение. Вы можете добавить новые примеры в существующие классы или добавить новые классы, ссылаясь на существующий классификатор.
    • При использовании версии 4.0 пользовательская модель классификации не разделяет документы по умолчанию во время анализа. Чтобы сохранить старое поведение, необходимо явно задать свойство splitMode значением auto.
    • Пользовательская модель классификации теперь поддерживает до 25 000 страниц, устанавливая новое ограничение на количество страниц для обучения.
  • Пользовательская нейронная модель

    • Настраиваемая нейронная модель теперь поддерживает обнаружение подписей.
    • Пользовательские нейронные модели позволяют проводить платное обучение в течение длительного времени, когда необходимо обучить модель с большим размеченным набором данных. Первые 20 обучающих запусков в календарном месяце продолжают быть бесплатными. Все операции обучения, превышающие 20, находятся на платном уровне. Дополнительные сведения о выставлении счетов.
  • Модель выписки банка США

    • Модель банковской выписки США теперь поддерживает извлечение таблиц с чеками.
  • Проверка модели

    • Поддерживает извлечение подписи плательщика
  • Модель ипотечных документов

    • Модель ипотеки теперь поддерживает обнаружение подписей для форм 1003, 1004, 1005 и заключительного раскрытия информации.
  • Модель квитанций

    • Модель квитанций теперь поддерживает больше полей, включая ReceiptType, налоговую ставку, CountryRegion, чистую сумму и описание.
  • Налоговая модель США

    • Новые предварительно созданные налоговые модели, добавленные для 1095A, 1095Cи 1099SSAW4.
  • Удаление ответа на анализ

    • Ответ анализа хранится в течение 24 часов после завершения операции, чтобы можно было его извлечь. В сценариях, когда вы хотите удалить ответ раньше, используйте API анализа ответов для удаления ответа.
  • API версии 4.0 включает накопительные обновления из предварительных выпусков, как указано ниже.

Август 2024 г.

Теперь доступен REST API аналитики документов 2024-07-31-preview . Этот API предварительной версии предоставляет новые и обновленные возможности:

  • Общедоступная предварительная версия 2024-07-31-preview сейчас доступна только в следующих регионах Azure. Новая модель извлечения полей документа в портале Microsoft Foundry доступна только в Северно-Центральном регионе США.

  • Восточная часть США

  • Западная часть США2

  • Западная Европа

  • Северная часть США

  • Составление модели с пользовательскими классификаторами

    • Аналитика документов теперь добавляет поддержку создания модели с явной пользовательской моделью классификации. Узнайте больше о преимуществах использования новой возможности компоновки.
  • Пользовательская модель классификации

    • Пользовательская модель классификации теперь поддерживает обновление модели на месте.
    • Пользовательская модель классификации добавляет возможность копирования моделей для обеспечения резервного копирования и аварийного восстановления.
    • Пользовательская модель классификации теперь поддерживает возможность явного указания страниц для классификации из входного документа.
  • Модель ипотечных документов

    • Извлечение информации из оценки (форма 1004).
    • Извлеките сведения из проверки занятости (форма 1005).
  • Проверка модели

    • Извлечение получателя платежа, суммы, даты и других соответствующих сведений из чеков.
  • Модель заглушки оплаты

    • Преднастроенные модули для обработки платёжных ведомостей, чтобы извлекать информацию о заработной плате, количестве часов, вычетах, чистой зарплате и многом другом.
  • Модель выписки из банка

    • Новый готовый инструмент для извлечения сведений о счете, включая начальные и конечные остатки, детали транзакций из банковских выписок.
  • Налоговая модель США

    • Новая единая налоговая модель США, которая может извлекать из форм, таких как W-2, 1098, 1099 и 1040.
  • Доступный для поиска PDF-файл. Предварительно созданная модель чтения теперь поддерживает выходные данные PDF для скачивания PDF-файлов с внедренным текстом из результатов извлечения, что позволяет использовать PDF в таких сценариях, как копия содержимого поиска.

  • Модель макета теперь поддерживает улучшенное обнаружение фигур, где фигуры из документов теперь можно скачать в виде файла изображения, который будет использоваться для дальнейшего понимания рисунков. Модель макета также содержит улучшения модели OCR для улучшения отсканированного текста для отдельных символов, обведенного текста и плотных текстовых документов.

  • Batch API

    • Аналитика документов теперь добавляет поддержку пакетного анализа для поддержки анализа набора документов для упрощения работы разработчика и повышения эффективности.
  • Возможности надстройки

    • Поля запроса Качество извлечения ИИ улучшается с помощью последней модели.

Май 2024 г.

Служба Document Intelligence Studio добавляет поддержку проверки подлинности Microsoft Entra (ранее Azure Active Directory). Дополнительные сведения см. в разделе"Проверка подлинности" в Studio Document Intelligence.

Февраль 2024 г.

Теперь доступен REST API аналитики документов 2024-07-31-preview . Этот API предварительной версии предоставляет новые и обновленные возможности:

  • Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure:

    • Восточная часть США
    • Западная часть США2
    • Западная Европа
  • Модель макета теперь поддерживает обнаружение фигур и анализ структуры иерархических документов (разделы и подразделы). Улучшено качество работы ИИ по определению порядка чтения и логических ролей.

  • Пользовательские модели извлечения

    • Пользовательские модели извлечения теперь поддерживают оценки достоверности ячеек, строк и таблиц. Дополнительные сведения о таблице, строке и достоверности ячеек.
    • Пользовательские модели извлечения имеют улучшенные возможности ИИ для извлечения полей.
    • Пользовательская модель извлечения шаблонов теперь поддерживает извлечение перекрывающихся полей. Узнайте больше о перекрывающихся полях и их использовании.
  • Пользовательская модель классификации

    • Пользовательская модель классификации теперь поддерживает добавочное обучение для сценариев, где необходимо обновить модель классификатора с добавленными примерами или классами. Дополнительные сведения о добавочном обучении.
    • Пользовательская модель классификации добавляет поддержку типов документов Office (.docx, .pptxи .xls). Дополнительные сведения о поддержке расширенного типа документа.
  • Модель счета

    • Поддержка новых локалей
    Локаль Код
    Арабский (ar)
    Болгарский (bg)
    Греческий (el)
    Иврит (he)
    Македонец (mk)
    Русский (ru) Сербская кириллица (sr-cyrl)
    Украинский (uk)
    Тайский (th)
    Турецкий (tr)
    Вьетнамский (vi)
    • Поддержка новых кодов валют:
    Валюты Локаль Код
    BAM Боснийская конвертируемая марка (ba)
    BGN Болгарский Лев (bg)
    ILS Израильский Новый Шекель (il)
    MKD Македонский Денар (mk)
    RUB Российский рубль (ru)
    THB Тайский Бат (th)
    TRY Турецкая Лира (tr)
    UAH Украинская гривна (ua)
    VND Вьетнамский Донг (vn)
    • Налоговые элементы поддерживают расширение для Германии (de), Испании (es), Португалии (pt), Английской Канадыen-CA.
  • Модель идентификатора

  • Ипотечные документы

    • Извлеките сведения из типовой заявки на жилищный заем (форма 1003).
    • Извлеките сведения из унифицированного резюме андеррайтинга и передачи или формы 1008.
    • Извлеките информацию из раскрытия ипотечных кредитов.
  • Модель кредитной и дебетовой карты

    • Извлечение сведений из банковских карт.
  • Свидетельство о браке

    • Новая предварительно созданная для извлечения информации из сертификатов о браке.

Декабрь 2023 г.

Клиентские библиотеки аналитики документов, предназначенные для REST API 2023-10-31-preview, теперь доступны для использования!

Ноябрь 2023 г.

Теперь доступен REST API аналитики документов 2023-10-31-preview . Этот API предварительной версии предоставляет новые и обновленные возможности:

  • Общедоступная предварительная версия 2023-10-31-preview в настоящее время доступна только в следующих регионах Azure:

    • Восточная часть США
    • Западная часть США2
    • Западная Европа
  • Модель чтения данных

    • Расширение языка для рукописного ввода: русский(), арабский(ruar), тайский(th).
    • Соблюдение кибер-указа президента (EO).
  • Модель макета

    • Поддержка Office и HTML-файлов.
    • Поддержка выходных данных Markdown.
    • Улучшения извлечения данных из таблиц, порядка чтения и обнаружения заголовков секций.
    • В версии Document Intelligence 2023-10-31-preview общая модель документа (предварительно созданная модель документа) признана устаревшей. Чтобы извлечь пары "ключ-значение" из документов, используйте модель prebuilt-layout и включите необязательный параметр строки запроса features=keyValuePairs.
  • Модель получения

    • Теперь извлекает валюту для всех полей, связанных с ценами.
  • Модель карты медицинского страхования

    • Новая поддержка полей для сведений Medicare и Medicaid.
  • Модели налогового документа США

    • Новая налоговая модель 1099. Поддерживает базовую форму 1099 и следующие варианты: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, R, S, SA, SB.
  • Модель счета

    • KVK Поддержка поля.
    • BPAY Поддержка поля.
    • Многочисленные уточнения полей.
  • Настраиваемая классификация

    • Поддержка многоязычных документов.
    • Новые параметры разделения страниц: автоматическое разделение, всегда разделять по страницам, без разделения.
  • Возможности надстройки

Примечание

При релизе общей доступности 2022-08-31 API завершается поддержка связанного предварительного API. Если вы используете версии API 2021-09-30-preview, 2022-01-30-preview или 2022-06-30-preview API, обновите приложения для целевой 2022-08-31 версии API. Внесены некоторые незначительные изменения, для получения дополнительной информации см.руководство по миграции.