Переход с предварительной версии Azure Content Understanding на общее использование (GA)

Замечание

Версии 2024-12-01-preview API для распознавания содержимого и 2025-05-01-preview в настоящее время находятся в общедоступной предварительной версии. Эти предварительные просмотры предоставляются без соглашения об уровне обслуживания, и их не рекомендуется использовать для производственных нагрузок. Дополнительные сведения см. в разделе Supplemental Terms of Use for Microsoft Azure Previews и Microsoft Products and Services Data Protection Addendum (DPA).

API распознавания содержимого Azure достигло общедоступной версии. В ней представлено несколько новых возможностей и обновлений функций, выпущенных в более ранних версиях API предварительной версии. Что нового страница содержит общие сведения обо всех изменениях в версии GA API "Распознавание содержимого" 2025-11-01.

В этой статье рассматриваются изменения, необходимые для переноса анализаторов и приложений, созданных с помощью одной из версий API предварительной версии (2024-12-01 preview и 2025-05-01 preview).

Предпосылки

Настройте модели развертывания по умолчанию для ресурса Content Understanding. По умолчанию вы создаете подключение к моделям Microsoft Foundry, используемым для запросов на распознавание контента. Выберите для этого один из следующих методов:

  1. Перейдите на страницу параметров распознавания содержимого.

  2. Нажмите кнопку +Добавить ресурс в левом верхнем углу.

  3. Выберите ресурс Foundry, который вы хотите использовать, и нажмите кнопку "Далее>сохранить".

    Убедитесь, что установлен флажок Включить автоматическое развертывание для обязательных моделей, если доступных значений по умолчанию нет. Этот выбор гарантирует, что ресурс полностью настроен с необходимыми моделями GPT-4.1, GPT-4.1-mini и text-embedding-3-large. Для различных предварительно созданных анализаторов требуются разные модели.

Выполнив эти действия, вы настроите подключение между моделями Content Understanding и Foundry в ресурсе Foundry.

Обновление анализаторов

Чтобы обновить существующие анализаторы, рекомендуется выполнить этот трехэтапный процесс.

Шаг 1. Получение определения анализатора

Получите определение анализатора путем вызова:

GET /analyzers/{analyzerName}

Определение анализатора может выглядеть так, если он был создан с помощью 2025-05-01-preview API.

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-documentSearch",
  "config": {
    /*...*/
  },
  "fieldSchema": {/*...*/}
}

Шаг 2. Обновление определения анализатора для API общедоступной версии

Внесите следующие изменения, чтобы анализатор работал с GA API.

  1. Добавьте или обновите baseAnalyzerId свойство на верхнем уровне определения анализатора и задайте для него одно из поддерживаемых значений: prebuilt-document, , prebuilt-audioprebuilt-videoили prebuilt-image. Выберите тот, который соответствует файлам, которые планируется обработать с помощью этого анализатора. Свойство Scenario из предварительного выпуска устарело.

  2. models Добавьте объект и укажите модель завершения и внедрения. Этот объект задает созданные по умолчанию модели, используемые этим анализатором.

Например, схема из шага 1 обновляется следующим образом:

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    /*...*/
  },
  "fieldSchema": {/*...*/},
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

Подсказка

Чтобы соответствовать поведению предварительного просмотра более точно, используйте развертывание GPT-4o 2024-08-06. Для новых анализаторов рекомендуется использовать GPT-4.1 для распознавания содержимого.

Шаг 3. Создание анализатора

Для создания нового анализатора можно использовать обновленное определение:

PUT /analyzers/{analyzerName}_updated

Чтобы повторно использовать имя, необходимо удалить существующий анализатор.

Рассмотрите эти другие изменения API

  • Классификаторы содержимого и сегментация видео теперь объединяются в анализаторы содержимого. Чтобы сегментировать и классифицировать содержимое, используйте contentCategories свойства анализатора. Смотрите Создание решения для автоматизации роботизированных процессов (RPA) и Сегментация видео для получения рекомендаций.

  • Доверие и заземление теперь являются необязательными свойствами для полей. Определение поля по умолчанию не возвращает достоверность и обоснование. Чтобы добавить уверенность и заземление, установите значение estimateFieldSourceAndConfidencetrue. Это поведение не отличается от 2025-05-01-preview API.

  • Запрос на получение определенных analyze компонентов результата упрощен. Чтобы получить внедренные изображения или содержимое, вызовите:

    GET /analyzerResults/{operationId}/files/{path}
    

    Здесь path может включать:

    • contents/{contentIndex}/pages/{pageNumber} - DocumentContent.pages[*].pageNumber
    • contents/{contentIndex}/figures/{figureId} - DocumentContent.figures[*].id
  • Теперь операция analyze поддерживает только анализ файлов по URL-адресу. Используйте новую analyzeBinary операцию для загрузки файлов в тело запроса в виде строки в кодировке Base64. Если ранее вы использовали операцию analyze для загрузки файлов напрямую в код, вам необходимо обновить код, чтобы вместо этого использовать операцию analyzeBinary. Дополнительные сведения об analyzeBinary операции.

  • Обновлена схема JSON полезных данных операции analyze. Теперь есть массив входных данных, содержащий сведения о файле для анализа. Каждый входной элемент содержит указатель URL-адреса на файл. Дополнительные сведения об analyze операции.

    Замечание

    Массив входных данных поддерживает только один элемент в 2025-11-01 версии.

    Ниже приведен пример обновленной схемы для PUT /analyzers/{analyzerName}:

    
    {
          "inputs":[
          {
            "url": "https://documentintelligence.ai.azure.com/documents/samples/read/read-healthcare.png" /*This is the file to be analyzed*/
          }
          ]
    }
    
  • Если вы использовали обучение с учителем или помеченные данные, нагрузка API, определяющая набор данных с метками, теперь указывает данные как тип knowledgeSources. Дополнительные сведения см. в разделе "Создание или замена".

  • Для видеоанализаторов ключевые кадры теперь возвращаются в виде массива keyFrames. Дополнительные сведения см. в разделе "Анализ".

Новые возможности

  • Метод извлечения полей необязателен. Если метод не задан, анализатор определяет подход (extract или generate). Не добавляйте свойство method, если не требуется значение, извлеченное дословно.
  • Добавлена поддержка оценки достоверности и привязки к источнику полей в анализаторах документов, в которых метод установлен для генерации.
  • Теперь в анализаторе количество полей увеличивается до 1000 полей.
  • Для документов классификация и сегментация поддерживают до 200 различных типов.

Устаревшие функции

  • API GA не включает режим Pro, который по-прежнему находится в предварительном просмотре (2025-05-01-preview). В результате AnalysisMode устаревает, и единственный поддерживаемый режим — стандартный в API в статусе Общедоступности.
  • Каталог пользователей и API распознавания лиц не являются частью API-интерфейсов общедоступной версии, включая функции видеоанализатора для обнаружения и распознавания лиц в видео.
  • Эта TrainingData функция устарела и заменена функцией knowledgeSources .