Переход с предварительной версии Azure Content Understanding на общее использование (GA)

Замечание

Версии 2024-12-01-preview API для распознавания содержимого и 2025-05-01-preview в настоящее время находятся в общедоступной предварительной версии. Эти предварительные просмотры предоставляются без соглашения об уровне обслуживания, и их не рекомендуется использовать для производственных нагрузок. Дополнительные сведения см. в разделе Supplemental Terms of Use for Microsoft Azure Previews и Microsoft Products and Services Data Protection Addendum (DPA).

API распознавания содержимого Azure достигло общедоступной версии. В ней представлено несколько новых возможностей и обновлений функций, выпущенных в более ранних версиях API предварительной версии. Что нового страница содержит общие сведения обо всех изменениях в версии GA API "Распознавание содержимого" 2025-11-01.

В этой статье рассматриваются изменения, необходимые для переноса анализаторов и приложений, созданных с помощью одной из версий API предварительной версии (2024-12-01 preview и 2025-05-01 preview).

Предпосылки

Настройте модели развертывания по умолчанию для ресурса Content Understanding. По умолчанию вы создаете подключение к моделям Microsoft Foundry, используемым для запросов на распознавание контента. Выберите для этого один из следующих методов:

Портал
REST API

Перейдите на страницу параметров распознавания содержимого.
Нажмите кнопку +Добавить ресурс в левом верхнем углу.
Выберите ресурс Foundry, который вы хотите использовать, и нажмите кнопку "Далее>сохранить".

Убедитесь, что установлен флажок Включить автоматическое развертывание для обязательных моделей, если доступных значений по умолчанию нет. Этот выбор гарантирует, что ресурс полностью настроен с необходимыми моделями GPT-4.1, GPT-4.1-mini и text-embedding-3-large. Для различных предварительно созданных анализаторов требуются разные модели.

Выполнив эти действия, вы настроите подключение между моделями Content Understanding и Foundry в ресурсе Foundry.

В вашем ресурсе Foundry создайте развертывания моделей Foundry для моделей GPT-4.1, GPT-4.1-mini и text-embedding-3-large. Дополнительные сведения о развертывании этих моделей см. в статье Создание развертываний моделей на портале Microsoft Foundry. Для разных предварительно созданных анализаторов требуются разные модели, поэтому необходимо развернуть все три модели.
Определите развертывания модели по умолчанию на уровне ресурсов. Перед выполнением следующей cURL команды внесите следующие изменения в HTTP-запрос:
1. Замените {endpoint} и {key} на соответствующие значения из вашего экземпляра Foundry в портале Azure.
2. Замените {myGPT41Deployment}, {myGPT41MiniDeployment} и {myEmbeddingDeployment} вашими фактическими именами развертывания модели из вашего ресурса Foundry.
```
curl -i -X PATCH "{endpoint}/contentunderstanding/defaults?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "modelDeployments": {
          "gpt-4.1": "{myGPT41Deployment}",
          "gpt-4.1-mini": "{myGPT41MiniDeployment}",
          "text-embedding-3-large": "{myEmbeddingDeployment}"
        }
      }'
```

Обновление анализаторов

Чтобы обновить существующие анализаторы, рекомендуется выполнить этот трехэтапный процесс.

Шаг 1. Получение определения анализатора

Получите определение анализатора путем вызова:

GET /analyzers/{analyzerName}

Определение анализатора может выглядеть так, если он был создан с помощью 2025-05-01-preview API.

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-documentSearch",
  "config": {
    /*...*/
  },
  "fieldSchema": {/*...*/}
}

Шаг 2. Обновление определения анализатора для API общедоступной версии

Внесите следующие изменения, чтобы анализатор работал с GA API.

Добавьте или обновите baseAnalyzerId свойство на верхнем уровне определения анализатора и задайте для него одно из поддерживаемых значений: prebuilt-document, , prebuilt-audioprebuilt-videoили prebuilt-image. Выберите тот, который соответствует файлам, которые планируется обработать с помощью этого анализатора. Свойство Scenario из предварительного выпуска устарело.
models Добавьте объект и укажите модель завершения и внедрения. Этот объект задает созданные по умолчанию модели, используемые этим анализатором.

Например, схема из шага 1 обновляется следующим образом:

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    /*...*/
  },
  "fieldSchema": {/*...*/},
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

Подсказка

Чтобы соответствовать поведению предварительного просмотра более точно, используйте развертывание GPT-4o 2024-08-06. Для новых анализаторов рекомендуется использовать GPT-4.1 для распознавания содержимого.

Шаг 3. Создание анализатора

Для создания нового анализатора можно использовать обновленное определение:

PUT /analyzers/{analyzerName}_updated

Чтобы повторно использовать имя, необходимо удалить существующий анализатор.

Рассмотрите эти другие изменения API

Классификаторы содержимого и сегментация видео теперь объединяются в анализаторы содержимого. Чтобы сегментировать и классифицировать содержимое, используйте contentCategories свойства анализатора. Смотрите Создание решения для автоматизации роботизированных процессов (RPA) и Сегментация видео для получения рекомендаций.
Доверие и заземление теперь являются необязательными свойствами для полей. Определение поля по умолчанию не возвращает достоверность и обоснование. Чтобы добавить уверенность и заземление, установите значение estimateFieldSourceAndConfidencetrue. Это поведение не отличается от 2025-05-01-preview API.
Запрос на получение определенных analyze компонентов результата упрощен. Чтобы получить внедренные изображения или содержимое, вызовите:
```
GET /analyzerResults/{operationId}/files/{path}
```
Здесь path может включать:
- contents/{contentIndex}/pages/{pageNumber} - DocumentContent.pages[*].pageNumber
- contents/{contentIndex}/figures/{figureId} - DocumentContent.figures[*].id
Теперь операция analyze поддерживает только анализ файлов по URL-адресу. Используйте новую analyzeBinary операцию для загрузки файлов в тело запроса в виде строки в кодировке Base64. Если ранее вы использовали операцию analyze для загрузки файлов напрямую в код, вам необходимо обновить код, чтобы вместо этого использовать операцию analyzeBinary. Дополнительные сведения об analyzeBinary операции.
Обновлена схема JSON полезных данных операции analyze. Теперь есть массив входных данных, содержащий сведения о файле для анализа. Каждый входной элемент содержит указатель URL-адреса на файл. Дополнительные сведения об analyze операции.

Замечание

Массив входных данных поддерживает только один элемент в 2025-11-01 версии.

Ниже приведен пример обновленной схемы для PUT /analyzers/{analyzerName}:
```
{
      "inputs":[
      {
        "url": "https://documentintelligence.ai.azure.com/documents/samples/read/read-healthcare.png" /*This is the file to be analyzed*/
      }
      ]
}
```
Если вы использовали обучение с учителем или помеченные данные, нагрузка API, определяющая набор данных с метками, теперь указывает данные как тип knowledgeSources. Дополнительные сведения см. в разделе "Создание или замена".
Для видеоанализаторов ключевые кадры теперь возвращаются в виде массива keyFrames. Дополнительные сведения см. в разделе "Анализ".

Новые возможности

Метод извлечения полей необязателен. Если метод не задан, анализатор определяет подход (extract или generate). Не добавляйте свойство method, если не требуется значение, извлеченное дословно.
Добавлена поддержка оценки достоверности и привязки к источнику полей в анализаторах документов, в которых метод установлен для генерации.
Теперь в анализаторе количество полей увеличивается до 1000 полей.
Для документов классификация и сегментация поддерживают до 200 различных типов.

Устаревшие функции

API GA не включает режим Pro, который по-прежнему находится в предварительном просмотре (2025-05-01-preview). В результате AnalysisMode устаревает, и единственный поддерживаемый режим — стандартный в API в статусе Общедоступности.
Каталог пользователей и API распознавания лиц не являются частью API-интерфейсов общедоступной версии, включая функции видеоанализатора для обнаружения и распознавания лиц в видео.
Эта TrainingData функция устарела и заменена функцией knowledgeSources .

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-04-30