Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Замечание
Версии 2024-12-01-preview API для распознавания содержимого и 2025-05-01-preview в настоящее время находятся в общедоступной предварительной версии. Эти предварительные просмотры предоставляются без соглашения об уровне обслуживания, и их не рекомендуется использовать для производственных нагрузок. Дополнительные сведения см. в разделе Supplemental Terms of Use for Microsoft Azure Previews и Microsoft Products and Services Data Protection Addendum (DPA).
API распознавания содержимого Azure достигло общедоступной версии. В ней представлено несколько новых возможностей и обновлений функций, выпущенных в более ранних версиях API предварительной версии.
Что нового страница содержит общие сведения обо всех изменениях в версии GA API "Распознавание содержимого" 2025-11-01.
В этой статье рассматриваются изменения, необходимые для переноса анализаторов и приложений, созданных с помощью одной из версий API предварительной версии (2024-12-01 preview и 2025-05-01 preview).
Предпосылки
Настройте модели развертывания по умолчанию для ресурса Content Understanding. По умолчанию вы создаете подключение к моделям Microsoft Foundry, используемым для запросов на распознавание контента. Выберите для этого один из следующих методов:
Перейдите на страницу параметров распознавания содержимого.
Нажмите кнопку +Добавить ресурс в левом верхнем углу.
Выберите ресурс Foundry, который вы хотите использовать, и нажмите кнопку "Далее>сохранить".
Убедитесь, что установлен флажок Включить автоматическое развертывание для обязательных моделей, если доступных значений по умолчанию нет. Этот выбор гарантирует, что ресурс полностью настроен с необходимыми моделями
GPT-4.1,GPT-4.1-miniиtext-embedding-3-large. Для различных предварительно созданных анализаторов требуются разные модели.
Выполнив эти действия, вы настроите подключение между моделями Content Understanding и Foundry в ресурсе Foundry.
Обновление анализаторов
Чтобы обновить существующие анализаторы, рекомендуется выполнить этот трехэтапный процесс.
Шаг 1. Получение определения анализатора
Получите определение анализатора путем вызова:
GET /analyzers/{analyzerName}
Определение анализатора может выглядеть так, если он был создан с помощью 2025-05-01-preview API.
{
"analyzerId": "my-custom-invoice-analyzer",
"description": "Extracts vendor information, line items, and totals from commercial invoices",
"baseAnalyzerId": "prebuilt-documentSearch",
"config": {
/*...*/
},
"fieldSchema": {/*...*/}
}
Шаг 2. Обновление определения анализатора для API общедоступной версии
Внесите следующие изменения, чтобы анализатор работал с GA API.
Добавьте или обновите
baseAnalyzerIdсвойство на верхнем уровне определения анализатора и задайте для него одно из поддерживаемых значений:prebuilt-document, ,prebuilt-audioprebuilt-videoилиprebuilt-image. Выберите тот, который соответствует файлам, которые планируется обработать с помощью этого анализатора. СвойствоScenarioиз предварительного выпуска устарело.modelsДобавьте объект и укажите модель завершения и внедрения. Этот объект задает созданные по умолчанию модели, используемые этим анализатором.
Например, схема из шага 1 обновляется следующим образом:
{
"analyzerId": "my-custom-invoice-analyzer",
"description": "Extracts vendor information, line items, and totals from commercial invoices",
"baseAnalyzerId": "prebuilt-document",
"config": {
/*...*/
},
"fieldSchema": {/*...*/},
"models": {
"completion": "gpt-4.1",
"embedding": "text-embedding-3-large"
}
}
Подсказка
Чтобы соответствовать поведению предварительного просмотра более точно, используйте развертывание GPT-4o 2024-08-06. Для новых анализаторов рекомендуется использовать GPT-4.1 для распознавания содержимого.
Шаг 3. Создание анализатора
Для создания нового анализатора можно использовать обновленное определение:
PUT /analyzers/{analyzerName}_updated
Чтобы повторно использовать имя, необходимо удалить существующий анализатор.
Рассмотрите эти другие изменения API
Классификаторы содержимого и сегментация видео теперь объединяются в анализаторы содержимого. Чтобы сегментировать и классифицировать содержимое, используйте
contentCategoriesсвойства анализатора. Смотрите Создание решения для автоматизации роботизированных процессов (RPA) и Сегментация видео для получения рекомендаций.Доверие и заземление теперь являются необязательными свойствами для полей. Определение поля по умолчанию не возвращает достоверность и обоснование. Чтобы добавить уверенность и заземление, установите значение
estimateFieldSourceAndConfidencetrue. Это поведение не отличается от2025-05-01-previewAPI.Запрос на получение определенных
analyzeкомпонентов результата упрощен. Чтобы получить внедренные изображения или содержимое, вызовите:GET /analyzerResults/{operationId}/files/{path}Здесь
pathможет включать:contents/{contentIndex}/pages/{pageNumber}-DocumentContent.pages[*].pageNumbercontents/{contentIndex}/figures/{figureId}-DocumentContent.figures[*].id
Теперь операция
analyzeподдерживает только анализ файлов по URL-адресу. Используйте новуюanalyzeBinaryоперацию для загрузки файлов в тело запроса в виде строки в кодировке Base64. Если ранее вы использовали операциюanalyzeдля загрузки файлов напрямую в код, вам необходимо обновить код, чтобы вместо этого использовать операциюanalyzeBinary. Дополнительные сведения обanalyzeBinaryоперации.Обновлена схема JSON полезных данных операции
analyze. Теперь есть массив входных данных, содержащий сведения о файле для анализа. Каждый входной элемент содержит указатель URL-адреса на файл. Дополнительные сведения обanalyzeоперации.Замечание
Массив входных данных поддерживает только один элемент в
2025-11-01версии.Ниже приведен пример обновленной схемы для
PUT /analyzers/{analyzerName}:{ "inputs":[ { "url": "https://documentintelligence.ai.azure.com/documents/samples/read/read-healthcare.png" /*This is the file to be analyzed*/ } ] }Если вы использовали обучение с учителем или помеченные данные, нагрузка API, определяющая набор данных с метками, теперь указывает данные как тип
knowledgeSources. Дополнительные сведения см. в разделе "Создание или замена".Для видеоанализаторов ключевые кадры теперь возвращаются в виде массива
keyFrames. Дополнительные сведения см. в разделе "Анализ".
Новые возможности
- Метод извлечения полей необязателен. Если метод не задан, анализатор определяет подход (
extractилиgenerate). Не добавляйте свойствоmethod, если не требуется значение, извлеченное дословно. - Добавлена поддержка оценки достоверности и привязки к источнику полей в анализаторах документов, в которых метод установлен для генерации.
- Теперь в анализаторе количество полей увеличивается до 1000 полей.
- Для документов классификация и сегментация поддерживают до 200 различных типов.
Устаревшие функции
- API GA не включает режим Pro, который по-прежнему находится в предварительном просмотре (
2025-05-01-preview). В результатеAnalysisModeустаревает, и единственный поддерживаемый режим — стандартный в API в статусе Общедоступности. - Каталог пользователей и API распознавания лиц не являются частью API-интерфейсов общедоступной версии, включая функции видеоанализатора для обнаружения и распознавания лиц в видео.
- Эта
TrainingDataфункция устарела и заменена функциейknowledgeSources.