Инструменты понимания содержания Azure в рамках квот и ограничений сервиса Foundry.

Важно

Предварительная версия API 2024-12-01-preview и 2025-05-01-preview будет прекращена к 15 июля 2026 года. Если вы по-прежнему используете API предварительной версии, обновите код, чтобы выбрать последнюю версию 2025-11-01 (GA)API.

Версии 2024-12-01-preview API и 2025-05-01-preview доступны в общедоступной предварительной версии. Эти предварительные версии предоставляются без соглашения об уровне обслуживания и не рекомендуются для производственных рабочих нагрузок. Дополнительные сведения см. в разделе Supplemental Terms of Use for Microsoft Azure Previews и Microsoft Products and Services Data Protection Addendum (DPA).

В этой статье перечислены квоты и ограничения для Azure Content Understanding в составе службы Foundry Tools.

Общие ограничения

Свойство Ограничение
Идентификатор анализатора 1–64 символов. Буквенно-цифровое значение, период и подчеркивание. Узор: [a-zA-Z0-9._]{1,64}
Свойства URL-адреса ≤ 8 192 символов
Свойства описания ≤ 1024 символов
Имена полей ≤ 64 символов. Буквы Unicode, цифры, комбинированные знаки, соединительная пунктуация, точка, дефис и подчеркивание. Узор: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64}
Теги ≤ 10 тегов
Ключ тега ≤ 64 символов. Буквенно-цифровые и + - . : = _ / символы. Узор: [a-zA-Z0-9+-.:=_/]{1,64}
Значение тега ≤ 256 символов. Буквенно-цифровые и + - . : = _ / символы. Может быть пустым. Узор: [a-zA-Z0-9+-.:=_/]{0,256}
Идентификатор ссылки на изображение ≤ 256 символов

Ограничения ресурсов

Квоты Standard (S0)
Анализаторы Max 100,000
Максимальный анализ в минуту 1000 страниц/изображений
Четыре часа звука
Четыре часа видео
Максимальные операции/мин 3,000

Поддерживаемые генеративные модели

Понимание содержимого подключается к моделям Foundry для генеративных возможностей. Служба периодически добавляет поддержку для дополнительных моделей. Дополнительные сведения см. в статье "Подключение анализатора распознавания содержимого к развертываниям модели Foundry".

Поддерживаемые в настоящее время модели:

Тип модели Модель Версия
Завершение чата gpt-5.2 2025-12-11
Завершение чата gpt-4.1 2025-04-14
Завершение чата gpt-4.1-mini 2025-04-14
Завершение чата gpt-4.1-nano 2025-04-14
Внедрение text-embedding-3-small
Внедрение text-embedding-3-large
Внедрение text-embedding-ada-002

Важно

Семейство моделей GPT-4.1 (gpt-4.1, gpt-4.1-mini, ) gpt-4.1-nanoотменяется в октябре 2026 года. Мы рекомендуем выполнить миграцию на gpt-5.2, который обеспечивает расширенные возможности. Для получения полного графика выведения из эксплуатации см. раздел Выведение из эксплуатации моделей Azure OpenAI.

Для получения информации о графике снятия модели с эксплуатации см. раздел Снятие моделей с эксплуатации.

Ограничения входных файлов

Документ и текст

Поддерживаемые типы файлов Размер файла Длина Счетчик извлечения
.pdf
.tiff
.jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic
≤ 200 МБ ≤ 300 страниц Базовый (OCR) или стандартный (макет)
.docx, .xlsx.pptx ≤ 200 МБ ≤ 1M символов Минимальный
.txt
.html, .md.rtf
.eml, .msg
.xml
≤ 1 МБ ≤ 1M символов Минимальный

«Подсчет страниц для нестраничных файлов: для выставления счетов служба "Понимания содержимого" использует правила, эквивалентные страницам: текстовые файлы и файлы электронной почты (TXT, HTML, MD, XML, MSG, EML) считают 3000 символов за одну страницу (округлено). Электронные таблицы (XLSX) считают один лист одной страницей (включая скрытые листы). Презентации (PPTX) считают один слайд одной страницей. Документы Word (DOCX) используют собственную разбивку на страницы.

Примечание

Режим Pro (2025-05-01-preview) в настоящее время поддерживает только .pdf, .tiff и типы файлов изображений в качестве входных данных. Общее количество входных данных не может превышать 100 МБ и 150 страниц.

Изображение

Поддерживаемые типы файлов Размер файла Разрешение
.jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic ≤ 200 МБ Мин: 50 x 50 пикселей
Макс: 10k x 10k пикселей

Аудио

Поддерживаемые типы файлов Размер файла Длина
.wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)
.mp3
.mp4
.opus, .ogg (Opus)
.flac
.wma
.aac
.webm (Opus, Vorbis)
.m4a (AAC, AC-3)
Макс. 300 МБ Макс. 2 часа

Content Understanding поддерживает аудиофайлы размером до 1 ГБ и длительностью до 4 часов, но время транскрибирования значительно уменьшается для файлов размером 300 МБ или менее или длительностью двух часов или менее.

Видео

Поддерживаемые типы файлов и разрешение

Поддерживаемые типы файлов Разрешение
.mp4, .m4v
.flv (H.264 и AAC)
.wmv, .asf
.avi
.mkv
.mov
Мин: 320 x 240 пикселей
Макс: 1920 x 1080 пикселей

Ограничения размера файла

Метод upload Размер файла Длина Описание
analyzeBinary API (прямая отправка) ≤ 200 МБ ≤ 30 минут Загрузите видеофайлы непосредственно в теле запроса с использованием API analyzeBinary. Microsoft Foundry UX и Content Understanding Studio UX используют этот метод.
анализ API (ссылка на файл) Максимальное значение: 4 ГБ Максимум: два часа Обращайтесь к видеофайлам при помощи URL-адресов из Хранилище BLOB-объектов Azure или аналогичного хранилища при использовании API Analyze.

Примечание

Анализ видео имеет следующие ограничения:

  • analyzeBinary API: максимальный размер файла в 200 МБ и максимальная длительность 30 минут при отправке видео непосредственно в тексте запроса
  • Выборка кадров: анализирует примерно один кадр в секунду, что может пропустить быстрые движения или краткие события
  • Разрешение: все кадры масштабируются до 512 x 512 пикселей, что может повлиять на видимость небольших деталей или удаленных объектов

Ограничения схемы полей

Content Understanding поддерживает как основные типы значений полей, так и вложенные структуры, включая списки, группы, таблицы и фиксированные таблицы.

  • Базовые типы значений полей: строка, дата, время, число, целое число и логическое значение.
  • Поле списка: последовательность значений одного типа, представленная в виде массива базовых полей в API.
  • Поле группы: набор семантических полей, представленный как объект базовых полей в API.
  • Поле таблицы: переменное количество элементов с фиксированными подфилдами, представленное в виде массива объектов базовых полей в API.
  • Фиксированное поле таблицы: группа полей с общими подполями, представленная в виде многослойного объекта базовых полей в API.

Основные ограничения

Свойство Документ Текст Изображение Аудио Видео
Максимальное число полей 1,000 1,000 1,000 1,000 1,000
Максимальная классификация категорий полей 300 300 300 300 300
Поддерживаемые методы создания Извлечь
Создать
Классифицировать
Создать
Классифицировать
Создать
Классифицировать
Создать
Классифицировать
Сгенерировать
Классифицировать
  • Ограничение "Максимальное число полей" включает все именованные поля. Например, список строк считается одним полем, а группа со строками и подфилдами чисел считается тремя полями.
  • Ограничение на количество категорий полей Max - это общее количество категорий во всех полях, используя classify метод генерации.

Ограничения источников знаний

Тип Ограничения
Обучающие данные Только документы
Всего 1 ГБ
Всего 50 000 страниц и изображений

Ограничения сегментации и классификации

Примечание

Эти ограничения применяются к сегментации и классификации содержимого . Они не применяются к классификации полей в возможностях извлечения.

Свойство Ограничение
Имя категории Не удается начать с знака доллара ($).
Имя и описание категории Не более 120 символов для объединенного имени и описания в каждой категории.
Количество категорий 200 на анализатор для документов, 1 для видео.
Иерархическая классификация Пять слоев для документов, два слоя для видео