Квоты и ограничения службы

Это содержимое относится к:версии 4.0 (GA) | Предыдущие версии:версии 3.1 (GA)версии 3.0 (вывод из эксплуатации)

Это содержимое относится к:версия 2.1 | Последняя версия:версия 4.0 (GA)

В этой статье содержатся как краткий справочник, так и подробное описание Azure Document Intelligence в квотах и ограничениях Foundry Tools для всех уровней цен. В нём также содержатся лучшие практики, чтобы избежать ограничения запросов.

Использование модели

Поддерживаемые типы документов	Прочитать	Макет	Предварительно созданные модели	Пользовательские модели	Возможности дополнения
PDF	✔️	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `PNGBMP`, `TIFFHEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Для Аналитики документов версии 4.0 2024-11-30 (GA) поддерживаются функции страниц и строк со следующими ограничениями:

Угол, ширина и высота и единица не поддерживаются.
Для каждого обнаруженного объекта ограничивающие многоугольники или ограничивающие области не поддерживаются.
Объект lines не поддерживается.

Поддерживаемые типы документов	Прочитать	Макет	Предварительно созданные модели	Пользовательские модели
PDF	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `PNGBMP`, `TIFFHEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Биллинг

Выставление счетов за интеллектуальный анализ документов осуществляется ежемесячно на основе типа модели анализа и количества проанализированных страниц. Метрики использования можно найти на панели мониторинга метрик на портале Azure. На панели мониторинга отображается количество страниц, обрабатываемых системой Azure Document Intelligence. Вы можете проверить предполагаемые затраты, потраченные на ресурс, с помощью калькулятора цен Azure. Подробные инструкции см. в разделе "Проверка использования и оценка затрат". Ниже приведены некоторые сведения:

При отправке документа для анализа служба анализирует все страницы, если только не указать диапазон страниц с помощью параметра в запросе pages . Когда служба анализирует документы Microsoft Excel и PowerPoint с помощью модели чтения, OCR или макета, она подсчитывает каждый лист Excel и слайд PowerPoint как одну страницу.
При анализе PDF-файлов и TIFF служба подсчитывает каждую страницу в PDF-файле или каждый образ в TIFF-файле как одну страницу без максимальных ограничений символов.
Когда служба анализирует файлы Microsoft Word и HTML, поддерживаемые имеющимися моделями чтения и макета, она подсчитывает страницы в блоках по 3000 символов каждый. Например, если в вашем документе содержится 7000 символов, то две страницы с 3000 символами каждая и одна страница с 1000 символами суммируются в три страницы.
Модели чтения и макета не поддерживают анализ внедрённых или связанных изображений в файлах Microsoft Word, Excel, PowerPoint и HTML. Поэтому сервис не считает их добавленными изображениями.
Обучение пользовательской модели всегда бесплатное с использованием интеллектуального анализа документов. Плата взимается только в том случае, если служба использует модель для анализа документа.
Цены на контейнеры совпадают с ценами на облачную службу.
Аналитика документов предлагает бесплатный уровень (F0), где можно протестировать все функции аналитики документов. Уровень "Бесплатный" ограничивает анализ данных только на первые две страницы в запросе.
Аналитика документов имеет модель ценообразования на основе обязательств для больших рабочих нагрузок.
Модель макета необходима для создания меток в наборе данных для специализированного обучения. Если набор данных, используемый для пользовательского обучения, не имеет доступных файлов меток, служба создает их для вас и выставляет счета за использование модели макета.

Квоты	Бесплатный (F0)¹	Standard (S0)
Анализ ограничения транзакций в секунду	1	15 (значение по умолчанию)
Регулируемый	Нет	Да ²
Получить ограничение операций в секунду	1	50 (значение по умолчанию)
Регулируемый	Нет	Да ²
Ограничение операций управления моделями в секунду	1	5 (значение по умолчанию)
Регулируемый	Нет	Да ²
Лимит операций в секунду для списка	1	10 (значение по умолчанию)
Регулируемый	Нет	Да ²
Максимальный размер документа	4 МБ	500 МБ
Регулируемый	Нет	Нет
Максимальное количество страниц (анализ)	2	2000
Регулируемый	Нет	Нет
Максимальный размер файла меток	10 МБ	10 МБ
Регулируемый	Нет	Нет
Максимальный размер ответа OCR json	500 МБ	500 МБ
Регулируемый	Нет	Нет
Максимальное число моделей шаблонов	500	5000
Регулируемый	Нет	Нет
Максимальное число нейронных моделей	100	500
Регулируемый	Нет	Нет

Использование пользовательской модели

Квоты	Бесплатный (F0) ¹	Standard (S0)
Лимит модели Compose	5	500 (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных для обучения Нейронный и генерированный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное количество страниц (обучение) Нейронные и генеративные**	50,000	50 000 (значение по умолчанию)
Регулируемый	Нет	Нет
Обучение пользовательской нейронной модели	10 часов в месяц ⁵	без ограничения (оплата по часам), начинайте с 10 бесплатных часов каждый месяц
Регулируемый	Нет	Да ³
*Максимальное количество страниц (обучение) Классификатор**	25,000	25 000 (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное число типов документов (классов) Классификатор**	1000	1000 (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Классификатор**	1GB	2 ГБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируемый	Нет	Нет

Использование пользовательской модели

Квоты	Бесплатный (F0) ¹	Standard (S0)
Лимит модели Compose	5	200 (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируемый	Нет	Нет
Обучение пользовательской нейронной модели	10 в месяц	20 в месяц
Регулируемый	Нет	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10 000	10 000 (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Классификатор**	1GB	1 ГБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируемый	Нет	Нет

Использование пользовательской модели

Квоты	Бесплатный (F0) ¹	Standard (S0)
Лимит модели Compose	5	200 (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируемый	Нет	Нет
Обучение пользовательской нейронной модели	10 в месяц	20 в месяц
Регулируемый	Нет	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10 000	10 000 (значение по умолчанию)
Регулируемый	Нет	Нет
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируемый	Нет	Нет
*Размер набора данных обучения Классификатор**	1GB	1 ГБ (значение по умолчанию)
Регулируемый	Нет	Нет
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируемый	Нет	Нет

Ограничения пользовательской модели

Квоты	Бесплатный (F0) ¹	Standard (S0)
Лимит модели Compose	5	200 (значение по умолчанию)
Регулируемый	Нет	Нет
Размер набора данных для обучения	50 МБ	50 МБ (значение по умолчанию)
Регулируемый	Нет	Нет
Максимальное количество страниц (обучение)	500	500 (значение по умолчанию)
Регулируемый	Нет	Нет

¹ Ценовая категория «Бесплатно» (F0) также отображает ежемесячные лимиты на странице цен.
² См. рекомендации и инструкции по корректировке.
³ Число обучающих нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения. Начиная с версии 4.0 API, тренировочные запросы свыше 20 в календарном месяце рассчитываются по тарифу для обучения. См. раздел Цены для получения подробной информации.

⁴ Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.

⁵ Это ограничение применяется только для v 4.0 (2024-11-30 GA) пользовательских нейронных моделей. Начиная с v 4.0, мы поддерживаем обучение более крупных документов в течение более длительных периодов (до 10 часов бесплатно, а затем взимается плата). Дополнительные сведения см. на странице пользовательской нейронной модели.

Подробное описание, корректировка квот и рекомендации

Ограничения по умолчанию можно расширить, запросить увеличение с помощью запроса в службу поддержки. Прежде чем запрашивать увеличение квоты (если применимо), убедитесь, что это необходимо.

Если ваше приложение возвращает код ответа 429 (Слишком много запросов), это значит, что вы превысили пороговое значение лимитов для одной или нескольких транзакций в секунду (TPS):

Ограничение на количество транзакций в секунду для анализа Предел TPS для отправки запросов на анализ (POST)
Ограничение операций в секунду ТПС для опроса результатов операций анализа (GET)
Ограничение операций управления моделями в секунду Операции, связанные с управлением моделями, такими как сборка и обучение и копирование.
Ограничение на количество операций списка в секунду Операции, связанные с перечислением моделей и операций.

Общие рекомендации по смягчению регулирования

Чтобы свести к минимуму проблемы, связанные с регулированием (код ответа 429), рекомендуется использовать следующие методы:

Реализация логики повторных попыток в приложении
Избегайте резких изменений в рабочей нагрузке. Постепенное увеличение рабочей нагрузки
Пример. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS. Результатом является код ответа 429 для некоторых запросов, так как вы превышаете ограничение 15 TPS для отправки операций анализа. Вы можете либо уменьшить объем обработки, чтобы оставаться ниже 15 TPS, либо запросить увеличение на TPS для поддержки более высоких объемов.

В следующих разделах описываются конкретные случаи корректировки квот. Переход к аналитике документов: увеличение количества одновременных запросов

Увеличение лимита на количество транзакций в секунду

По умолчанию количество транзакций в секунду ограничено 15 транзакций в секунду для ресурса аналитики документов. Для ценовой категории "Стандартный" запросы на увеличение TPS могут быть отправлены, но возможность их утверждения и уровень корректировки TPS зависят от ежедневных шаблонов использования и следования передовым методам. Перед отправкой запроса убедитесь, что вы знакомы с материалом в этом разделе и знаете об этих рекомендациях.

Увеличение лимита одновременных запросов не влияет непосредственно на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, насколько сервис может масштабироваться, прежде чем начать ограничивать ваши запросы.

Существующее значение различных категорий ограничений запросов доступно на портале Azure на вкладке мониторинга в колонке обзора ресурсов.

Создание и отправка запроса на поддержку для увеличения TPS

Инициируйте увеличение лимита транзакций в секунду (TPS) для ресурса, отправив запрос на поддержку:

Войдите на портал Azure
Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
Выберите «Новый запрос на поддержку» («Support + troubleshooting» группа). Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
Введите -Summary- (например, "Увеличить ограничение TPS для аналитики документов")
Выберите "Проверка квоты или использования" в поле типа проблемы.
Нажмите кнопку -Далее: решения
Дальнейшие действия по созданию запроса
В поле "Описание" введите следующие сведения на вкладке "Сведения".
- Обратите внимание, что запрос касается квоты на Интеллектуальное управление документами.
- Предоставьте ожидания TPS, которые вы хотите масштабировать, чтобы удовлетворить. Хотя повышение TPS бесплатно, вы должны запрашивать только то TPS, которое соответствует потребностям вашей рабочей нагрузки.
- сведения о ресурсе Azure
- Завершите ввод необходимых сведений и нажмите кнопку -Create- в -Review + create- tab
- Обратите внимание на номер запроса на поддержку в уведомлениях портала Azure. Ожидайте, что служба поддержки свяжется с вами в ближайшее время для дальнейшей обработки.

Пример рекомендации по шаблону рабочей нагрузки

В этом примере представлен подход, который мы рекомендуем использовать для смягчения возможного ограничения частоты запросов. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.

Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочий процесс для отправки запросов на анализ. Если вы обнаружили, что появляется частое ограничение с кодом ответа 429, начните реализовывать запрос на анализ GET с экспоненциальной задержкой. С использованием постепенно увеличивающегося времени ожидания между повторными попытками для последовательных ошибочных ответов, например, с шаблоном задержек 2-5-13-34 между запросами. Как правило, мы рекомендуем не вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST. Ответ analyze также содержит заголовок retry-after , указывающий, сколько времени следует ожидать в секундах перед проверкой завершения этого запроса.

Если вы обнаружите, что вас ограничивают по количеству запросов POST для документов, отправляющихся, подумайте о добавлении задержки между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.

Как правило, мы рекомендуем протестировать нагрузку и шаблоны нагрузки перед вводом в эксплуатацию.

Дальнейшие действия

Сведения о кодах ошибок и устранении неполадок

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-05-08

Квоты и ограничения службы

Использование модели

Биллинг

Использование пользовательской модели

Использование пользовательской модели

Использование пользовательской модели

Ограничения пользовательской модели

Подробное описание, корректировка квот и рекомендации

Общие рекомендации по смягчению регулирования

Увеличение лимита на количество транзакций в секунду

Создание и отправка запроса на поддержку для увеличения TPS

Пример рекомендации по шаблону рабочей нагрузки

Дальнейшие действия

Обратная связь

Дополнительные ресурсы