Поделиться через


Квоты и ограничения службы

Это содержимое относится к:checkmarkфлажокv4.0 (GA) | Предыдущие версии:blue-checkmarkсиняя галочкаv3.1 (GA)blue-checkmarkv3.0 (GA)

Это содержимое относится к:галочкаv2.1 | Последняя версия:синяя галочкаv4.0 (GA)

В этой статье содержится краткий справочник и подробное описание аналитики документов Azure в квотах и ограничениях средств Foundry для всех ценовых категорий. Она также содержит некоторые рекомендации по предотвращению ограничения запросов.

Использование модели

Поддерживаемые типы документов Read Layout Предварительно созданные модели Пользовательские модели Возможности надстройки
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Изображения: JPEG/JPG, , PNGBMP, TIFFHEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTXXLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = поддерживается = не поддерживается ✖️

Для Аналитики документов версии 4.0 2024-11-30 (GA) поддерживаются функции страниц и строк со следующими ограничениями:

  • Угол, ширина и высота и единица не поддерживаются.
  • Для каждого обнаруженного объекта ограничивающие многоугольники или ограничивающие области не поддерживаются.
  • Объект lines не поддерживается.
Поддерживаемые типы документов Read Layout Предварительно созданные модели Пользовательские модели
PDF ✔️ ✔️ ✔️ ✔️
Изображения: JPEG/JPG, , PNGBMP, TIFFHEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTXXLS ✔️ ✖️ ✖️ ✖️

✔️ = поддерживается = не поддерживается ✖️

Billing

Выставление счетов за анализ документов осуществляется ежемесячно на основе типа модели и количества проанализированных страниц. Метрики использования можно найти на панели мониторинга метрик в портале Azure. На панели мониторинга отображается количество страниц, которые обрабатывает служба "Аналитика документов Azure". Вы можете проверить предполагаемые затраты, потраченные на ресурс, с помощью калькулятора цен Azure. Подробные инструкции см. в разделе "Проверка использования и оценка затрат". Ниже приведены некоторые сведения:

  • При отправке документа для анализа служба анализирует все страницы, если только не указать диапазон страниц с помощью параметра в запросе pages . Когда служба анализирует документы Microsoft Excel и PowerPoint с помощью модели чтения, OCR или макета, она подсчитывает каждый лист Excel и слайд PowerPoint как одну страницу.

  • При анализе PDF-файлов и TIFF служба подсчитывает каждую страницу в PDF-файле или каждый образ в TIFF-файле как одну страницу без максимальных ограничений символов.

  • При анализе файлов Microsoft Word и HTML, которые поддерживают модели чтения и макета, сервис подсчитывает страницы в блоках по 3000 символов. Например, если в документе содержится 7 000 символов, две страницы с 3 000 символами каждая и одна страница с 1 000 символами в сумме составляют три страницы.

  • Модели чтения и оформления не поддерживают анализ внедренных или связанных изображений в файлах Microsoft Word, Excel, PowerPoint и HTML. Поэтому служба не учитывает их как добавленные изображения.

  • Обучение пользовательской модели всегда бесплатно при использовании Document Intelligence. Плата взимается только в том случае, если служба использует модель для анализа документа.

  • Цены на контейнеры аналогичны ценам на облачную службу.

  • Аналитика документов предлагает бесплатный уровень (F0), где можно протестировать все функции аналитики документов. Бесплатный уровень ограничивает анализ ответа только первыми двумя страницами в запросе.

  • Аналитика документов имеет модель ценообразования на основе обязательств для больших рабочих нагрузок.

  • Модель макета необходима для генерации меток в вашем наборе данных для индивидуального обучения. Если набор данных, используемый для пользовательского обучения, не имеет доступных файлов меток, служба создает их для вас и выставляет счета за использование модели макета.

Quota Бесплатный (F0)1 Standard (S0)
Анализ предела транзакций в секунду 1 15 (значение по умолчанию)
Adjustable No Да 2
Получить ограничение на количество операций в секунду 1 50 (значение по умолчанию)
Adjustable No Да 2
Ограничение операций управления моделями в секунду 1 5 (значение по умолчанию)
Adjustable No Да 2
Ограничение на количество операций списка в секунду 1 10 (значение по умолчанию)
Adjustable No Да 2
Максимальный размер документа 4 МБ 500 МБ
Adjustable No No
Максимальное количество страниц (анализ) 2 2000
Adjustable No No
Максимальный размер файла меток 10 МБ 10 МБ
Adjustable No No
Максимальный размер JSON-ответа OCR 500 МБ 500 МБ
Adjustable No No
Максимальное число моделей шаблонов 500 5000
Adjustable No No
Максимальное число нейронных моделей 100 500
Adjustable No No

Использование пользовательской модели

Quota Бесплатный (F0) 1 Standard (S0)
Ограничение при объединении моделей 5 500 (значение по умолчанию)
Adjustable No No
Размер набора данных для обучения * Нейронный и генерированный 1 ГБ 3 1 ГБ (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Шаблон 50 МБ 4 50 МБ (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) * Шаблон 500 500 (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) * Нейронные и генеративные 50,000 50 000 (значение по умолчанию)
Adjustable No No
Обучение настраиваемой нейронной модели 10 часов в месяц 5 без ограничения (оплата по часам), начинайте с 10 бесплатных часов каждый месяц
Adjustable No Да 3
Максимальное количество страниц (обучение) * Классификатор 25,000 25 000 (значение по умолчанию)
Adjustable No No
Максимальное число типов документов (классов) * Классификатор 1000 1000 (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Классификатор 1GB 2 ГБ (значение по умолчанию)
Adjustable No No
Минимальное количество выборок на класс * Классификатор 5 5 (значение по умолчанию)
Adjustable No No

Использование пользовательской модели

Quota Бесплатный (F0) 1 Standard (S0)
Ограничение при объединении моделей 5 200 (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Нейронный 1 ГБ 3 1 ГБ (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Шаблон 50 МБ 4 50 МБ (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) * Шаблон 500 500 (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) * Нейронное 50,000 50 000 (значение по умолчанию)
Adjustable No No
Обучение настраиваемой нейронной модели 10 в месяц 20 в месяц
Adjustable No Да 3
Максимальное количество страниц (обучение) * Классификатор 10,000 10 000 (значение по умолчанию)
Adjustable No No
Максимальное число типов документов (классов) * Классификатор 500 500 (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Классификатор 1GB 1 ГБ (значение по умолчанию)
Adjustable No No
Минимальное количество выборок на класс * Классификатор 5 5 (значение по умолчанию)
Adjustable No No

Использование пользовательской модели

Quota Бесплатный (F0) 1 Standard (S0)
Ограничение при объединении моделей 5 200 (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Нейронный 1 ГБ 3 1 ГБ (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Шаблон 50 МБ 4 50 МБ (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) * Шаблон 500 500 (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) * Нейронное 50,000 50 000 (значение по умолчанию)
Adjustable No No
Обучение настраиваемой нейронной модели 10 в месяц 20 в месяц
Adjustable No Да 3
Максимальное количество страниц (обучение) * Классификатор 10,000 10 000 (значение по умолчанию)
Adjustable No No
Максимальное число типов документов (классов) * Классификатор 500 500 (значение по умолчанию)
Adjustable No No
Размер набора данных обучения * Классификатор 1GB 1 ГБ (значение по умолчанию)
Adjustable No No
Минимальное количество выборок на класс * Классификатор 5 5 (значение по умолчанию)
Adjustable No No

Ограничения пользовательской модели

Quota Бесплатный (F0) 1 Standard (S0)
Ограничение при объединении моделей 5 200 (значение по умолчанию)
Adjustable No No
Размер набора данных для обучения 50 МБ 50 МБ (значение по умолчанию)
Adjustable No No
Максимальное количество страниц (обучение) 500 500 (значение по умолчанию)
Adjustable No No

1 Ценовая категория "Бесплатно " (F0) также отображает ежемесячные лимиты на странице с ценами.
2 См. рекомендации и инструкции по корректировке.
3 Количество обучений нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения. Начиная с API версии 4.0, учебные запросы, превышающие 20 запросов в календарном месяце, рассчитываются по тарифу обучения. Подробные сведения см. в разделе Цены.

4 Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.

5 Это ограничение применяется только для v 4.0 (2024-11-30 GA) пользовательских нейронных моделей. Начиная с v 4.0, мы поддерживаем тренировку крупных документов в течение длительных периодов времени (до 10 часов бесплатно, после чего взимается плата). Дополнительные сведения см. на странице пользовательской нейронной модели.

Подробное описание, корректировка квоты и рекомендации

Ограничения по умолчанию можно расширить, запросить увеличение с помощью запроса в службу поддержки. Прежде чем запросить увеличение квоты (если есть такая возможность), убедитесь, что без этого не обойтись.

Если ваше приложение возвращает код ответа 429 (слишком много запросов), вы превысили пороговое значение для одной или нескольких лимитов на количество транзакций в секунду (TPS).

  • Лимит транзакций в секунду для анализа TPS для отправки запросов на анализ (POST)
  • Получить ограничение операций в секунду TPS для опроса результатов операций анализа (GET)
  • Ограничение на операции управления моделями в секунду Операции, связанные с управлением моделями, такими как сборка/обучение и копирование.
  • Ограничение на количество операций списка в секунду для действий с моделями и операциями.

Общие рекомендации по снижению троттлинга

Чтобы минимизировать проблемы троттлинга (Код ответа 429), рекомендуется использовать следующие методы:

  • Реализуйте в приложении логику повторных попыток
  • Избегайте внесения резких изменений в рабочую нагрузку. Постепенное увеличение рабочей нагрузки
    Example. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS. Результатом является код ответа 429 для некоторых запросов, так как вы превышаете ограничение 15 TPS для отправки операций анализа. Вы можете либо сократить нагрузку на обработку, чтобы оставаться ниже 15 TPS, либо запросить увеличение предела TPS для поддержки большего объема данных.

В следующих разделах описаны конкретные случаи настройки квот. Переход к аналитике документов: увеличение количества одновременных запросов

Увеличение лимита запросов на количество транзакций в секунду

По умолчанию количество транзакций в секунду ограничено 15 транзакциями в секунду на ресурс Интеллектуального анализа документов. Для ценовой категории "Стандартный" можно подавать запросы на увеличение TPS, однако их одобрение и уровень корректировки будет зависеть от ежедневного характера использования и соблюдения передовых практик. Перед отправкой запроса убедитесь в том, что вам знакомы материалы в этом разделе, а также эти рекомендации.

Увеличение максимального количества одновременных запросов напрямую не влияет на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, насколько служба может масштабироваться, прежде чем начнет ограничивать ваши запросы.

Существующее значение различных категорий ограничений запросов доступно через портал Azure на вкладке мониторинга в колонке обзора ресурсов.

Создание и отправка запроса на поддержку для увеличения TPS

Чтобы увеличить ограничение на количество транзакций в секунду для ресурса, отправьте запрос в службу поддержки:

  • Войдите на портал Azure
  • Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
  • Выберите "Новый запрос на поддержку" (группа "Поддержка и устранение неисправностей"). Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
  • Введите -Summary- (например, "Увеличить ограничение TPS для документной аналитики")
  • Выберите "Квота или проверка использования" в поле типа проблемы.
  • Выберите -Далее: решения-
  • Продолжайте создание запроса.
  • В поле "Описание" введите следующие сведения на вкладке "Сведения".
    • Обратите внимание, что запрос касается квоты на использование Document Intelligence.
    • Укажите ожидаемое количество транзакций в секунду, до которого вы хотите выполнить масштабирование, чтобы соответствовать вашим требованиям. Хотя увеличение TPS бесплатно, вы должны запрашивать только тот TPS, который соответствует вашей рабочей нагрузке.
    • Сведения о ресурсах Azure
    • Завершите ввод необходимых сведений и нажмите кнопку "Создать" в -Review + create- tab
    • Запишите номер запроса на поддержку в уведомлениях на портале Azure. Ожидайте, что служба поддержки свяжется с вами в ближайшее время для дальнейшей обработки.

Пример рекомендованного шаблона рабочей нагрузки

В этом примере представлен подход, который мы рекомендуем использовать для смягчения возможного ограничения запросов. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.

Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочую нагрузку для отправки запросов на анализ. Если вы обнаружите, что часто возникает ограничение с кодом ответа 429 при проверке завершения, начните с реализации экспоненциального бэкоффа в запросе на анализ с методом GET. постепенно увеличивая время ожидания между повторными попытками в ответ на последовательные сообщения об ошибках, например, по схеме 2-5-13-34 для задержек между запросами. Как правило, мы рекомендуем не вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST. Ответ analyze также содержит заголовок retry-after, указывающий, сколько секунд нужно подождать, прежде чем проверять завершение этого запроса.

Если вы обнаружите, что количество POST-запросов для отправки документов ограничивается, попробуйте добавить задержку между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.

Как правило, мы рекомендуем протестировать рабочую нагрузку и шаблоны рабочей нагрузки перед переходом в рабочую среду.

Дальнейшие шаги