Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Это содержимое относится к:
флажокv4.0 (GA) | Предыдущие версии:
синяя галочкаv3.1 (GA)blue-checkmarkv3.0 (GA)
Это содержимое относится к:
v2.1 | Последняя версия:
v4.0 (GA)
В этой статье содержится краткий справочник и подробное описание аналитики документов Azure в квотах и ограничениях средств Foundry для всех ценовых категорий. Она также содержит некоторые рекомендации по предотвращению ограничения запросов.
Использование модели
| Поддерживаемые типы документов | Read | Layout | Предварительно созданные модели | Пользовательские модели | Возможности надстройки |
|---|---|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Изображения: JPEG/JPG, , PNGBMP, TIFFHEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX, PPTXXLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = поддерживается = не поддерживается ✖️
Для Аналитики документов версии 4.0 2024-11-30 (GA) поддерживаются функции страниц и строк со следующими ограничениями:
- Угол, ширина и высота и единица не поддерживаются.
- Для каждого обнаруженного объекта ограничивающие многоугольники или ограничивающие области не поддерживаются.
- Объект
linesне поддерживается.
| Поддерживаемые типы документов | Read | Layout | Предварительно созданные модели | Пользовательские модели |
|---|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ | |
Изображения: JPEG/JPG, , PNGBMP, TIFFHEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX, PPTXXLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = поддерживается = не поддерживается ✖️
Billing
Выставление счетов за анализ документов осуществляется ежемесячно на основе типа модели и количества проанализированных страниц. Метрики использования можно найти на панели мониторинга метрик в портале Azure. На панели мониторинга отображается количество страниц, которые обрабатывает служба "Аналитика документов Azure". Вы можете проверить предполагаемые затраты, потраченные на ресурс, с помощью калькулятора цен Azure. Подробные инструкции см. в разделе "Проверка использования и оценка затрат". Ниже приведены некоторые сведения:
При отправке документа для анализа служба анализирует все страницы, если только не указать диапазон страниц с помощью параметра в запросе
pages. Когда служба анализирует документы Microsoft Excel и PowerPoint с помощью модели чтения, OCR или макета, она подсчитывает каждый лист Excel и слайд PowerPoint как одну страницу.При анализе PDF-файлов и TIFF служба подсчитывает каждую страницу в PDF-файле или каждый образ в TIFF-файле как одну страницу без максимальных ограничений символов.
При анализе файлов Microsoft Word и HTML, которые поддерживают модели чтения и макета, сервис подсчитывает страницы в блоках по 3000 символов. Например, если в документе содержится 7 000 символов, две страницы с 3 000 символами каждая и одна страница с 1 000 символами в сумме составляют три страницы.
Модели чтения и оформления не поддерживают анализ внедренных или связанных изображений в файлах Microsoft Word, Excel, PowerPoint и HTML. Поэтому служба не учитывает их как добавленные изображения.
Обучение пользовательской модели всегда бесплатно при использовании Document Intelligence. Плата взимается только в том случае, если служба использует модель для анализа документа.
Цены на контейнеры аналогичны ценам на облачную службу.
Аналитика документов предлагает бесплатный уровень (F0), где можно протестировать все функции аналитики документов. Бесплатный уровень ограничивает анализ ответа только первыми двумя страницами в запросе.
Аналитика документов имеет модель ценообразования на основе обязательств для больших рабочих нагрузок.
Модель макета необходима для генерации меток в вашем наборе данных для индивидуального обучения. Если набор данных, используемый для пользовательского обучения, не имеет доступных файлов меток, служба создает их для вас и выставляет счета за использование модели макета.
| Quota | Бесплатный (F0)1 | Standard (S0) |
|---|---|---|
| Анализ предела транзакций в секунду | 1 | 15 (значение по умолчанию) |
| Adjustable | No | Да 2 |
| Получить ограничение на количество операций в секунду | 1 | 50 (значение по умолчанию) |
| Adjustable | No | Да 2 |
| Ограничение операций управления моделями в секунду | 1 | 5 (значение по умолчанию) |
| Adjustable | No | Да 2 |
| Ограничение на количество операций списка в секунду | 1 | 10 (значение по умолчанию) |
| Adjustable | No | Да 2 |
| Максимальный размер документа | 4 МБ | 500 МБ |
| Adjustable | No | No |
| Максимальное количество страниц (анализ) | 2 | 2000 |
| Adjustable | No | No |
| Максимальный размер файла меток | 10 МБ | 10 МБ |
| Adjustable | No | No |
| Максимальный размер JSON-ответа OCR | 500 МБ | 500 МБ |
| Adjustable | No | No |
| Максимальное число моделей шаблонов | 500 | 5000 |
| Adjustable | No | No |
| Максимальное число нейронных моделей | 100 | 500 |
| Adjustable | No | No |
Использование пользовательской модели
| Quota | Бесплатный (F0) 1 | Standard (S0) |
|---|---|---|
| Ограничение при объединении моделей | 5 | 500 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных для обучения * Нейронный и генерированный | 1 ГБ 3 | 1 ГБ (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Шаблон | 50 МБ 4 | 50 МБ (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) * Шаблон | 500 | 500 (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) * Нейронные и генеративные | 50,000 | 50 000 (значение по умолчанию) |
| Adjustable | No | No |
| Обучение настраиваемой нейронной модели | 10 часов в месяц 5 | без ограничения (оплата по часам), начинайте с 10 бесплатных часов каждый месяц |
| Adjustable | No | Да 3 |
| Максимальное количество страниц (обучение) * Классификатор | 25,000 | 25 000 (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное число типов документов (классов) * Классификатор | 1000 | 1000 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Классификатор | 1GB | 2 ГБ (значение по умолчанию) |
| Adjustable | No | No |
| Минимальное количество выборок на класс * Классификатор | 5 | 5 (значение по умолчанию) |
| Adjustable | No | No |
Использование пользовательской модели
| Quota | Бесплатный (F0) 1 | Standard (S0) |
|---|---|---|
| Ограничение при объединении моделей | 5 | 200 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Нейронный | 1 ГБ 3 | 1 ГБ (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Шаблон | 50 МБ 4 | 50 МБ (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) * Шаблон | 500 | 500 (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) * Нейронное | 50,000 | 50 000 (значение по умолчанию) |
| Adjustable | No | No |
| Обучение настраиваемой нейронной модели | 10 в месяц | 20 в месяц |
| Adjustable | No | Да 3 |
| Максимальное количество страниц (обучение) * Классификатор | 10,000 | 10 000 (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное число типов документов (классов) * Классификатор | 500 | 500 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Классификатор | 1GB | 1 ГБ (значение по умолчанию) |
| Adjustable | No | No |
| Минимальное количество выборок на класс * Классификатор | 5 | 5 (значение по умолчанию) |
| Adjustable | No | No |
Использование пользовательской модели
| Quota | Бесплатный (F0) 1 | Standard (S0) |
|---|---|---|
| Ограничение при объединении моделей | 5 | 200 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Нейронный | 1 ГБ 3 | 1 ГБ (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Шаблон | 50 МБ 4 | 50 МБ (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) * Шаблон | 500 | 500 (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) * Нейронное | 50,000 | 50 000 (значение по умолчанию) |
| Adjustable | No | No |
| Обучение настраиваемой нейронной модели | 10 в месяц | 20 в месяц |
| Adjustable | No | Да 3 |
| Максимальное количество страниц (обучение) * Классификатор | 10,000 | 10 000 (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное число типов документов (классов) * Классификатор | 500 | 500 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных обучения * Классификатор | 1GB | 1 ГБ (значение по умолчанию) |
| Adjustable | No | No |
| Минимальное количество выборок на класс * Классификатор | 5 | 5 (значение по умолчанию) |
| Adjustable | No | No |
Ограничения пользовательской модели
| Quota | Бесплатный (F0) 1 | Standard (S0) |
|---|---|---|
| Ограничение при объединении моделей | 5 | 200 (значение по умолчанию) |
| Adjustable | No | No |
| Размер набора данных для обучения | 50 МБ | 50 МБ (значение по умолчанию) |
| Adjustable | No | No |
| Максимальное количество страниц (обучение) | 500 | 500 (значение по умолчанию) |
| Adjustable | No | No |
1 Ценовая категория "Бесплатно " (F0) также отображает ежемесячные лимиты на странице с ценами.
2 См. рекомендации и инструкции по корректировке.
3 Количество обучений нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения. Начиная с API версии 4.0, учебные запросы, превышающие 20 запросов в календарном месяце, рассчитываются по тарифу обучения. Подробные сведения см. в разделе Цены.
4 Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.
5 Это ограничение применяется только для
v 4.0 (2024-11-30 GA)пользовательских нейронных моделей. Начиная сv 4.0, мы поддерживаем тренировку крупных документов в течение длительных периодов времени (до 10 часов бесплатно, после чего взимается плата). Дополнительные сведения см. на странице пользовательской нейронной модели.
Подробное описание, корректировка квоты и рекомендации
Ограничения по умолчанию можно расширить, запросить увеличение с помощью запроса в службу поддержки. Прежде чем запросить увеличение квоты (если есть такая возможность), убедитесь, что без этого не обойтись.
Если ваше приложение возвращает код ответа 429 (слишком много запросов), вы превысили пороговое значение для одной или нескольких лимитов на количество транзакций в секунду (TPS).
- Лимит транзакций в секунду для анализа TPS для отправки запросов на анализ (POST)
- Получить ограничение операций в секунду TPS для опроса результатов операций анализа (GET)
- Ограничение на операции управления моделями в секунду Операции, связанные с управлением моделями, такими как сборка/обучение и копирование.
- Ограничение на количество операций списка в секунду для действий с моделями и операциями.
Общие рекомендации по снижению троттлинга
Чтобы минимизировать проблемы троттлинга (Код ответа 429), рекомендуется использовать следующие методы:
- Реализуйте в приложении логику повторных попыток
- Избегайте внесения резких изменений в рабочую нагрузку. Постепенное увеличение рабочей нагрузки
Example. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS. Результатом является код ответа 429 для некоторых запросов, так как вы превышаете ограничение 15 TPS для отправки операций анализа. Вы можете либо сократить нагрузку на обработку, чтобы оставаться ниже 15 TPS, либо запросить увеличение предела TPS для поддержки большего объема данных.
В следующих разделах описаны конкретные случаи настройки квот. Переход к аналитике документов: увеличение количества одновременных запросов
Увеличение лимита запросов на количество транзакций в секунду
По умолчанию количество транзакций в секунду ограничено 15 транзакциями в секунду на ресурс Интеллектуального анализа документов. Для ценовой категории "Стандартный" можно подавать запросы на увеличение TPS, однако их одобрение и уровень корректировки будет зависеть от ежедневного характера использования и соблюдения передовых практик. Перед отправкой запроса убедитесь в том, что вам знакомы материалы в этом разделе, а также эти рекомендации.
Увеличение максимального количества одновременных запросов напрямую не влияет на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, насколько служба может масштабироваться, прежде чем начнет ограничивать ваши запросы.
Существующее значение различных категорий ограничений запросов доступно через портал Azure на вкладке мониторинга в колонке обзора ресурсов.
Создание и отправка запроса на поддержку для увеличения TPS
Чтобы увеличить ограничение на количество транзакций в секунду для ресурса, отправьте запрос в службу поддержки:
- Войдите на портал Azure
- Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
- Выберите "Новый запрос на поддержку" (группа "Поддержка и устранение неисправностей"). Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
- Введите -Summary- (например, "Увеличить ограничение TPS для документной аналитики")
- Выберите "Квота или проверка использования" в поле типа проблемы.
- Выберите -Далее: решения-
- Продолжайте создание запроса.
- В поле "Описание" введите следующие сведения на вкладке "Сведения".
- Обратите внимание, что запрос касается квоты на использование Document Intelligence.
- Укажите ожидаемое количество транзакций в секунду, до которого вы хотите выполнить масштабирование, чтобы соответствовать вашим требованиям. Хотя увеличение TPS бесплатно, вы должны запрашивать только тот TPS, который соответствует вашей рабочей нагрузке.
- Сведения о ресурсах Azure
- Завершите ввод необходимых сведений и нажмите кнопку "Создать" в -Review + create- tab
- Запишите номер запроса на поддержку в уведомлениях на портале Azure. Ожидайте, что служба поддержки свяжется с вами в ближайшее время для дальнейшей обработки.
Пример рекомендованного шаблона рабочей нагрузки
В этом примере представлен подход, который мы рекомендуем использовать для смягчения возможного ограничения запросов. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.
Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочую нагрузку для отправки запросов на анализ. Если вы обнаружите, что часто возникает ограничение с кодом ответа 429 при проверке завершения, начните с реализации экспоненциального бэкоффа в запросе на анализ с методом GET. постепенно увеличивая время ожидания между повторными попытками в ответ на последовательные сообщения об ошибках, например, по схеме 2-5-13-34 для задержек между запросами. Как правило, мы рекомендуем не вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST. Ответ analyze также содержит заголовок retry-after, указывающий, сколько секунд нужно подождать, прежде чем проверять завершение этого запроса.
Если вы обнаружите, что количество POST-запросов для отправки документов ограничивается, попробуйте добавить задержку между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.
Как правило, мы рекомендуем протестировать рабочую нагрузку и шаблоны рабочей нагрузки перед переходом в рабочую среду.