Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Квота обеспечивает гибкость для активного управления распределением ограничений скорости между развертываниями в вашей подписке. Azure назначает квоту на подписку, регион и модель в единицах токенов в минуту (TPM). Различные типы развертывания, такие как "Стандартный" и "Провизиональное", имеют различные механизмы квотирования. Полные сведения об ограничениях и уровнях квот по умолчанию см. в разделе Azure квоты и ограничения OpenAI.
В этой статье описывается процесс управления квотой для моделей Microsoft Foundry, развернутых в среде проекта Foundry, включая просмотр текущих выделений и запрос увеличения.
Необходимые условия
- Подписка Azure. Создайте его бесплатно.
- Проект Foundry.
- Роль читателя использования Cognitive Services на уровне подписки для просмотра выделения квот.
- Роль владельца или вкладчика в подписке, чтобы запросить увеличение квоты.
- Роль автора Cognitive Services в сочетании с читателем использования Cognitive Services для редактирования выделения квот на портале Foundry.
Общая квота Foundry
Foundry предоставляет пул общих квот, которые разные пользователи в разных регионах могут использовать одновременно. В зависимости от доступности пользователи могут временно получить доступ к квоте из общего пула и использовать квоту для выполнения тестирования в течение ограниченного периода времени. Определенный период времени зависит от варианта использования. Временно используя квоту из пула квот, вам больше не нужно отправлять запрос в службу поддержки для краткосрочного увеличения квоты или ожидать утверждения запроса квоты, прежде чем продолжить работу с рабочей нагрузкой.
Общий пул квот можно использовать для тестирования вывода для моделей Foundry из каталога моделей. Используйте общую квоту только для создания временных тестовых конечных точек, а не рабочих конечных точек. Для точек подключения в производственной среде необходимо запросить выделенную квоту. Выставление счетов за общую квоту зависит от использования.
Просмотр и запрос квот на портале Foundry
Используйте квоты для управления распределением квот модели между несколькими проектами Foundry в одной подписке.
-
Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry включен. Эти действия относятся к Foundry (new).
Проекты помогают упорядочить работу. Проект, над которым вы работаете, отображается в левом верхнем углу. Если вы хотите создать проект, выберите имя проекта, а затем создайте проект.
Выберите "Управление" в правом верхнем углу экрана.
Выберите Quota в левой панели, чтобы открыть панель Quota. Представление квоты имеет две вкладки:
- Токенов в минуту — просмотр и управление квотами токенов в минуту (TPM) для стандартных развертываний.
- Подготовленная единица пропускной способности — просмотр и управление подготовленными распределениями единиц пропускной способности (PTU) для подготовленных развертываний, включая средства оценки емкости.
Выберите любое развертывание в списке, чтобы открыть область сведений справа. На панели сведений показаны текущее распределение квоты развертывания, использование и связанные развертывания.
На панели сведений о развертывании перейдите к разделу связанным развертываниям, использующим общую квоту. Щелкните значок карандаша в столбце "Действия " таблицы, чтобы изменить выделение квот для развертывания и освободить неиспользуемую квоту или увеличить выделение по мере необходимости.
Нажмите кнопку "Квота запроса " в правом верхнем углу, чтобы запросить увеличение квоты для стандартного типа развертывания.
Примечание
После изменения выделения квоты или отправки запроса изменения могут вступить в силу в течение 15 минут. Обновите страницу квоты, чтобы проверить обновленное распределение.
Устранение неполадок
Если при просмотре или запросе квот возникают проблемы, попробуйте выполнить следующие решения:
| Проблема | Решение |
|---|---|
| Страница квоты пуста или не отображает распределения. | Убедитесь, что у вас есть роль читателя служб Cognitive Services на уровне подписки. Убедитесь, что вы просматриваете правильную подписку на портале. |
| Кнопка "Квота запроса" отключена | Убедитесь, что у вас есть роль владельца или участника в подписке. Некоторые сочетания моделей и регионов могут не поддерживать увеличение квоты. |
| Изменение квоты не отражается после утверждения | Для распространения изменений квот может потребоваться до 15 минут. Обновите страницу Квота. Если проблема сохраняется через 24 часа, обратитесь к поддержка Azure. |
| Не удается найти квоту для конкретной модели | Проверьте региональную доступность. Не все модели доступны во всех регионах. См. раздел поддержки региона. |