Управляйте квотами и увеличивайте их для ресурсов, используя Microsoft Foundry (проекты Foundry)

Квота обеспечивает гибкость для активного управления распределением ограничений скорости между развертываниями в вашей подписке. Azure назначает квоту на подписку, регион и модель в единицах токенов в минуту (TPM). Различные типы развертывания, такие как "Стандартный" и "Провизиональное", имеют различные механизмы квотирования. Полные сведения об ограничениях и уровнях квот по умолчанию см. в разделе Azure квоты и ограничения OpenAI.

В этой статье описывается процесс управления квотой для моделей Microsoft Foundry, развернутых в среде проекта Foundry, включая просмотр текущих выделений и запрос увеличения.

Необходимые условия

  • Подписка Azure. Создайте его бесплатно.
  • Проект Foundry.
  • Роль читателя использования Cognitive Services на уровне подписки для просмотра выделения квот.
  • Роль владельца или вкладчика в подписке, чтобы запросить увеличение квоты.
  • Роль автора Cognitive Services в сочетании с читателем использования Cognitive Services для редактирования выделения квот на портале Foundry.

Общая квота Foundry

Foundry предоставляет пул общих квот, которые разные пользователи в разных регионах могут использовать одновременно. В зависимости от доступности пользователи могут временно получить доступ к квоте из общего пула и использовать квоту для выполнения тестирования в течение ограниченного периода времени. Определенный период времени зависит от варианта использования. Временно используя квоту из пула квот, вам больше не нужно отправлять запрос в службу поддержки для краткосрочного увеличения квоты или ожидать утверждения запроса квоты, прежде чем продолжить работу с рабочей нагрузкой.

Общий пул квот можно использовать для тестирования вывода для моделей Foundry из каталога моделей. Используйте общую квоту только для создания временных тестовых конечных точек, а не рабочих конечных точек. Для точек подключения в производственной среде необходимо запросить выделенную квоту. Выставление счетов за общую квоту зависит от использования.

Просмотр и запрос квот на портале Foundry

Используйте квоты для управления распределением квот модели между несколькими проектами Foundry в одной подписке.

  1. Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry включен. Эти действия относятся к Foundry (new).

  2. Проекты помогают упорядочить работу. Проект, над которым вы работаете, отображается в левом верхнем углу. Если вы хотите создать проект, выберите имя проекта, а затем создайте проект.

  3. Выберите "Управление" в правом верхнем углу экрана.

  4. Выберите Quota в левой панели, чтобы открыть панель Quota. Представление квоты имеет две вкладки:

    • Токенов в минуту — просмотр и управление квотами токенов в минуту (TPM) для стандартных развертываний.
    • Подготовленная единица пропускной способности — просмотр и управление подготовленными распределениями единиц пропускной способности (PTU) для подготовленных развертываний, включая средства оценки емкости.
  5. Выберите любое развертывание в списке, чтобы открыть область сведений справа. На панели сведений показаны текущее распределение квоты развертывания, использование и связанные развертывания.

  6. На панели сведений о развертывании перейдите к разделу связанным развертываниям, использующим общую квоту. Щелкните значок карандаша в столбце "Действия " таблицы, чтобы изменить выделение квот для развертывания и освободить неиспользуемую квоту или увеличить выделение по мере необходимости.

  7. Нажмите кнопку "Квота запроса " в правом верхнем углу, чтобы запросить увеличение квоты для стандартного типа развертывания.

Примечание

После изменения выделения квоты или отправки запроса изменения могут вступить в силу в течение 15 минут. Обновите страницу квоты, чтобы проверить обновленное распределение.

Устранение неполадок

Если при просмотре или запросе квот возникают проблемы, попробуйте выполнить следующие решения:

Проблема Решение
Страница квоты пуста или не отображает распределения. Убедитесь, что у вас есть роль читателя служб Cognitive Services на уровне подписки. Убедитесь, что вы просматриваете правильную подписку на портале.
Кнопка "Квота запроса" отключена Убедитесь, что у вас есть роль владельца или участника в подписке. Некоторые сочетания моделей и регионов могут не поддерживать увеличение квоты.
Изменение квоты не отражается после утверждения Для распространения изменений квот может потребоваться до 15 минут. Обновите страницу Квота. Если проблема сохраняется через 24 часа, обратитесь к поддержка Azure.
Не удается найти квоту для конкретной модели Проверьте региональную доступность. Не все модели доступны во всех регионах. См. раздел поддержки региона.