Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В настоящее время просмотр:Версия портала Foundry (классическая версия) - Переключиться на версию для нового портала Foundry
Совет
Доступна альтернативная статья, ориентированная на квоты для концентратора. Управление и увеличение квот для ресурсов концентратора.
Квота обеспечивает гибкость для активного управления распределением ограничений скорости между развертываниями в вашей подписке. Azure назначает квоту на подписку, регион и модель в единицах токенов в минуту (TPM). Различные типы развертывания, такие как "Стандартный" и "Провизиональное", имеют различные механизмы квотирования. Полные сведения об ограничениях и уровнях квот по умолчанию см. в разделе Azure квоты и ограничения OpenAI.
В этой статье описывается процесс управления квотой для моделей Microsoft Foundry, развернутых в среде проекта Foundry, включая просмотр текущих выделений и запрос увеличения.
Необходимые условия
- Подписка Azure. Создайте его бесплатно.
- Проект Foundry.
- Роль читателя использования Cognitive Services на уровне подписки для просмотра выделения квот.
- Роль владельца или вкладчика в подписке, чтобы запросить увеличение квоты.
- Роль автора Cognitive Services в сочетании с читателем использования Cognitive Services для редактирования выделения квот на портале Foundry.
Общая квота Foundry
Foundry предоставляет пул общих квот, которые разные пользователи в разных регионах могут использовать одновременно. В зависимости от доступности пользователи могут временно получить доступ к квоте из общего пула и использовать квоту для выполнения тестирования в течение ограниченного периода времени. Определенный период времени зависит от варианта использования. Временно используя квоту из пула квот, вам больше не нужно отправлять запрос в службу поддержки для краткосрочного увеличения квоты или ожидать утверждения запроса квоты, прежде чем продолжить работу с рабочей нагрузкой.
Общий пул квот можно использовать для тестирования вывода для моделей Foundry из каталога моделей. Используйте общую квоту только для создания временных тестовых конечных точек, а не рабочих конечных точек. Для точек подключения в производственной среде необходимо запросить выделенную квоту. Выставление счетов за общую квоту зависит от использования.
Просмотр и запрос квот на портале Foundry
Используйте квоты для управления распределением квот модели между несколькими проектами Foundry в одной подписке.
-
Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry отключен. Эти шаги относятся к Foundry (classic).
Выберите центр управления в нижней части левой панели.
Выберите Quota слева, чтобы открыть представление квоты, где можно просмотреть квоту для моделей в определенных регионах Azure.
Чтобы запросить квоту из представления квоты, разверните любую из групп, перечисленных в столбце развертывания, пока не увидите развертывания модели и связанные с ними сведения.
- Используйте переключатель "Показать все квоты ", чтобы отобразить всю квоту или только выделенную в данный момент квоту.
- Используйте список Group by, чтобы сгруппировать список по типу квоты, региону и модели или типу квоты, модели и региону или Ничего. Параметр None отображает неструктурированный список развертываний моделей, а не вложенный список.
- В строке для развертывания данной модели выберите значок карандаша в столбце выделения квот , чтобы изменить выделение квот для развертывания модели.
- Выберите квоту запроса в столбце квоты запроса , чтобы запросить увеличение квоты для стандартного типа развертывания.
- Используйте диаграммы вдоль стороны страницы , чтобы просмотреть дополнительные сведения об использовании квот. Диаграммы являются интерактивными; Наведите указатель мыши на раздел диаграммы, где отображаются дополнительные сведения, и выбор диаграммы фильтрует список моделей. Выбор условных обозначений диаграммы фильтрует данные, отображаемые на диаграмме.
- Используйте ссылку Provisioned Throughput для просмотра сведений о предварительно подготовленных моделях, включая калькулятор вычисления мощности, который можно использовать для оценки количества PTU, необходимых для вашей рабочей нагрузки.
Примечание
После изменения выделения квоты или отправки запроса изменения могут вступить в силу в течение 15 минут. Обновите страницу квоты, чтобы проверить обновленное распределение.
Устранение неполадок
Если при просмотре или запросе квот возникают проблемы, попробуйте выполнить следующие решения:
| Проблема | Решение |
|---|---|
| Страница квоты пуста или не отображает распределения. | Убедитесь, что у вас есть роль читателя служб Cognitive Services на уровне подписки. Убедитесь, что вы просматриваете правильную подписку на портале. |
| Кнопка "Квота запроса" отключена | Убедитесь, что у вас есть роль владельца или участника в подписке. Некоторые сочетания моделей и регионов могут не поддерживать увеличение квоты. |
| Изменение квоты не отражается после утверждения | Для распространения изменений квот может потребоваться до 15 минут. Обновите страницу Квота. Если проблема сохраняется через 24 часа, обратитесь к поддержка Azure. |
| Не удается найти квоту для конкретной модели | Проверьте региональную доступность. Не все модели доступны во всех регионах. См. раздел поддержки региона. |