Управление и увеличение квот для ресурсов концентратора (классическая модель)

Применяется только к:Портал Foundry (классический). Эта статья недоступна для нового портала Foundry. Дополнительные сведения о новом портале.

Примечание

Содержание в новой документации Microsoft Foundry может открываться по ссылкам в этой статье вместо документации Foundry (классической версии), которую вы просматриваете сейчас.

Важно

Эта статья предоставляет устаревшую поддержку для проектов на основе концентраторов. Он не будет работать для проектов Foundry. Узнайте , какой у меня тип проекта?

примечание о совместимости SDK. Для примеров кода требуется определенная версия пакета SDK для Foundry Microsoft. При возникновении проблем совместимости рассмотрите возможность миграции из концентратора в проект Foundry.

Совет

Доступна статья о альтернативных квотах, посвященная проектам Foundry. Дополнительные сведения см. в управлении и увеличении квот для ресурсов с помощью Microsoft Foundry.

В этой статье показано, как просмотреть текущие распределения квот и подавать запросы на их увеличение для ресурсов узлового уровня в Foundry. Квоты применяются к виртуальным машинам и развертываниям моделей и позволяют управлять ограничениями скорости между развертываниями в подписке.

Необходимые условия

Чтобы просмотреть квоты и управлять ими, вам потребуется:

  • Подписка Azure с активным ресурсом Центра Foundry. Если у вас нет одного, см. раздел How to create and manage a Microsoft Foundry Hub.
  • Доступ к порталу Foundry с соответствующими разрешениями. Вам потребуется одна из следующих ролей управления доступом к Azure на основе ролей (RBAC):
    • Роль владельца или участника в подписке для запроса увеличения квоты
    • Роль читателя для просмотра текущих выделений квот
  • Для управления квотами вычислений убедитесь, что у вас есть необходимые разрешения в рабочей области Машинное обучение Azure, связанной с центром.

Особые соображения

Квоты применяются для каждой подписки и для каждого региона. Квота запроса увеличивается отдельно для каждой подписки и региона.

Квота является кредитным ограничением, а не гарантией емкости. Для крупномасштабных потребностей в емкости обратитесь к поддержка Azure.

Примечание

Вычислительные ресурсы Foundry имеют отдельную квоту от основной квоты вычислительных ресурсов.

Ограничения по умолчанию зависят от категории предложений, таких как бесплатная пробная версия, развертывание бессерверного API и серия виртуальных машин.

Квота фабрики

Следующие действия на портале расходуют квоту:

  • Создание вычислительного экземпляра
  • Создание векторного индекса
  • Развертывание открытых моделей из каталога моделей

Вычисления Foundry

Вычисление Foundry имеет ограничения по умолчанию на ядра и уникальные вычислительные ресурсы в каждом регионе.

  • Квота ядер разделена по семейству виртуальных машин и совокупному количеству ядер.
  • Уникальные квоты вычислительных ресурсов разделены.

Чтобы увеличить ограничения, запросите увеличение квоты.

Доступные ресурсы:

  • Выделенные ядра для каждого региона: по умолчанию используется значение 24–300 (зависит от подписки). Специализированные семейства GPU по умолчанию могут быть 0.
  • Общее количество вычислительных ресурсов в каждом регионе: по умолчанию — 500. Его можно увеличить до 2500. Это ограничение совместно используется между вычислительными экземплярами и развертываниями управляемых сетевых конечных точек.

Чтобы увеличить общий предел вычислений за пределами 2500, отправьте запрос на поддержку, перейдя в Help + поддержку на портале Azure:

  1. Для типа проблемы выберите Technical.
  2. Выберите подписку.
  3. Для типа Service выберите Машинное обучение.
  4. Выберите ресурс.
  5. Введите "Увеличить общий объем вычислительных ресурсов".
  6. Для типа проблемы выберите экземпляр вычислений.
  7. Для подтипа проблемы выберите другие функции (скрипты установки, завершение работы, удостоверение и т. д.)).
  8. Укажите дополнительные сведения и отправьте запрос.

Скриншот страницы для отправки запросов квоты вычислений на портале Azure.

Просмотр и запрос квот на портале Foundry

Используйте квоты для управления квотами вычислений и моделей в рамках одной подписки. По умолчанию все центры совместно используют квоту семейства виртуальных машин уровня подписки. Для детализированного управления можно задать максимальную квоту для семейства виртуальных машин.

  1. На портале Foundry выберите центр управления.

  2. Выберите квоту.

    Снимок экрана со ссылкой на центр управления.

  3. Разверните группы для просмотра развертываний моделей и их сведений.

    Снимок экрана записи квоты в разделе Центр управления.

    Снимок экрана: страница квоты модели на портале Foundry с одним из развернутых групп.

  4. Управление квотами с помощью следующих параметров:

    • Выберите переключатель "Показать все квоты ", чтобы отобразить все квоты или только выделенные квоты.
    • Выберите Группировка, чтобы изменить варианты группировки (тип квоты, регион, модель или плоское представление).
    • Щелкните значок карандаша, чтобы изменить выделение для определенной квоты.
    • Выберите ссылку Запрос квоты, чтобы запросить увеличение квоты для стандартных развертываний.
    • Используйте интерактивные диаграммы для просмотра аналитических сведений об использовании.
    • Выберите ссылку предоставленной пропускной способности, чтобы открыть сведения о ППУ и калькулятор емкости.
  5. Выберите ссылку квоты виртуальной машины , чтобы просмотреть квоту и использование семейства виртуальных машин в регионе, а также запросить дополнительную квоту для выбранного семейства.

    Совет

    Если отсутствует ссылка на квоту виртуальной машины, вы находитесь в представлении проекта Foundry. Используйте все ресурсы , а затем выберите проект типа концентратора и вернитесь в центр управления.

    Снимок экрана: страница квоты виртуальной машины на портале Foundry.

Дополнительные сведения о квоте

Экземпляры контейнеров

Для получения информации о квотах ограничений Экземпляры контейнеров см. в разделе Ограничения Экземпляры контейнеров

Хранение

служба хранилища Azure имеет ограничение в 250 учетных записей хранения для каждого региона на одну подписку (стандартная и премиум).

Общая квота для тестирования

Общая квота предоставляет региональный пул для временного тестирования с моделями литейного обучения. Используйте общую квоту только для временных тестовых конечных точек. Для нагрузок в производственной среде запрашивайте выделенную квоту. Выставление счетов основано на использовании.

Устранение неполадок

Если при просмотре или запросе квот возникают проблемы, попробуйте выполнить следующие решения:

Проблема Решение
Отсутствует ссылка на квоту виртуальной машины Убедитесь, что вы просматриваете главный ресурс, а не проект Foundry. На портале используйте Все ресурсы, выберите ресурс типа концентратора и вернитесь к центру управления>квоте.
Запрос на увеличение квоты был отклонен Проверьте, поддерживает ли ваша подписка запрошенную квоту в вашем регионе. Некоторые семейства виртуальных машин и регионы имеют разные ограничения по умолчанию и максимальные. Обратитесь к поддержка Azure для доступности для конкретного региона.
Не удается просмотреть выделение квот Убедитесь, что у вас есть как минимум роль читателя в подписке. Проверьте, просматриваете ли вы правильную подписку на портале.
Увеличение квоты не отражается после утверждения Для распространения изменений квот может потребоваться до 15 минут. Обновите страницу квоты на портале. Если проблема сохраняется через 24 часа, обратитесь к поддержка Azure.
Не удается запросить квоту за пределами 2500 для вычислений Используйте процесс запроса поддержки, описанный в разделе вычислений Foundry, а не стандартного интерфейса запроса квоты.

Для получения дополнительной помощи обратитесь к поддержка Azure.