Поделиться через


Профили рабочей нагрузки в приложениях-контейнерах Azure

Профиль рабочей нагрузки определяет объем вычислительных ресурсов и ресурсов памяти, доступных для приложений-контейнеров, развернутых в среде.

Профили настроены в соответствии с различными потребностями приложений.

Тип профиля Описание Потенциальное использование
Потребление Автоматически добавляется в любую новую среду. Приложения, которые не требуют конкретных требований к оборудованию
Потребление GPU GPU с автоматическим уменьшением до нуля и без серверов доступны в регионах Запад США 3, Восточная Австралия и Центральная Швеция. Приложения, для которых требуется GPU
Выделенный (общего назначения) Баланс памяти и вычислительных ресурсов Приложения, требующие больших объемов ЦП и (или) памяти
Выделенный (оптимизированный для работы с памятью) Увеличение ресурсов памяти Приложения, которым требуется доступ к большим данным в памяти, моделям машинного обучения в памяти или другим высоким требованиям к памяти
Выделенный (с поддержкой GPU) GPU, оснащенная увеличенными объемом памяти и вычислительными ресурсами, доступна в регионах Запад США 3 и Северная Европа. Приложения, для которых требуется GPU

Примечание.

При использовании профилей рабочих нагрузок с поддержкой GPU убедитесь, что приложение работает с последней версией CUDA.

Профиль рабочей нагрузки потребления — это профиль по умолчанию, добавленный к каждому типу среды профилей рабочей нагрузки. Вы можете добавить профили потребления рабочей нагрузки GPU для каждого типа GPU. Все профили рабочих нагрузок потребления

  • Автоматическое масштабирование по мере необходимости
  • Может развертывать несколько приложений

В среду можно добавить профили выделенной рабочей нагрузки. Эти возможности позволяют выполнять следующие действия.

  • Использование зарезервированных виртуальных машин для приложений
  • Выберите тип и размер виртуальной машины
  • Развертывание нескольких приложений в каждом профиле
  • Использование автомасштабирования для добавления и удаления экземпляров виртуальных машин в зависимости от потребностей приложений
  • Ограничение масштабирования профиля для повышения затрат на управление

Вы можете настроить каждое из приложений для запуска в любом из профилей рабочей нагрузки, определенных в среде приложений контейнеров. Эта конфигурация идеально подходит для развертывания микрослужб, где каждое приложение может работать в соответствующей вычислительной инфраструктуре.

Примечание.

При первоначальном создании среды можно добавить только профиль выделенной рабочей нагрузки GPU. Графический процессор для задач потребления и другие типы профилей рабочих нагрузок могут быть добавлены позже.

Типы профилей пользователей

Существуют различные типы и размеры профилей рабочей нагрузки, доступные по регионам. По умолчанию каждая среда с включенным профилем рабочей нагрузки включает профиль потребления, но вы также можете добавить любой из следующих профилей:

Отображаемое имя Имя. Виртуальные ЦП Память (ГиБ) GPU (графический процессор) Категория Распределение Имя квоты
Потребление Потребление 4 8 - Потребление за каждую реплику Ядра потребления управляемой среды
Использование GPU—NC24-A100 Использование GPU—NC24-A100 двадцать четыре 220 1 Потребление GPU за каждую реплику Потребление подписки NCA 100 GPU
Использование GPU—NC8as-T4 Использование GPU—NC8as-T4 8 56 1 Потребление GPU за каждую реплику Потребление подписки T 4 ГПУ
Выделенный D4 D4 4 16 - Общего назначения на узел Ядра общего назначения управляемой среды
Выделенный D8 D8 8 32 - Общего назначения на узел Ядра общего назначения управляемой среды
D16 (dedicated) D16 16 64 - Общего назначения на узел Ядра общего назначения управляемой среды
Выделенный D32 D32 32 128 - Общего назначения на узел Ядра общего назначения управляемой среды
Dedicated-E4 E4 4 32 - Оптимизировано для работы с памятью на узел Ядра управляемой среды, оптимизированные для работы с памятью
Выделенный E8 E8 8 64 - Оптимизировано для работы с памятью на узел Ядра управляемой среды, оптимизированные для работы с памятью
Выделенный E16 E16 16 128 - Оптимизировано для работы с памятью на узел Ядра управляемой среды, оптимизированные для работы с памятью
Выделенный-E32 E32 32 256 - Оптимизировано для работы с памятью на узел Ядра управляемой среды, оптимизированные для работы с памятью
ВыделенныеNC24-A100 NC24-A100 двадцать четыре 220 1 С поддержкой графического процессора на узел* Подписка NCA 100 GPU
ВыделенныеNC48-A100 NC48-A100 48 440 2 С поддержкой графического процессора на узел* Подписка NCA 100 GPU
ВыделенныеNC96-A100 NC96-A100 96 880 4 С поддержкой графического процессора на узел* Подписка NCA 100 GPU

* Емкость выделяется в каждом отдельном случае. Отправьте запрос в службу поддержки, чтобы запросить объем емкости, необходимый для приложения.

Примечание.

az containerapp env workload-profile set Команда больше не доступна для выбора профиля рабочей нагрузки. Вместо этого используйте az containerapp env workload-profile add или az containerapp env workload-profile update.

Помимо различного размера ядра и размера памяти, каждому профилю рабочей нагрузки выделяется разный размер хранилища. Это выделенное пространство используется для среды выполнения. Не используйте это хранилище для данных приложения. Вместо этого используйте подключение хранилища.

Доступность различных профилей рабочей нагрузки зависит от региона.

Потребление ресурсов

Вы можете ограничить использование памяти и ЦП каждого приложения в профиле рабочей нагрузки, а также запустить несколько приложений в одном экземпляре профиля рабочей нагрузки. Однако общий объем ресурсов, доступных приложению-контейнеру, меньше, чем ресурсы, выделенные для профиля. Разница между выделенными и доступными ресурсами — это объем, зарезервированный средой выполнения контейнерных приложений.

Масштабирование

Если спрос на новые приложения или дополнительные экземпляры существующего приложения превышает текущие ресурсы профиля, добавляются экземпляры приложений.

При этом, если количество необходимых реплик снижается, экземпляры профиля могут быть удалены. У вас есть возможность управлять ограничениями на минимальное и максимальное количество экземпляров профиля.

Azure вычисляет выставление счетов в основном на основе количества запущенных экземпляров профиля.

Сеть

При использовании среды профиля рабочей нагрузки доступны дополнительные сетевые функции, которые полностью защищают входящий и исходящий сетевой трафик (например, определяемые пользователем маршруты). Дополнительные сведения о поддерживаемых сетевых функциях см. в статье "Сети" в среде приложений контейнеров Azure. Для получения инструкций о том, как защитить сеть с помощью контейнерных приложений, см. в разделе "Закрытие среды контейнерного приложения".

Следующие шаги