Поделиться через


Профили рабочей нагрузки в приложениях-контейнерах Azure

Профиль рабочей нагрузки определяет объем вычислительных ресурсов и ресурсов памяти, доступных для приложений-контейнеров, развернутых в среде.

Профили настроены в соответствии с различными потребностями приложений.

Тип профиля Описание Потенциальное использование
Потребление Автоматически добавляется в любую новую среду. Приложения, которые не требуют конкретных требований к оборудованию
Потребление GPU GPU с автоматическим уменьшением до нуля и без серверов доступны в регионах Запад США 3, Восточная Австралия и Центральная Швеция. Приложения, для которых требуется GPU
Выделенный (общего назначения) Баланс памяти и вычислительных ресурсов Приложения, требующие больших объемов ЦП и (или) памяти
Выделенный (оптимизированный для работы с памятью) Увеличение ресурсов памяти Приложения, которым требуется доступ к большим данным в памяти, моделям машинного обучения в памяти или другим высоким требованиям к памяти
Выделенный (с поддержкой GPU) (предварительный просмотр) GPU, оснащенная увеличенными объемом памяти и вычислительными ресурсами, доступна в регионах Запад США 3 и Северная Европа. Приложения, для которых требуется GPU

Примечание.

При использовании профилей рабочих нагрузок с поддержкой GPU убедитесь, что приложение работает с последней версией CUDA.

Профиль рабочей нагрузки потребления — это профиль по умолчанию, добавленный к каждому типу среды профилей рабочей нагрузки. Вы можете добавить профили потребления рабочей нагрузки GPU для каждого типа GPU. Все профили рабочих нагрузок потребления

  • Автоматическое масштабирование по мере необходимости
  • Может развертывать несколько приложений

В среду можно добавить профили выделенной рабочей нагрузки. Эти возможности позволяют выполнять следующие действия.

  • Использование зарезервированных виртуальных машин для приложений
  • Выберите тип и размер виртуальной машины
  • Развертывание нескольких приложений в каждом профиле
  • Использование автомасштабирования для добавления и удаления экземпляров виртуальных машин в зависимости от потребностей приложений
  • Ограничение масштабирования профиля для повышения затрат на управление

Вы можете настроить каждое из приложений для запуска в любом из профилей рабочей нагрузки, определенных в среде приложений контейнеров. Эта конфигурация идеально подходит для развертывания микрослужб, где каждое приложение может работать в соответствующей вычислительной инфраструктуре.

Примечание.

При первоначальном создании среды можно добавить только профиль выделенной рабочей нагрузки GPU. Графический процессор для задач потребления и другие типы профилей рабочих нагрузок могут быть добавлены позже.

Типы профилей пользователей

Существуют различные типы и размеры профилей рабочей нагрузки, доступные по регионам. По умолчанию каждая среда с включенным профилем рабочей нагрузки включает профиль потребления, но вы также можете добавить любой из следующих профилей:

Отображаемое имя Имя. Виртуальные ЦП Память (ГиБ) GPU (графический процессор) Категория Распределение Имя квоты
Потребление Потребление 4 8 - Потребление за каждую реплику Ядра потребления управляемой среды
Использование GPU—NC24-A100 Использование GPU—NC24-A100 24 220 1 Потребление GPU на реплику Потребление подписки NCA 100 GPU
Использование GPU—NC8as-T4 Использование GPU —NC8as-T4 8 56 1 Энергопотребление GPU за реплику Потребление подписки T 4 ГПУ
Выделенный D4 D4 4 16 - Общего назначения на узел Ядра общего назначения управляемой среды
Выделенный D8 D8 8 32 - Общее назначение на узел Ядра общего назначения управляемой среды
D16 (dedicated) D16 16 64 - Общее назначение на узел Ядра общего назначения управляемой среды
Выделенный D32 D32 32 128 - Общего назначения на узел Ядра управляемой среды общего назначения
Dedicated-E4 E4 4 32 - Оптимизировано для работы с памятью на узел Ядра управляемой среды, оптимизированные для работы с памятью
Выделенный E8 E8 8 64 - Оптимизированные по памяти на узел Ядра, оптимизированные для памяти в управляемой среде
Выделенный E16 E16 16 128 - Оптимизированные по памяти на узел Ядра управляемой среды, оптимизированные для операций в памяти
Выделенный-E32 E32 32 256 - Оптимизация памяти на узел Ядра управляемой среды, оптимизированные для памяти
Dedicated-NC24-A100 (предварительная версия) NC24-A100 двадцать четыре 220 1 С поддержкой графического процессора на узел* Подписка NCA 100 GPU
Dedicated-NC48-A100 (предварительная версия) NC48-A100 48 440 2 Включено использование графического процессора на каждый узел* Подписка NCA 100 GPU
Dedicated-NC96-A100 (предварительная версия) NC96-A100 96 880 4 Включена поддержка GPU на узел* Подписка NCA 100 GPU

* Емкость выделяется в каждом отдельном случае. Отправьте запрос в службу поддержки, чтобы запросить объем емкости, необходимый для приложения.

Примечание.

az containerapp env workload-profile set Команда больше не доступна для выбора профиля рабочей нагрузки. Вместо этого используйте az containerapp env workload-profile add или az containerapp env workload-profile update.

Помимо различных размеров ядра и памяти профили рабочих нагрузок также имеют различные ограничения размера изображения. Чтобы узнать больше об ограничениях размера изображений для контейнерных приложений, см. справочник по оборудованию.

Доступность различных профилей рабочей нагрузки зависит от региона.

Потребление ресурсов

Вы можете ограничить использование памяти и ЦП каждого приложения в профиле рабочей нагрузки, а также запустить несколько приложений в одном экземпляре профиля рабочей нагрузки. Однако общий объем ресурсов, доступных приложению-контейнеру, меньше, чем ресурсы, выделенные для профиля. Разница между выделенными и доступными ресурсами — это объем, зарезервированный средой выполнения контейнерных приложений.

Масштабирование

Если спрос на новые приложения или дополнительные экземпляры существующего приложения превышает текущие ресурсы профиля, добавляются экземпляры приложений.

При этом, если количество необходимых реплик снижается, экземпляры профиля могут быть удалены. У вас есть возможность управлять ограничениями на минимальное и максимальное количество экземпляров профиля.

Azure вычисляет выставление счетов в основном на основе количества запущенных экземпляров профиля.

Сеть

При использовании среды профиля рабочей нагрузки доступны дополнительные сетевые функции, которые полностью защищают входящий и исходящий сетевой трафик (например, определяемые пользователем маршруты). Дополнительные сведения о поддерживаемых сетевых функциях см. в статье "Сети" в среде приложений контейнеров Azure. Для получения инструкций о том, как защитить сеть с помощью контейнерных приложений, см. в разделе "Закрытие среды контейнерного приложения".

Следующие шаги