Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Секционирование GPU позволяет совместно использовать физическое устройство GPU с несколькими виртуальными машинами (виртуальными машинами). Благодаря секционированию GPU или виртуализации GPU каждая виртуальная машина получает не весь GPU, а его выделенную часть.
Функция секционирования GPU использует интерфейс виртуализации единого корневого ввода-вывода (SR-IOV), который предоставляет аппаратно-поддерживаемую границу безопасности с прогнозируемой производительностью для каждой виртуальной машины. Каждая виртуальная машина может получить доступ только к ресурсам GPU, выделенным для них, и безопасное аппаратное секционирование предотвращает несанкционированный доступ к другим виртуальным машинам.
Начиная с Windows Server 2025, динамическая миграция поддерживается с секционированием GPU, что обеспечивает большую гибкость для управления виртуальными машинами. Чтобы использовать динамическую миграцию с секционированием GPU, убедитесь, что настройка соответствует требованиям, описанным в этой статье. Динамическая миграция позволяет перемещать виртуальные машины между узлами без простоя, что является важным для обслуживания и балансировки нагрузки в рабочей среде.
Эта функция позволяет выполнять запланированные миграции виртуальных машин при сохранении выделения ресурсов GPU, обеспечивая минимальное время простоя и согласованную производительность.
Секционирование GPU предназначено для автономных серверов. Вы можете перенести виртуальные машины между автономными узлами для запланированного простоя; Однако для клиентов, которым требуется кластеризация для незапланированного простоя, необходимо использовать Центр обработки данных Windows Server 2025.
Когда следует использовать секционирование GPU
Некоторые рабочие нагрузки, такие как инфраструктура виртуальных рабочих столов (VDI), искусственный интеллектуальный интеллект (ИИ) и Машинное обучение (МАШИНное обучение), требуют ускорения GPU, секционирование GPU может помочь сократить общую стоимость владения для всей инфраструктуры.
Рассмотрим пример.
Приложения VDI: распределенные пограничные клиенты выполняют базовые приложения для повышения производительности, такие как Microsoft Office и рабочие нагрузки визуализации с высокой интенсивностью графики в средах VDI, для которых требуется ускорение GPU. Для таких рабочих нагрузок можно достичь требуемого ускорения GPU с помощью секционирования DDA или GPU. С помощью секционирования GPU можно создать несколько секций и назначить каждую секцию виртуальной машине, в которой размещена среда VDI. Секционирование GPU помогает достичь требуемой плотности и масштабировать количество поддерживаемых пользователей по порядку величины.
Вывод с машинным обучением: клиенты в розничных магазинах и производственных заводах могут выполнять вывод на границе, что требует поддержки GPU для своих серверов. С помощью GPU на серверах можно запускать модели машинного обучения, чтобы получить быстрые результаты, которые можно выполнить до отправки данных в облако. Система при необходимости может передать полный набор данных для продолжения обучения и совершенствования ваших моделей машинного обучения. Наряду с DDA, где вы выделяете весь физический GPU виртуальной машине, секционирование GPU позволяет одновременно запускать несколько приложений вывода на одном GPU, но в отдельных аппаратных секциях, максимизируя использование GPU.
Requirements
Чтобы использовать секционирование GPU с динамической миграцией, необходимо иметь поддерживаемую ЦП, операционную систему и GPU. В следующих разделах описаны требования.
Требования к ЦП
Узлы кластера должны иметь процессоры с поддержкой отслеживания битов DMA и управления памятью с помощью модуля управления входными/выходными операциями памяти (IOMMU). Например, процессоры, поддерживающие Intel VT-D или AMD-Vi. Если вы используете Windows Server и динамическую миграцию без процессоров с поддержкой IOMMU, виртуальные машины автоматически перезапускаются, где доступны ресурсы GPU.
Примеры процессоров, поддерживающих отслеживание битов IOMMU DMA, включают:
- AMD EPYC 7002 и более поздних версий (Милан)
- 4-го поколения Intel Xeon SP (Sapphire Rapids)
Поддерживаемые операционные системы на виртуальной машине
Секционирование GPU в Windows Server 2025 и более поздних версиях поддерживает следующие гостевые операционные системы:
- Windows 10 или более поздняя версия
- Windows 10 Корпоративная нескольких сеансов или более поздних версий
- Windows Server 2019 или более поздней версии;
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
Поддерживаемые графические процессоры
Следующие GPU поддерживают секционирование GPU.
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Чтобы использовать динамическую миграцию с секционированием GPU, необходимо использовать драйвер, включенный в программное обеспечение NVIDIA vGPU версии 18.x или более поздней версии. Драйвер NVIDIA обеспечивает необходимую поддержку секционирования и динамической миграции GPU.
Мы рекомендуем работать с партнерами изготовителя оборудования (OEM) для планирования и заказа систем, адаптированных к рабочим нагрузкам. Кроме того, обратитесь к независимым поставщикам оборудования GPU (IHV), чтобы убедиться, что у вас есть соответствующие конфигурации и необходимое программное обеспечение для настройки. Тем не менее, мы поддерживаем больше GPU, если вы хотите использовать ускорение GPU с помощью дискретного назначения устройств (DDA). Обратитесь к партнерам oem и IHV, чтобы получить список gpu, поддерживающих DDA. Дополнительные сведения об использовании ускорения GPU с помощью DDA см. в разделе "Дискретное назначение устройств" (DDA).
Для повышения производительности рекомендуется создать однородную конфигурацию для gpu на всех серверах в кластере. Однородная конфигурация состоит из установки одной и той же модели gpu и настройки одного количества секций в GPU на всех серверах кластера. Например, в кластере двух серверов с одним или несколькими графическими процессорами все графические процессоры должны иметь одинаковый размер, модель и размер. Количество секций на каждом GPU также должно соответствовать.
Limitations
При использовании функции секционирования GPU следует учитывать следующие ограничения:
Секционирование GPU не поддерживается, если конфигурация не является однородной. Ниже приведены некоторые примеры неподдерживаемых конфигураций:
Сочетание gpu от разных поставщиков в одном кластере.
Использование различных моделей GPU из разных семейств продуктов от одного поставщика в одном кластере.
Вы не можете назначить физический GPU как дискретное назначение устройств (DDA) или секционируемый GPU. Его можно назначить как DDA или как секционируемый GPU, но не оба.
Если назначить виртуальной машине несколько секций GPU, каждая секция будет отображаться в виде другого GPU.
Секции автоматически назначены виртуальным машинам. Для определенной виртуальной машины нельзя выбрать определенную секцию.
Вы можете секционирование GPU с помощью Центра администрирования Windows или PowerShell. Рекомендуется использовать Windows Admin Center для настройки и назначения секций GPU. Windows Admin Center автоматически проверяет однородную конфигурацию gpu на всех серверах кластера. Он предоставляет соответствующие предупреждения и ошибки для принятия любых необходимых действий по исправлению.
При использовании PowerShell для включения секционирования GPU необходимо выполнить те же действия конфигурации на каждом сервере в кластере. Необходимо вручную убедиться, что однородная конфигурация поддерживается для gpu на всех серверах в кластере.
При динамической миграции виртуальной машины с назначенным разделом GPU миграция Hyper-V автоматически возвращается к использованию TCP/IP с сжатием. Перенос виртуальной машины может привести к увеличению использования ЦП узла. Кроме того, динамические миграции могут занять больше времени, чем виртуальные машины без присоединенных секций GPU.
Связанный контент
Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах: