Серия размеров виртуальных машин подсемейства ND с ускоренной обработкой на GPU

Применимо к: ✔️ виртуальные машины Linux ✔️ виртуальные машины Windows ✔️ гибкие наборы масштабирования ✔️ унифицированные наборы масштабирования

Семейство размерных серий виртуальных машин типа ND — это одна из серий виртуальных машин Azure с ускорением с использованием GPU. Они предназначены для глубокого обучения, исследования ИИ и высокопроизводительных вычислительных задач, которые пользуются мощным ускорением GPU. Оснащенные графическими процессорами NVIDIA, виртуальные машины серии ND предлагают специализированные возможности для обучения и вывода сложных моделей машинного обучения, упрощая более быстрые вычисления и эффективную обработку больших наборов данных. Это делает их особенно хорошо подходит для академических и коммерческих приложений в разработке и имитации ИИ, где передовые технологии GPU важны для достижения быстрых и точных результатов обработки нейронной сети и других вычислительных интенсивных задач.

Рабочие нагрузки и варианты использования

ИИ и глубокое обучение. Виртуальные машины семейства ND идеально подходят для обучения и развертывания сложных моделей глубокого обучения. Оснащенные мощными GPU NVIDIA, они предоставляют вычислительные мощности, необходимые для обучения обширных нейронных сетей с большими наборами данных, значительно сокращая время тренировки.

Высокопроизводительные вычисления (HPC): виртуальные машины семейства ND подходят для приложений HPC, требующих ускорения GPU. Такие области, как научные исследования, моделирование инженерных вычислений (например, динамики вычислительной жидкости) и геномическая обработка могут воспользоваться возможностями вычислений с высокой пропускной способностью виртуальных машин серии ND.

Серия в рамках семьи

Серия ND версии 1

Виртуальные машины серии ND являются новым дополнением к семейству GPU, предназначенным для рабочих нагрузок искусственного интеллекта и глубокого обучения. Они предлагают отличную производительность для обучения и вывода. Экземпляры ND поддерживаются процессорами NVIDIA Tesla P40 и Intel Xeon E5-2690 v4 (Broadwell). Эти экземпляры обеспечивают отличную производительность для операций с одинарной точностью плавающей точки, для рабочих нагрузок ИИ, использующих Microsoft Cognitive Toolkit, TensorFlow, Caffe и другие фреймворки. Серия ND также предлагает гораздо больший размер памяти GPU (24 ГБ), что позволяет соответствовать гораздо большим моделям нейронной сети. Как и в серии NC, серия ND предлагает конфигурацию со вторичной низкой задержкой, сетью высокой пропускной способности через RDMA и подключение InfiniBand, чтобы вы могли выполнять крупномасштабные задания обучения, охватывающие множество GPU.

Просмотрите полную страницу серии ND.

Часть	Количество ^{Подсчет единиц}	Технические характеристики ^{Идентификатор SKU, единицы производительности и т. д.}
Процессор	6 — 24 виртуальных ЦП	Intel Xeon E5-2690 v4 (Broadwell) [x86-64]
Память	112 - 448 ГиБ
Локальное хранилище	1 диск	736 - 2948 ГиБ
Удаленное хранилище	12 — 32 диска	20000 – 80000 операций ввода-вывода в секунду 200 – 800 МБИТ/с
Сеть	4 – 8 сетевых адаптеров
Ускорители	1 – 4 GPU	Nvidia Tesla P40 GPU (24 ГБ)

Серия NDv2

Виртуальная машина серии NDv2 — это новое дополнение к семейству GPU, предназначенное для потребностей самых требовательных рабочих нагрузок ИИ, машинного обучения, моделирования и HPC.

NDv2 работает на 8 графических процессорах NVIDIA Tesla V100, подключенных к NVLINK, каждый из которых имеет 32 ГБ памяти GPU. Каждая виртуальная машина NDv2 также имеет 40 ядер Intel Xeon Platinum 8168 (Skylake) и 672 ГиБ системной памяти.

Экземпляры NDv2 обеспечивают отличную производительность для рабочих нагрузок HPC и ИИ, использующих вычислительные ядра, оптимизированные для графических процессоров CUDA, и многочисленных инструментов ИИ, машинного обучения и аналитики, поддерживающих ускорение GPU из коробки, таких как TensorFlow, Pytorch, Caffe, RAPIDS и другие фреймворки.

Крайне важно, что NDv2 разработан для интенсивных вычислительных рабочих нагрузок с масштабированием: от использования 8 GPU в каждой виртуальной машине до объединения нескольких виртуальных машин. Серия NDv2 теперь поддерживает 100-гигабитную сетевую инфраструктуру InfiniBand EDR, аналогичную той, которая доступна в серии виртуальных машин HB HPC, чтобы обеспечить высокопроизводительную кластеризацию для параллельных сценариев, включая распределенное обучение для искусственного интеллекта и машинного обучения. Эта серверная сеть поддерживает все основные протоколы InfiniBand, в том числе те, которые используются библиотеками NCCL2 NVIDIA, что позволяет обеспечить простое кластеризация gpu.

Просмотр полной страницы серии NDv2

Часть	Количество ^{Подсчет единиц}	Технические характеристики ^{Идентификатор SKU, единицы производительности и т. д.}
Процессор	40 виртуальных ЦП	Intel Xeon Platinum 8168 (Skylake) [x86-64]
Память	672 Гиб
Локальное хранилище	1 диск	2948 ГиБ
Удаленное хранилище	32 диска	80000 операций ввода-вывода в секунду 800 МБИТ/с
Сеть	8 сетевых адаптеров	24000 Мбит/с
Ускорители	8

серия ND_A100_v4

Виртуальная машина серии ND A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Эти конфигурации предназначены для высокопроизводительного обучения глубоких нейронных сетей и тесно связанных с масштабируемыми вглубь и вширь рабочими нагрузками HPC.

Серия ND A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 40 ГБ Tensor Core. Развертывания на основе ND A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждому графическому процессору в виртуальной машине предоставляется собственное выделенное соединение NVIDIA Mellanox HDR InfiniBand с пропускной способностью 200 ГБ/с, не зависящее от топологии. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин Azure, и поддерживают GPU Direct RDMA.

Каждый GPU включает подключение NVLINK 3.0 для взаимодействия в виртуальной машине с 96 физическими 2-го поколения AMD Epyc™ 7V12 (Рим) ядрами ЦП.

Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживает большой набор существующих инструментов для искусственного интеллекта и высокопроизводительных вычислений (HPC), созданных на основе библиотек коммуникации NVIDIA NCCL версии 2 для бесшовной кластеризации GPU.

Просмотрите полную страницу серии ND_A100_v4.

Часть	Количество ^{Подсчет единиц}	Технические характеристики ^{Идентификатор SKU, единицы производительности и т. д.}
Процессор	96 виртуальных ЦП	AMD EPYC 7V12 (Рим) [x86-64]
Память	900 ГиБ
Локальное хранилище	1 диск	6000 ГиБ
Удаленное хранилище	32 диска	80000 операций ввода-вывода в секунду 800 МБИТ/с
Сеть	8 сетевых адаптеров	24000 Мбит/с
Ускорители	8 GPU	Nvidia A100 GPU (40 ГБ)

серия "NDm_A100_v4"

Виртуальная машина серии NDm A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Эти конфигурации предназначены для высокопроизводительного обучения глубоких нейронных сетей и тесно связанных с масштабируемыми вглубь и вширь рабочими нагрузками HPC.

Серия NDm A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 80 ГБ Tensor Core. Развертывания NDm A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждому графическому процессору в виртуальной машине предоставляется собственное выделенное соединение NVIDIA Mellanox HDR InfiniBand с пропускной способностью 200 ГБ/с, не зависящее от топологии. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин Azure, и поддерживают GPU Direct RDMA.

Просмотрите полную страницу серии NDm_A100_v4.

Часть	Количество ^{Подсчет единиц}	Технические характеристики ^{Идентификатор SKU, единицы производительности и т. д.}
Процессор	96 виртуальных ЦП	AMD EPYC 7V12 (Рим) [x86-64]
Память	1900 ГиБ
Локальное хранилище	1 диск	6400 ГиБ
Удаленное хранилище	32 диска	80000 операций ввода-вывода в секунду 800 МБИТ/с
Сеть	8 сетевых адаптеров	24000 Мбит/с
Ускорители	8 GPU	Nvidia A100 GPU (80 ГБ)

серия ND_H100_v5

Виртуальная машина серии ND H100 v5 — это новое флагманское дополнение к семейству GPU Azure. Эта серия предназначена для высококлассного обучения в области глубокого обучения и тесно интегрирована с задачами генеративного ИИ и высокопроизводительных вычислений (HPC), требующими масштабирования вверх и вширь.

Серия ND H100 v5 начинается с одной виртуальной машины и восьми gpu NVIDIA H100 Tensor Core. Развертывания на основе ND H100 версии 5 могут масштабироваться до тысяч GPU с 3,2 ТБ пропускной способности взаимодействия на каждую виртуальную машину. Каждая графическая карта (GPU) внутри виртуальной машины получает собственное выделенное соединение InfiniBand NVIDIA Quantum-2 CX7 с пропускной способностью 400 Гбит/с, не зависящее от топологии. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин, и поддерживают GPU Direct RDMA.

Каждый GPU включает подключение NVLINK 4.0 для обмена данными на виртуальной машине, а экземпляр имеет 96 физических четвертых ядер процессора Intel Xeon Scalable.

Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, масштабируемый интерконнект InfiniBand поддерживает большой набор существующих средств искусственного интеллекта и высокопроизводительных вычислений (HPC), созданных на основе библиотек коммуникации NVIDIA NCCL для бесшовной кластеризации GPU.

Просмотрите полную страницу серии ND_H100_v5.

Часть	Количество ^{Подсчет единиц}	Технические характеристики ^{Идентификатор SKU, единицы производительности и т. д.}
Процессор	96 виртуальных ЦП	Intel Xeon (Sapphire Rapids) [x86-64]
Память	1900 ГиБ
Локальное хранилище	1 диск	1024 ГиБ
Удаленное хранилище	32Disks
Сеть	8 сетевых адаптеров
Ускорители	8 GPU	Nvidia H100 GPU (80 ГБ)

серия ND_MI300X_v5

Виртуальная машина серии ND MI300X версии 5 — это новое флагманское дополнение к семейству GPU Azure. Она была разработана для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC.

Виртуальная машина серии ND MI300X v5 включает в себя восемь графических процессоров AMD Instinct MI300 и два процессора Intel Xeon Scalable четвёртого поколения, всего 96 физических ядер. Каждая GPU в виртуальной машине затем подключается друг к другу через ссылки четвертого поколения AMD Infinity Fabric с пропускной способностью 128 ГБ/с на GPU и агрегированной пропускной способностью 896 ГБ/с.

Развертывания на основе ND MI300X версии 5 могут масштабироваться до тысяч gpu с пропускной способностью 3,2 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждая графическая карта (GPU) внутри виртуальной машины получает собственное выделенное соединение InfiniBand NVIDIA Quantum-2 CX7 с пропускной способностью 400 Гбит/с, не зависящее от топологии. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA.

Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch и другие платформы. Кроме того, масштабируемое межсоединение InfiniBand поддерживает большой набор существующих средств ИИ и HPC, созданных на базе библиотеки ROCm Communication Collectives (RCCL) AMD для бесперебойной кластеризации GPU.

Просмотрите полную страницу серии ND_MI300X_v5.

Часть	Количество ^{Подсчет единиц}	Технические характеристики ^{Идентификатор SKU, единицы производительности и т. д.}
Процессор	96 виртуальных ЦП	Intel Xeon (Sapphire Rapids) [x86-64]
Память	1850 ГиБ
Локальное хранилище	1 Временный диск 8 дисков NVMe	1000 ГиБ временный диск Диски NVMe 28000 ГиБ
Удаленное хранилище	16 дисков	80000 операций ввода-вывода в секунду 1200 Мбит/с
Сеть	8 сетевых адаптеров
Ускорители	8 GPU	AMD Instinct MI300X GPU (192 ГБ)

Серия семейств ND предыдущего поколения

Для получения сведений о старых размерах см. размеры предыдущего поколения.

Прочая информация о размере

Список всех доступных размеров: размеры

Калькулятор цен: Калькулятор цен

Сведения о типах дисков: типы дисков

Дальнейшие шаги

Воспользуйтесь новейшими функциями и производительностью, доступными для рабочих нагрузок, изменив размер виртуальной машины.

Используйте встроенные процессоры ARM корпорации Майкрософт с виртуальными машинами Azure Cobalt.

Узнайте, как отслеживать виртуальные машины Azure.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2025-04-30