Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Применимо к: ✔️ виртуальные машины Linux ✔️ виртуальные машины Windows ✔️ гибкие наборы масштабирования ✔️ унифицированные наборы масштабирования
Семейство размерных серий виртуальных машин типа ND — это одна из серий виртуальных машин Azure с ускорением с использованием GPU. Они предназначены для глубокого обучения, исследования ИИ и высокопроизводительных вычислительных задач, которые пользуются мощным ускорением GPU. Оснащенные графическими процессорами NVIDIA, виртуальные машины серии ND предлагают специализированные возможности для обучения и вывода сложных моделей машинного обучения, упрощая более быстрые вычисления и эффективную обработку больших наборов данных. Это делает их особенно хорошо подходит для академических и коммерческих приложений в разработке и имитации ИИ, где передовые технологии GPU важны для достижения быстрых и точных результатов обработки нейронной сети и других вычислительных интенсивных задач.
Рабочие нагрузки и варианты использования
ИИ и глубокое обучение. Виртуальные машины семейства ND идеально подходят для обучения и развертывания сложных моделей глубокого обучения. Оснащенные мощными GPU NVIDIA, они предоставляют вычислительные мощности, необходимые для обучения обширных нейронных сетей с большими наборами данных, значительно сокращая время тренировки.
Высокопроизводительные вычисления (HPC): виртуальные машины семейства ND подходят для приложений HPC, требующих ускорения GPU. Такие области, как научные исследования, моделирование инженерных вычислений (например, динамики вычислительной жидкости) и геномическая обработка могут воспользоваться возможностями вычислений с высокой пропускной способностью виртуальных машин серии ND.
Серия в рамках семьи
Серия ND версии 1
Виртуальные машины серии ND являются новым дополнением к семейству GPU, предназначенным для рабочих нагрузок искусственного интеллекта и глубокого обучения. Они предлагают отличную производительность для обучения и вывода. Экземпляры ND поддерживаются процессорами NVIDIA Tesla P40 и Intel Xeon E5-2690 v4 (Broadwell). Эти экземпляры обеспечивают отличную производительность для операций с одинарной точностью плавающей точки, для рабочих нагрузок ИИ, использующих Microsoft Cognitive Toolkit, TensorFlow, Caffe и другие фреймворки. Серия ND также предлагает гораздо больший размер памяти GPU (24 ГБ), что позволяет соответствовать гораздо большим моделям нейронной сети. Как и в серии NC, серия ND предлагает конфигурацию со вторичной низкой задержкой, сетью высокой пропускной способности через RDMA и подключение InfiniBand, чтобы вы могли выполнять крупномасштабные задания обучения, охватывающие множество GPU.
Просмотрите полную страницу серии ND.
Часть | Количество Подсчет единиц |
Технические характеристики Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 6 — 24 виртуальных ЦП | Intel Xeon E5-2690 v4 (Broadwell) [x86-64] |
Память | 112 - 448 ГиБ | |
Локальное хранилище | 1 диск | 736 - 2948 ГиБ |
Удаленное хранилище | 12 — 32 диска | 20000 – 80000 операций ввода-вывода в секунду 200 – 800 МБИТ/с |
Сеть | 4 – 8 сетевых адаптеров | |
Ускорители | 1 – 4 GPU | Nvidia Tesla P40 GPU (24 ГБ) |
Серия NDv2
Виртуальная машина серии NDv2 — это новое дополнение к семейству GPU, предназначенное для потребностей самых требовательных рабочих нагрузок ИИ, машинного обучения, моделирования и HPC.
NDv2 работает на 8 графических процессорах NVIDIA Tesla V100, подключенных к NVLINK, каждый из которых имеет 32 ГБ памяти GPU. Каждая виртуальная машина NDv2 также имеет 40 ядер Intel Xeon Platinum 8168 (Skylake) и 672 ГиБ системной памяти.
Экземпляры NDv2 обеспечивают отличную производительность для рабочих нагрузок HPC и ИИ, использующих вычислительные ядра, оптимизированные для графических процессоров CUDA, и многочисленных инструментов ИИ, машинного обучения и аналитики, поддерживающих ускорение GPU из коробки, таких как TensorFlow, Pytorch, Caffe, RAPIDS и другие фреймворки.
Крайне важно, что NDv2 разработан для интенсивных вычислительных рабочих нагрузок с масштабированием: от использования 8 GPU в каждой виртуальной машине до объединения нескольких виртуальных машин. Серия NDv2 теперь поддерживает 100-гигабитную сетевую инфраструктуру InfiniBand EDR, аналогичную той, которая доступна в серии виртуальных машин HB HPC, чтобы обеспечить высокопроизводительную кластеризацию для параллельных сценариев, включая распределенное обучение для искусственного интеллекта и машинного обучения. Эта серверная сеть поддерживает все основные протоколы InfiniBand, в том числе те, которые используются библиотеками NCCL2 NVIDIA, что позволяет обеспечить простое кластеризация gpu.
Просмотр полной страницы серии NDv2
Часть | Количество Подсчет единиц |
Технические характеристики Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 40 виртуальных ЦП | Intel Xeon Platinum 8168 (Skylake) [x86-64] |
Память | 672 Гиб | |
Локальное хранилище | 1 диск | 2948 ГиБ |
Удаленное хранилище | 32 диска | 80000 операций ввода-вывода в секунду 800 МБИТ/с |
Сеть | 8 сетевых адаптеров | 24000 Мбит/с |
Ускорители | 8 |
серия ND_A100_v4
Виртуальная машина серии ND A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Эти конфигурации предназначены для высокопроизводительного обучения глубоких нейронных сетей и тесно связанных с масштабируемыми вглубь и вширь рабочими нагрузками HPC.
Серия ND A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 40 ГБ Tensor Core. Развертывания на основе ND A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждому графическому процессору в виртуальной машине предоставляется собственное выделенное соединение NVIDIA Mellanox HDR InfiniBand с пропускной способностью 200 ГБ/с, не зависящее от топологии. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин Azure, и поддерживают GPU Direct RDMA.
Каждый GPU включает подключение NVLINK 3.0 для взаимодействия в виртуальной машине с 96 физическими 2-го поколения AMD Epyc™ 7V12 (Рим) ядрами ЦП.
Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживает большой набор существующих инструментов для искусственного интеллекта и высокопроизводительных вычислений (HPC), созданных на основе библиотек коммуникации NVIDIA NCCL версии 2 для бесшовной кластеризации GPU.
Просмотрите полную страницу серии ND_A100_v4.
Часть | Количество Подсчет единиц |
Технические характеристики Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96 виртуальных ЦП | AMD EPYC 7V12 (Рим) [x86-64] |
Память | 900 ГиБ | |
Локальное хранилище | 1 диск | 6000 ГиБ |
Удаленное хранилище | 32 диска | 80000 операций ввода-вывода в секунду 800 МБИТ/с |
Сеть | 8 сетевых адаптеров | 24000 Мбит/с |
Ускорители | 8 GPU | Nvidia A100 GPU (40 ГБ) |
серия "NDm_A100_v4"
Виртуальная машина серии NDm A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Эти конфигурации предназначены для высокопроизводительного обучения глубоких нейронных сетей и тесно связанных с масштабируемыми вглубь и вширь рабочими нагрузками HPC.
Серия NDm A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 80 ГБ Tensor Core. Развертывания NDm A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждому графическому процессору в виртуальной машине предоставляется собственное выделенное соединение NVIDIA Mellanox HDR InfiniBand с пропускной способностью 200 ГБ/с, не зависящее от топологии. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин Azure, и поддерживают GPU Direct RDMA.
Каждый GPU включает подключение NVLINK 3.0 для взаимодействия в виртуальной машине с 96 физическими 2-го поколения AMD Epyc™ 7V12 (Рим) ядрами ЦП.
Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживает большой набор существующих инструментов для искусственного интеллекта и высокопроизводительных вычислений (HPC), созданных на основе библиотек коммуникации NVIDIA NCCL версии 2 для бесшовной кластеризации GPU.
Просмотрите полную страницу серии NDm_A100_v4.
Часть | Количество Подсчет единиц |
Технические характеристики Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96 виртуальных ЦП | AMD EPYC 7V12 (Рим) [x86-64] |
Память | 1900 ГиБ | |
Локальное хранилище | 1 диск | 6400 ГиБ |
Удаленное хранилище | 32 диска | 80000 операций ввода-вывода в секунду 800 МБИТ/с |
Сеть | 8 сетевых адаптеров | 24000 Мбит/с |
Ускорители | 8 GPU | Nvidia A100 GPU (80 ГБ) |
серия ND_H100_v5
Виртуальная машина серии ND H100 v5 — это новое флагманское дополнение к семейству GPU Azure. Эта серия предназначена для высококлассного обучения в области глубокого обучения и тесно интегрирована с задачами генеративного ИИ и высокопроизводительных вычислений (HPC), требующими масштабирования вверх и вширь.
Серия ND H100 v5 начинается с одной виртуальной машины и восьми gpu NVIDIA H100 Tensor Core. Развертывания на основе ND H100 версии 5 могут масштабироваться до тысяч GPU с 3,2 ТБ пропускной способности взаимодействия на каждую виртуальную машину. Каждая графическая карта (GPU) внутри виртуальной машины получает собственное выделенное соединение InfiniBand NVIDIA Quantum-2 CX7 с пропускной способностью 400 Гбит/с, не зависящее от топологии. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин, и поддерживают GPU Direct RDMA.
Каждый GPU включает подключение NVLINK 4.0 для обмена данными на виртуальной машине, а экземпляр имеет 96 физических четвертых ядер процессора Intel Xeon Scalable.
Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, масштабируемый интерконнект InfiniBand поддерживает большой набор существующих средств искусственного интеллекта и высокопроизводительных вычислений (HPC), созданных на основе библиотек коммуникации NVIDIA NCCL для бесшовной кластеризации GPU.
Просмотрите полную страницу серии ND_H100_v5.
Часть | Количество Подсчет единиц |
Технические характеристики Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96 виртуальных ЦП | Intel Xeon (Sapphire Rapids) [x86-64] |
Память | 1900 ГиБ | |
Локальное хранилище | 1 диск | 28000 ГиБ |
Удаленное хранилище | 32Disks | |
Сеть | 8 сетевых адаптеров | |
Ускорители | 8 GPU | Nvidia H100 GPU (80 ГБ) |
серия ND_MI300X_v5
Виртуальная машина серии ND MI300X версии 5 — это новое флагманское дополнение к семейству GPU Azure. Она была разработана для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC.
Виртуальная машина серии ND MI300X v5 включает в себя восемь графических процессоров AMD Instinct MI300 и два процессора Intel Xeon Scalable четвёртого поколения, всего 96 физических ядер. Каждая GPU в виртуальной машине затем подключается друг к другу через ссылки четвертого поколения AMD Infinity Fabric с пропускной способностью 128 ГБ/с на GPU и агрегированной пропускной способностью 896 ГБ/с.
Развертывания на основе ND MI300X версии 5 могут масштабироваться до тысяч gpu с пропускной способностью 3,2 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждая графическая карта (GPU) внутри виртуальной машины получает собственное выделенное соединение InfiniBand NVIDIA Quantum-2 CX7 с пропускной способностью 400 Гбит/с, не зависящее от топологии. Эти подключения автоматически настраиваются между всеми виртуальными машинами, которые входят в один масштабируемый набор виртуальных машин, и поддерживают технологию GPUDirect RDMA.
Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch и другие платформы. Кроме того, масштабируемое межсоединение InfiniBand поддерживает большой набор существующих средств ИИ и HPC, созданных на базе библиотеки ROCm Communication Collectives (RCCL) AMD для бесперебойной кластеризации GPU.
Просмотрите полную страницу серии ND_MI300X_v5.
Часть | Количество Подсчет единиц |
Технические характеристики Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96 виртуальных ЦП | Intel Xeon (Sapphire Rapids) [x86-64] |
Память | 1850 ГиБ | |
Локальное хранилище | 1 Временный диск 8 дисков NVMe |
1000 ГиБ временный диск Диски NVMe 28000 ГиБ |
Удаленное хранилище | 16 дисков | 80000 операций ввода-вывода в секунду 1200 Мбит/с |
Сеть | 8 сетевых адаптеров | |
Ускорители | 8 GPU | AMD Instinct MI300X GPU (192 ГБ) |
Серия семейств ND предыдущего поколения
Для получения сведений о старых размерах см. размеры предыдущего поколения.
Прочая информация о размере
Список всех доступных размеров: размеры
Калькулятор цен: Калькулятор цен
Сведения о типах дисков: типы дисков
Дальнейшие шаги
Воспользуйтесь новейшими функциями и производительностью, доступными для рабочих нагрузок, изменив размер виртуальной машины.
Используйте встроенные процессоры ARM корпорации Майкрософт с виртуальными машинами Azure Cobalt.
Узнайте, как отслеживать виртуальные машины Azure.