Виртуальная машина серии ND A100 версии 4 — это новое флагманское дополнение к семейству GPU Azure. Эти размеры предназначены для высокоуровневой подготовки глубокого обучения и тесно связаны с масштабируемыми и масштабируемыми рабочими нагрузками HPC.
Серия ND A100 версии 4 начинается с одной виртуальной машины и восьми GPU NVIDIA Ampere A100 40 ГБ Tensor Core. Развертывания на основе ND A100 версии 4 могут масштабироваться до тысяч GPU с пропускной способностью 1,6 ТБ/с пропускной способности взаимодействия на каждую виртуальную машину. Каждый ГРАФИЧЕСКИй процессор в виртуальной машине предоставляется с собственным выделенным подключением 200 ГБ/с NVIDIA Mellanox HDR InfiniBand. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин Azure, и поддерживают GPU Direct RDMA.
Каждый GPU включает подключение NVLINK 3.0 для взаимодействия в виртуальной машине с 96 физическими 2-го поколения AMD Epyc™ 7V12 (Рим) ядрами ЦП.
Эти экземпляры обеспечивают великолепную производительность для многих средств аналитики, машинного обучения и искусственного интеллекта, которые в стандартной конфигурации поддерживают ускорение GPU, в том числе TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, межсоединение InfiniBand поддерживает большой набор существующих средств искусственного интеллекта и HPC, созданных на основе библиотек коммуникации NVIDIA NCCL2 для эффективного кластеризации gpu.
Спецификации узлов
Часть
Количество Подсчет единиц
Очки Идентификатор SKU, единицы производительности и т. д.
Скорость 1временных дисков часто отличается от операций RR (случайного чтения) и RW (случайной записи). Операции RR обычно быстрее, чем операции RW. Скорость RW обычно медленнее скорости RR в рядах, где указано только значение скорости RR.
Емкость хранилища отображается в единицах ГиБ (1 ГиБ = 1024^3 байтов). При сравнении емкости дисков в ГБ (1000^3 байтов) с емкостью дисков в ГиБ (1024^3 байтов) помните, что значения емкости в ГиБ могут казаться меньше, чем в ГБ. Например, 1023 ГиБ = 1098,4 ГБ.
Пропускная способность дисков измеряется в операциях ввода-вывода в секунду (IOPS) и МБит/с, где 1 МБит/с = 10^6 байтов в секунду.
1Некоторые размеры поддерживают ускорение , чтобы временно увеличить производительность диска. Скорость ускорения может поддерживаться до 30 минут за раз.
Емкость хранилища отображается в единицах ГиБ (1 ГиБ = 1024^3 байтов). При сравнении емкости дисков в ГБ (1000^3 байтов) с емкостью дисков в ГиБ (1024^3 байтов) помните, что значения емкости в ГиБ могут казаться меньше, чем в ГБ. Например, 1023 ГиБ = 1098,4 ГБ.
Пропускная способность дисков измеряется в операциях ввода-вывода в секунду (IOPS) и МБит/с, где 1 МБит/с = 10^6 байтов в секунду.
Диски данных могут работать в режиме кэширования и в режиме без кэширования. Чтобы использовать кэширование диска данных, для режима кэширования узла следует задать значение ReadOnly или ReadWrite. Чтобы не использовать кэширование диска данных, для режима кэширования узла следует задать значение None.
Ожидаемая пропускная способность сети — это максимальная совокупная пропускная способность, выделенная на каждый тип виртуальной машины по всем сетевым адаптерам для всех назначений. Дополнительные сведения см. в разделе " Пропускная способность сети виртуальной машины"
Верхние пределы не гарантированы. Пределы предлагают руководство по выбору типа виртуальной машины, подходящего для предполагаемого приложения. Фактическая производительность сети зависит от нескольких факторов, в том числе загрузки сети и приложения, а также параметров сети. Сведения об оптимизации пропускной способности см. в статье Оптимизация пропускной способности сети для виртуальных машин Azure.
Чтобы обеспечить ожидаемую производительность сети на виртуальных машинах Linux или Windows, возможно, потребуется выбрать определенную версию виртуальной машины или оптимизировать ее. Чтобы получить дополнительную информацию, см. Проверка пропускной способности (NTTTCP).
Сведения об акселераторе (GPU, FPGAs и т. д.) для каждого размера
Узнайте больше о том, как с помощью единиц вычислений Azure (ACU) сравнить производительность вычислений для различных номеров SKU Azure.
Ознакомьтесь с выделенными узлами Azure для физических серверов, которые могут размещать одну или несколько виртуальных машин, назначенных одной подписке Azure.