Рекомендации по поддержанию запасов виртуальных машин Azure (SKU) для Azure NetApp Files

В этой статье описаны рекомендации по использованию Azure NetApp Files для единиц хранения запасов виртуальных машин Azure, включая различия между номерами SKU и между ними.

Рекомендации по выбору SKU

Производительность хранилища зависит не только от скорости самого хранилища. Скорость процессора и архитектура имеют большое значение для общей производительности конкретного вычислительного узла. При выборе SKU следует учитывать следующие факторы.

  • AMD или Intel. Например, SAS использует библиотеку ядра для математических программ, предназначенную специально для процессоров Intel. В этом случае SKU Intel предпочтительнее, чем SKU AMD.
  • Типы машин F2, E_v3 и D_v3 используют более одного набора микросхем. При использовании Выделенных узлов Azure вы можете выбрать определенные модели (Broadwell, Cascade Lake или Skylake при выборе типа E, например). В противном случае выбор набора микросхем недетерминирован. Если вы развертываете кластер HPC и вам важно обеспечить согласованную работу с оборудованием, то стоит рассмотреть возможность использования отдельных выделенных узлов Azure или выбрать один из SKU наборов микросхем, таких как E_v4 или D_v4.
  • При тестировании со SKU на основе Intel Broadwell и SKU на основе AMD EPYC™ 7551 наблюдалась вариативность производительности с подключенным к сети хранилищем (NAS). Были замечены две проблемы:
    • При некорректном назначении ускоренного сетевого интерфейса неоптимальному узлу NUMA производительность чтения значительно снижается. Хотя сопоставление интерфейса ускоренной сети с определенным узлом NUMA выгодно для новых SKU, оно должно быть обязательным для SKU с этими наборами микросхем (Lv2 | E_v3 | D_v3).
    • Виртуальные машины, работающие на Lv2 или на E_v3 или D_v3 с набором микросхем Broadwell, более уязвимы к конкуренции за ресурсы, чем при использовании других SKU. При тестировании с использованием нескольких виртуальных машин, работающих на одном Выделенном узле Azure, выполнение рабочей нагрузки сетевого хранилища с одной виртуальной машины снижает производительность рабочих нагрузок сетевого хранилища, запущенных на второй виртуальной машине. Снижение становится более заметным, если хотя бы одна из виртуальных машин на узле не имеет оптимально сопоставленного ускоренного сетевого интерфейса или узла NUMA. Помните, что E_v3 и D_V3 могут использовать Haswell, Broadwell, Cascade Lake или Skylake.

Для наиболее стабильной производительности при выборе виртуальных машин выберите один из номеров SKU с одним типом набора микросхем — по возможности лучше выбирать более новые SKU. Помните, что, помимо использования выделенного узла, очень сложно спрогнозировать, какой тип оборудования используют виртуальные машины E_v3 или D_v3. При использовании SKU E_v3 или D_v3:

  • Если виртуальная машина отключена, освобождена, а затем снова включена, то виртуальная машина, скорее всего, изменит узлы и, следовательно, аппаратные модели.
  • При развертывании приложений на нескольких виртуальных машинах ожидается, что виртуальные машины будут работать на разнородном оборудовании.

Различия внутри и между номерами SKU

В следующей таблице показаны различия как внутри, так и между артикулами. Обратите внимание, например, что для E_v3 и D_v3 используются наборы микросхем Broadwell, Cascade Lake, Skylake, как и для D_v3.

Семья Версия Описание Частота (ГГц)
Е Версия 3 Intel® Xeon® E5-2673 v4 (Broadwell) 2,3 (3,6)
Е Версия 3 Intel® Xeon® Platinum 8272CL (Каскадное озеро) 2,6 (3,7)
Е Версия 3 Intel® Xeon® Platinum 8171M (Skylake) 2,1 (3,8)
Е Версия 4 Intel® Xeon® Platinum 8272CL (Каскадное озеро) 2,6 (3,7)
Ea Версия 4 AMD EPYC™ 7452 2,35 (3,35)
Д Версия 3 Intel® Xeon® E5-2673 v4 (Broadwell) 2,3 (3,6)
Д Версия 3 Intel® Xeon® E5-2673 версии 3 (Haswell) 2,3 (2,3)
Д Версия 3 Intel® Xeon® Platinum 8272CL (Каскадное озеро) 2,6 (3,7)
Д Версия 3 Intel® Xeon® Platinum 8171M (Skylake) 2,1 (3,8)
Д Версия 4 Intel® Xeon® Platinum 8272CL (Каскадное озеро) 2,6 (3,7)
Да Версия 4 AMD EPYC™ 7452 2,35 (3,35)
L Версия 2 AMD EPYC™ 7551 2,0 (3,2)
Ф 1 Intel Xeon® E5-2673 версии 3 (Haswell) 2,3 (2,3)
Ф 2 Intel® Xeon® Platinum 8168M (Каскадное озеро) 2,7 (3,7)
Ф 2 Intel Xeon® Platinum 8272CL 2-го® поколения (Skylake) 2,1 (3,8)

При подготовке среды SAS GRID с несколькими узлами в рабочей среде можно заметить воспроизводимую разницу в один час 15 минут для разных запусков аналитики, при этом единственным отличием между запусками будет базовое оборудование.

SKU и аппаратная платформа Время выполнения заданий
E32-8_v3 (Broadwell) 5,5 часа
E32-8_v3 (Каскадное озеро) 4,25 час

В обоих наборах тестов был выбран номер SKU E32-8_v3 и использовался RHEL 8.3 с параметром подключения nconnect=8.

Лучшие практики

  • По возможности выберите E_v4, D_v4 или более поздней версии, а не E_v3 или D_v3.
  • По возможности выбирайте Ed_v4, Dd_v4 или более новые версии, а не L2 SKU.

Следующие шаги