Стиль архитектуры больших вычислений

Azure
Пакетная служба Azure

Термин больших вычислений описывает крупномасштабные рабочие нагрузки, требующие большого количества ядер, часто нумерующих в сотнях или тысячах. Сценарии включают отрисовку изображений, динамическую динамику, моделирование финансовых рисков, исследование нефти, проектирование лекарств и инженерный стресс-анализ, среди прочего.

Логическая схема для стиля архитектуры больших вычислений

Ниже приведены некоторые типичные характеристики больших вычислительных приложений:

  • Работа может быть разделена на дискретные задачи, которые могут выполняться одновременно по нескольким ядрам.
  • Каждая задача ограничена. Он принимает некоторые входные данные, выполняет некоторую обработку и создает выходные данные. Все приложение выполняется в течение ограниченного времени (минут до дней). Распространенный шаблон заключается в подготовке большого количества ядер в всплеске, а затем отключается до нуля после завершения приложения.
  • Приложению не нужно оставаться до 24/7. Однако система должна обрабатывать сбои узлов или сбои приложения.
  • Для некоторых приложений задачи независимы и могут выполняться параллельно. В других случаях задачи тесно связаны, то есть они должны взаимодействовать или обмениваться промежуточными результатами. В этом случае рекомендуется использовать высокоскоростные сетевые технологии, такие как InfiniBand и удаленный прямой доступ к памяти (RDMA).
  • В зависимости от рабочей нагрузки можно использовать размеры виртуальных машин с интенсивным вычислением (H16r, H16mr и A9).

Когда следует использовать эту архитектуру

  • Вычислительные интенсивные операции, такие как моделирование и хрустение чисел.
  • Имитации, которые являются вычислительными и должны быть разделены по ЦП на нескольких компьютерах (10–1000).
  • Имитации, требующие слишком много памяти для одного компьютера, и должны быть разделены на несколько компьютеров.
  • Длительные вычисления, которые занять слишком много времени для выполнения на одном компьютере.
  • Небольшие вычисления, которые должны выполняться 100-х или 1000-х раз, например симуляция Монте-Карло.

Преимущества

  • Высокая производительность с "смущательно параллельной" обработкой.
  • Может использовать сотни или тысячи ядер компьютера, чтобы быстрее решить большие проблемы.
  • Доступ к специализированному высокопроизводительного оборудования с выделенными высокоскоростными сетями InfiniBand.
  • Вы можете подготавливать виртуальные машины по мере необходимости для работы, а затем отключать их.

Сложности

  • Управление инфраструктурой виртуальной машины.
  • Управление объемом хрустения чисел
  • Подготовка тысяч ядер своевременно.
  • Для тесно связанных задач добавление дополнительных ядер может иметь снижение отдачи. Возможно, вам потребуется поэкспериментировать, чтобы найти оптимальное количество ядер.

Большие вычислительные ресурсы с помощью пакетной службы Azure

Пакетная служба Azure — это управляемая служба для выполнения крупномасштабных высокопроизводительных вычислений (HPC).

С помощью пакетной службы Azure вы настраиваете пул виртуальных машин и отправляете приложения и файлы данных. Затем пакетная служба подготавливает виртуальные машины, назначает задачи виртуальным машинам, выполняет задачи и отслеживает ход выполнения. Пакетная служба может автоматически масштабировать виртуальные машины в ответ на рабочую нагрузку. Пакет также предоставляет планирование заданий.

Схема больших вычислений с помощью пакетной службы Azure

Большие вычислительные ресурсы, выполняемые на виртуальных машинах

Пакет Microsoft HPC можно использовать для администрирования кластера виртуальных машин, а также планирования заданий HPC и отслеживания заданий HPC. С помощью этого подхода необходимо подготовить виртуальные машины и сетевую инфраструктуру и управлять ими. Рассмотрите этот подход, если у вас есть рабочие нагрузки HPC и хотите переместить некоторые или все эти рабочие нагрузки в Azure. Вы можете переместить весь кластер HPC в Azure или сохранить локальный кластер HPC, но использовать Azure для ускорения емкости. Дополнительные сведения см. в решениях пакетной службы и HPC для крупномасштабных вычислительных рабочих нагрузок.

Пакет HPC, развернутый в Azure

В этом сценарии кластер HPC создается полностью в Azure.

Схема пакета HPC, развернутого в Azure

Головной узел предоставляет службы планирования заданий и управления в кластере. Для тесно связанных задач используйте сеть RDMA, которая обеспечивает очень высокую пропускную способность, низкую задержку связи между виртуальными машинами. Дополнительные сведения см. в статье "Развертывание кластера HPC с пакетом 2016" в Azure.

Ускорение кластера HPC в Azure

В этом сценарии организация выполняет локальный пакет HPC и использует виртуальные машины Azure для ускорения емкости. Головной узел кластера находится в локальной среде. ExpressRoute или VPN-шлюз подключает локальную сеть к виртуальной сети Azure.

Схема гибридного большого вычислительного кластера

Дальнейшие действия