Непрерывность бизнес-процессов и аварийное восстановление для Решение Azure VMware

Этот сценарий корпоративного масштаба помогает улучшить непрерывность бизнес-процессов и аварийное восстановление (BCDR). Решение Azure VMware предоставляет частные облака, которые содержат кластеры VMware vSphere, сформированные из выделенной bare-metal инфраструктуры Azure. Решение предоставляет не менее трех узлов ESXi, до 16 узлов на кластер. Все подготовленные частные облака имеют VMware vCenter Server, VMware vSAN, VMware vSphere и VMware NSX-T Data Center. Дополнительные сведения о соглашении об уровне обслуживания (SLA) для Решение Azure VMware см. в разделе SLA для Решение Azure VMware.

Независимо от того, используете ли вы локальное решение или Решение Azure VMware, необходимо учесть различные факторы обеспечения непрерывности бизнеса и восстановления после аварий (BCDR), чтобы подготовиться к чрезвычайной ситуации. Надежный план BCDR направлен на защиту компании от потери данных, финансовой потери и простоя при возникновении разрушительных событий. В следующем дереве принятия решений показаны различные варианты BCDR, доступные для Решение Azure VMware.

Схема с блок-диаграммой для обеспечения непрерывности бизнес-процессов и аварийного восстановления.

Примечание.

Пилотная среда настраивается с минимальной конфигурацией и основными компонентами для поддержки критического набора приложений. Однако он может масштабироваться и добавлять больше узлов, чтобы принять большую часть нагрузки в случае отказа. Для аварийного восстановления рабочих нагрузок решения Azure VMware, которые интенсивно используют вычислительные ресурсы и память, на вторичной площадке требуется такое же количество хранилища.

Рекомендации по обеспечению непрерывности бизнес-процессов при проектировании

  • Политики хранилища VMware vSAN в Решение Azure VMware реализуются с учетом доступности хранилища. Если кластер имеет от трех до пяти узлов, количество сбоев узлов, которые могут быть разрешены без потери данных, равно одному. Если кластер содержит от шести до шестнадцати узлов, то число узлов, на которых может возникнуть сбой без последующей потери данных, равно двум. Политики хранилища vSAN VMware можно применять к отдельным виртуальным машинам. Хотя эти политики являются стандартными, вы можете изменить политику в соответствии с пользовательскими требованиями. Для получения дополнительной информации см. концепции хранения Решение Azure VMware.

  • Высокий уровень доступности vSphere включен по умолчанию в Решение Azure VMware. Политика обеспечения высокой доступности резервирует вычислительные ресурсы и емкость памяти для одного узла. Это резервирование обеспечивает достаточную емкость для перезапуска рабочих нагрузок в другом узле в кластере Решение Azure VMware.

  • Высокий уровень доступности с растянутыми кластерами: при использовании Решение Azure VMware узлы ESXi, развернутые в стандартном кластере vSphere, традиционно находятся в одной зоне доступности Azure и защищены высокой доступностью vSphere. Однако рабочие нагрузки не защищены от сбоя зоны доступности. Чтобы защититься от сбоя, один кластер vSAN может охватывать две отдельные зоны доступности, называемые растянутыми кластерами vSAN. Дополнительные сведения см. в статье "Развертывание растянутых кластеров vSAN".

  • Выберите проверенное решение для резервного копирования виртуальных машин VMware vSphere, например Microsoft Azure Backup Server или решение резервного копирования от партнера .

  • Сведения о поддерживаемых функциях в решениях резервного копирования партнеров см. в соответствующей документации партнера.

    Примечание.

    Решение Azure VMware конфигурации частного облака vCenter Server и HCX Manager (если включено) находятся в ежедневном расписании резервного копирования, а конфигурация NSX находится в расписании почасового резервного копирования. Резервные копии сохраняются не менее трех дней.

  • Решение Azure VMware компоненты, такие как vCenter Server, NSX-T Manager или HCX Manager, являются управляемыми службами, для которых Azure управляет резервным копированием. Чтобы восстановить из резервной копии, создайте запрос на поддержку Azure.

Рекомендации по обеспечению непрерывности бизнес-процессов при проектировании

  • Используйте сервер Azure Backup для резервного копирования Решение Azure VMware частного облака. Дополнительные сведения см. в статье Создание резервных копий VMware vSphere с помощью Azure Backup. Поддерживаемые топологии развертывания включают агент MARS и диспетчер защиты данных. Каждая топология развертывания имеет собственную матрицу поддержки, ограничения и лимитации.

  • Разверните сервер Azure Backup в том же регионе Azure, что и частное облако Решение Azure VMware. Этот метод развертывания сокращает затраты на трафик, упрощает администрирование и позволяет сохранить основную и дополнительную топологию. См. руководство по выбору регионов Azure для получения лучших практик по развертыванию в регионах Azure.

  • Azure Backup можно развернуть как виртуальную машину (VM) инфраструктуры как услуги (IaaS) в Azure или в частном облаке Решение Azure VMware. Настоятельно рекомендуется развернуть его за пределами частного облака Решение Azure VMware. Разверните резервную копию в виртуальной сети Azure и убедитесь, что эта виртуальная сеть подключена к той же ExpressRoute, которая подключена к Решение Azure VMware частному облаку. Запуск резервного сервера за пределами частного облака Решение Azure VMware помогает сократить потребление vSAN, поскольку vSAN — это ресурс с ограниченной емкостью в частном облаке Решение Azure VMware.

    Azure Backup Server, развернутый как Azure IaaS ВМ.

    Диаграмма с сервером Azure Backup, развернутым как ВМ Azure.

    Azure Backup Server, развернутый как Решение Azure VMware VM.

    Диаграмма, которая показывает сервер Azure Backup, развернутый как виртуальная машина Решение Azure VMware.

  • Используйте контрольный список требований к производительности приложения, чтобы получить правильный тип емкости и диска, например HDD, SSD или Ultra. Рассмотрим номер SKU Azure виртуальной машины IaaS, поддерживающий тип и емкость диска для операций резервного копирования.

  • Используйте планировщик емкости сервера Azure Backup для определения количества серверов, хранилища и операций ввода-вывода в секунду для каждого из них. При предоставлении значения "Общий размер рабочей нагрузки (ГБ)*" в планировщике емкости используйте медиановое значение между "используемым хранилищем" и "выделенным хранилищем" всех виртуальных машин в vCenter, которые требуется создать резервную копию.

  • Используйте пулы хранилища с сервером Azure Backup для повышения дисковый операций ввода-вывода в секунду (IOPS) и пропускной способности. Используйте многоуровневое хранилище на Backup Server для расширенных операций. Установите для параметра DisableWriteAutoTiering значение конфигурации 1 на томе MABS, чтобы весь уровень производительности был доступен для хранения метаданных ReFS.

  • Определите количество параллельных заданий резервного копирования и операций восстановления, выполняемых на сервере Azure Backup. В настоящее время поддерживаются восемь параллельных заданий резервного копирования. Измеряйте время, затраченное на резервное копирование и восстановление критически важных рабочих нагрузок на нескольких запусках. Убедитесь, что время резервного копирования и восстановления соответствует требованиям RPO и RTO для сервера Azure Backup. Убедитесь, что хранилище данных AVS vSAN имеет достаточную емкость для хранения восстановленной резервной копии.

  • Добавьте необходимые исключения для антивирусной программы для файлов и папок сервера Azure Backup, как описано здесь, если на сервере Azure Backup запущено антивирусное или антивредоносное программное обеспечение. При использовании агента защиты DPM на любой Решение Azure VMware виртуальной машине для резервного копирования приложений (например, SQL, Sharepoint и т. д.), отключите мониторинг dpmra.exe.

  • Настройте соответствующие правила NSG (группа безопасности сети) в подсети, где размещена Azure Backup Server, чтобы разрешить сетевое взаимодействие с агентом защиты DPM, работающим на защищенной виртуальной машине в Решение Azure VMware. Агент защиты DPM взаимодействует с Azure Backup Server на любом динамическом порту в диапазоне от 1024 до 65535.

  • В настоящее время сервер Azure Backup не поддерживает восстановление между регионами для Решение Azure VMware частного облака. Обратитесь к разделам решения партнеров по резервному копированию и восстановление после аварии, когда требуется восстановление Решение Azure VMware между регионами.

Рекомендации по обеспечению аварийного восстановления при проектировании

  • Выравнивайте бизнес-требования с целями времени восстановления (RTO), емкостью и целями точки восстановления (RPO) для приложений. Планируйте и разрабатывайте в соответствии с достижением этих целей, используя наиболее подходящую технологию репликации. Например, изначально реплицируйте базы данных SQL с помощью группы доступности SQL AlwaysOn или используйте средство аварийного восстановления, например VMware Site Recovery Manager.

  • Определите целевой сайт аварийного восстановления для защищенного Решение Azure VMware частного облака. Этот сайт определяет, какие средства аварийного восстановления подходят для среды. Например, если вы хотите восстановить рабочие нагрузки Решение Azure VMware для Azure собственных виртуальных машин IaaS, можно рассмотреть возможность Azure Site Recovery или Zerto.

  • Определите, какой подмножество рабочих нагрузок Решение Azure VMware требует защиты, если произошло событие аварийного восстановления. Рассмотрите возможность классификации рабочих нагрузок на основе приоритета: P0 для критически важных для бизнеса рабочих нагрузок, а также P1, P2, P3 для других рабочих нагрузок, которые важны, но не столь важны для работы бизнеса. План непрерывности бизнес-процессов клиента определяет уровни приоритета, которые помогают контролировать затраты, связанные с реализацией аварийного восстановления.

  • В большинстве случаев непроизводственные среды, такие как разработка, тестирование или UAT, не требуют переключения на вторичный сайт. Чтобы сэкономить на затратах, на вторичном объекте запустить запасное освещение с уменьшенной производственной мощностью и для критически важных задач. Для увеличения емкости можно увеличить масштаб, чтобы добавить узлы ESXi в кластер во время события аварийного восстановления.

  • Для особенно пилотных развертываний убедитесь, что вы обеспечили всю квоту узла, необходимую на вторичном сайте, чтобы не пришлось ждать требуемой емкости во время полного масштабирования. См. Запрос квоты узла для Решение Azure VMware.

  • Настройте функциональные роли домена, такие как контроллеры домена Active Directory, во вторичной среде.

  • Решения от партнеров, таких как JetStream и Zerto, общедоступны и проверены на Решение Azure VMware. Они поддерживают большинство сценариев аварийного восстановления и могут обеспечить более быстрое восстановление с почти нулевым RPO.

  • VMware Site Recovery Manager, Jetstream и Zerto поддерживают миграцию из сторонних расположений в Решение Azure VMware.

  • VMware HCX также является экономичным решением для аварийного восстановления. Однако не рекомендуется использовать в больших производственных задачах, поскольку они требуют ручной оркестрации.

  • Для аварийного восстановления между Решение Azure VMware частными облаками в разных регионах Azure необходимо включить ExpressRoute Global Reach между обоими внутренними каналами ExpressRoute. Эти цепи создают подключение от первичного к вторичному частному облаку при необходимости для таких решений, как VMware SRM и VMware HCX.

  • Для аварийного восстановления между частными облаками Решение Azure VMware в одном регионе Azure необходимо включить Решение Azure VMware Interconnect. Он создает путь маршрутизации между сетями управления и рабочей нагрузки частных облаков Решение Azure VMware для обмена данными между облаками. Убедитесь, что маршрутизированное пространство IP-адресов в каждом частном облаке уникально и не пересекается.

  • При работе с аварийным восстановлением можно использовать одно и то же исходное IP-адресное пространство в основном регионе Azure и дополнительном регионе Azure. Однако для этого требуются дополнительные усилия по проектированию и инженерии.

    • Сохраните те же IP-адреса: виртуальные машины на вторичном Решение Azure VMware сайте можно восстановить с помощью того же исходного IP-адреса, что и основной сайт. Для этого метода создайте изолированные сегменты VLAN или NSX-T на вторичном сайте и убедитесь, что ни один из этих изолированных виртуальных ЛС или сегментов не подключен к среде. Измените маршруты аварийного восстановления, чтобы отразить, что подсеть перемещена на дополнительный сайт и новое расположение IP-адресов. Хотя этот метод работает, он также создает инженерные издержки при попытке полностью автоматизированного аварийного восстановления.

    • Использовать другие IP-адреса. Для восстановленных виртуальных машин можно также использовать другие IP-адреса. Если виртуальная машина перемещена на дополнительный сайт, план восстановления в VMware Site Recovery Manager содержит сведения о пользовательской карте IP-адресов. Выберите эту карту, чтобы изменить IP-адрес. Виртуальные машины создаются в новых сегментах NSX-T и назначаются новые IP-адреса. Инструменты могут отличаться для различных решений аварийного восстановления.

  • Важные факторы для сценариев частичного и полного аварийного восстановления:

    • VMware Site Recovery Manager поддерживает частичное восстановление, которое восстанавливает только подмножество виртуальных машин и полное аварийное восстановление. Между двумя сайтами Решение Azure VMware в регионе 1 и регионе 2 все или некоторые виртуальные машины могут переключиться на резервный контур.

    • Требование хранения исходного IP-адреса для восстановленных виртуальных машин определяет, возможно ли частичное и полное аварийное восстановление.

    • Чтобы сохранить исходный IP-адрес при выполнении частичного аварийного восстановления в диспетчере Site Recovery, шлюз подсети должен перейти на дополнительный сайт.

    Примечание.

    Аварийное восстановление в режиме активного ожидания не требует растяжения уровня 2.

Рекомендации по обеспечению аварийного восстановления при проектировании

  • Используйте VMware Site Recovery Manager при работе с Решение Azure VMware на первичных и вторичных сайтах. Основные и дополнительные сайты также называются защищенными сайтами и сайтами восстановления соответственно.

    Общие сведения о непрерывной репликации vSphere.

    Diagram, показывающий высокоуровневый пример непрерывной репликации vSphere между двумя сайтами Решение Azure VMware.

    Подробный пример непрерывной репликации vSphere между основными и вторичными сайтами.

    Diagram с подробным примером непрерывной репликации vSphere между двумя сайтами Решение Azure VMware.

  • Для критически важных для бизнеса приложений Zerto и JetStream доступны в качестве решений для аварийного восстановления для Решение Azure VMware частного облака. JetStream и Zerto построены на основе непрерывной защиты данных (CDP), используя фреймворк VMware vSphere API для фильтрации I/O (VAIO), что позволяет свести потерю данных к минимуму или вовсе ее избежать. Она также обеспечивает экономичное аварийное восстановление с помощью минимальных ресурсов.

  • Используйте Azure Site Recovery или Zerto, если Azure виртуальные машины IaaS являются целевым объектом аварийного восстановления для частного облака Решение Azure VMware.

  • Свести к минимуму входные данные вручную с помощью автоматизированных планов восстановления в каждом из соответствующих решений аварийного восстановления. Эти планы полезны при работе с решениями VMware Site Recovery Manager или партнерскими решениями. План восстановления позволяет объединять компьютеры в группы восстановления в случае отказа. Затем это помогает определить систематический процесс восстановления путем создания независимых единиц, которые могут переключаться на резервные в случае отказа.

  • Настройте тесты дыма или аварийное восстановление по крайней мере один раз в год, чтобы обеспечить работу планов восстановления должным образом. Возможности оркестрации выбранного средства аварийного восстановления определяют объем усилий, необходимых для проведения этих учений.

  • Используйте геополитические региональные пары в качестве вторичной среды аварийного восстановления. Некоторые преимущества региональных пар включают приоритетное восстановление региона, последовательные обновления, физическую изоляцию и хранилище данных в определенном регионе.

  • Сохраняйте адресные пространства разными, чтобы избежать перекрытия IP-адресов между двумя сайтами. Например, можно использовать 192.168.0.0/16 для региона 1 и 10.0.0.0/16 для региона 2.

  • Используйте подключение ExpressRoute Global Reach между основными и вторичными частными облаками в разных регионах. Дополнительные сведения и рекомендации по работе с сетью см. в соответствующей области проектирования.

Следующие шаги

Узнайте о соображениях и рекомендациях по первоначальному развертыванию Решение Azure VMware, а также о руководстве по операционной автоматизации.

автоматизация платформы для Решение Azure VMware