Архитектура аварийного восстановления физического сервера в Azure — модернизация

В этой статье описывается модернизация архитектуры и процессов, используемых при репликации, отработки отказа и восстановлении физических серверов Windows и Linux между локальным сайтом и Azure с помощью службы Azure Site Recovery .

Сведения о требованиях к серверу конфигурации в классических выпусках см. в статье "Физический сервер" в архитектуре аварийного восстановления Azure.

Примечание.

Убедитесь, что вы создадите хранилище служб восстановления для настройки устройства репликации ASR. Не используйте существующее хранилище.

Компоненты архитектуры

В следующей таблице и рисунке представлено высокоуровневое представление компонентов, используемых для аварийного восстановления физического компьютера в Azure.

Снимок экрана: модернизация архитектуры.

Компонент Требование Сведения
Azure Подписка Azure, учетная запись хранения Azure для кэша, управляемый диск и сеть Azure. Реплицированные данные из локальных компьютеров хранятся в хранилище Azure. Виртуальные машины Azure создаются с использованием реплицированных данных при запуске фейловера из локальной среды в облако Azure. При создании виртуальные машины Azure подключаются к виртуальной сети Azure.
Устройство репликации Azure Site Recovery Это основной строительный блок всей локальной инфраструктуры Azure Site Recovery.

Все компоненты устройства координируются с помощью устройства репликации. Эта служба контролирует все сквозные действия Site Recovery, включая мониторинг работоспособности защищенных компьютеров, репликацию данных, автоматическое обновление и т. д.
На устройстве размещаются различные ключевые компоненты, такие как:

Прокси-сервер: этот компонент выступает в качестве прокси-канала между агентом мобильности и службами Site Recovery в облаке. Он гарантирует, что для создания точек восстановления не потребуется дополнительное подключение к Интернету от производственных рабочих нагрузок.

Обнаруженные элементы. Этот компонент собирает сведения о vCenter и координируется со службой управления Azure Site Recovery в облаке.

Сервер повторной защиты.Этот компонент координируется с машинами Azure и локальными компьютерами во время операций повторной защиты и восстановления размещения.

Сервер обработки: этот компонент используется для кэширования, сжатия данных перед отправкой в Azure.

Дополнительные сведения об устройстве репликации и об использовании нескольких устройств репликации.

Агент службы восстановления: этот компонент используется для настройки и регистрации в службах Site Recovery и для мониторинга работоспособности всех компонентов.

Поставщик Site Recovery. Этот компонент используется для упрощения процесса повторной защиты. Он делает выбор между повторной защитой альтернативного расположения и повторной защитой исходного расположения для исходного компьютера.

Служба репликации. Этот компонент используется для репликации данных из исходного расположения в Azure.
Реплицируемые компьютеры Служба Mobility Service устанавливается на каждом физическом сервере, который вы реплицируете. Рекомендуется разрешить автоматическую установку службы Mobility Service. Кроме того, можно установить эту службу вручную.

Настройка исходящих сетевых подключений

Чтобы служба Site Recovery работала должным образом, необходимо модифицировать исходящее сетевое подключение, так, чтобы оно позволило вашей среде делать репликацию.

Примечание.

Site Recovery не поддерживает использование прокси-сервер проверки подлинности для управления сетевым подключением.

Исходящие подключения для URL-адресов

При использовании прокси-сервера или брандмауэра на основе URL-адресов для управления исходящими подключениями разрешите использование этих URL-адресов:

URL-адрес Сведения
portal.azure.com Перейдите на портал Azure.
*.windows.net
*.msftauth.net
*.msauth.net
*.microsoft.com
*.live.com
*.office.com
Чтобы войти в подписку Azure.
*.microsoftonline.com Создайте приложения Microsoft Entra для устройства для взаимодействия с Azure Site Recovery.
management.azure.com Создайте приложения Microsoft Entra для устройства для взаимодействия со службой Azure Site Recovery.
*.services.visualstudio.com Передача журналов приложений, используемых для внутреннего мониторинга.
*.vault.azure.net Управление секретами в Azure Key Vault. Примечание: Убедитесь, что реплицируемые машины имеют доступ к этому.
aka.ms Разрешить доступ к ссылкам aka.ms. Используется для обновлений устройства Azure Site Recovery.
download.microsoft.com/download Разрешить загрузки с сайта Майкрософт.
*.servicebus.windows.net Обмен данными между устройством и службой Azure Site Recovery.
*.discoverysrv.windowsazure.com Подключитесь к URL-адресу службы обнаружения Azure Site Recovery.
*.hypervrecoverymanager.windowsazure.com Подключение к URL-адресам микрослужбы Azure Site Recovery.
*.blob.core.windows.net Отправка данных в службу хранилища Azure, которая используется для создания целевых дисков.
*.backup.windowsazure.com URL-адрес службы защиты — это микрослужба, используемая в Azure Site Recovery для обработки и создания реплицированных дисков в Azure.

Процесс репликации

  1. При включении репликации для системы начальная репликация в службу хранилища Azure начинается с помощью указанной политики репликации. Обратите внимание на следующее:

    • Для физических компьютеров репликация выполняется на уровне блока, почти непрерывной, с помощью агента службы, работающего в системе.
    • Применяются все параметры политики репликации:
      • Пороговое значение RPO. Этот параметр не влияет на репликацию. Он помогает с мониторингом. Инициируется событие, и, опционально, отправляется электронное письмо, если текущее значение RPO превышает пороговое значение, которое вы задали.
      • Хранение точки восстановления. Этот параметр указывает, на какой период в прошлом вы хотите вернуться в случае нарушения работы. Максимальный срок хранения — 15 дней.
      • Согласованные с приложением моментальные снимки. Моментальный снимок, согласованный с приложением, может создаваться с интервалом от 1 до 12 часов в зависимости от потребностей приложения. Это стандартные моментальные снимки BLOB-объектов Azure. Агент мобильности, работающий на физическом компьютере, запрашивает моментальный снимок VSS в соответствии с этим параметром и фиксирует данный момент времени как точку согласованности приложения в потоке репликации.

      Примечание.

      Большой период хранения точки восстановления может повлиять на стоимость хранения, так как может потребоваться сохранить дополнительные точки восстановления.

  2. Трафик реплицируется в общедоступные конечные точки службы хранилища Azure через Интернет. Кроме того, можно использовать Azure ExpressRoute со службой Пиринг Microsoft . Репликация трафика через VPN типа "сеть — сеть" с локального сайта в Azure не поддерживается.

  3. Начальная репликация обеспечивает, чтобы все данные на компьютере во время включения репликации отправлялись в Azure. После завершения начальной репликации начинается репликация разностных изменений в Azure. Отслеживаемые изменения для машины отправляются на сервер обработки.

  4. Обмен данными происходит следующим образом.

    • Компьютеры взаимодействуют с локальным устройством через порт HTTPS 443 для входящего трафика для управления репликацией.
    • Устройство управляет репликацией в Azure по порту HTTPS 443 для исходящего трафика.
    • Компьютеры отправляют данные репликации на сервер обработки через порт HTTPS 9443. Этот порт можно изменить.
    • Сервер обработки получает данные репликации, оптимизирует и шифрует их, а затем отправляет в службу хранилища Azure через порт 443 для исходящих подключений.
  5. Сначала журналы данных репликации помещаются в учетную запись хранения кэша в Azure. Эти журналы обрабатываются, а данные сохраняются на управляемом диске Azure (называемом asrseeddisk). На этом диске создаются точки восстановления.

Процесс переключения на резерв и возврата к основной конфигурации

После настройки репликации и выполнения учений по аварийному восстановлению (тестового переключения на резервный узел), чтобы убедиться, что все работает должным образом, можно выполнить переключение на резервный узел по мере необходимости.

Примечание.

Для физических серверов возврат к исходному состоянию не поддерживается

  1. Вы можете выполнить переключение на резервный сервер для одного компьютера или создать план восстановления, чтобы одновременно переключить на резервные серверы несколько серверов. Преимущества плана восстановления, а не резервного переключения одной машины, включают:
    • Вы можете моделировать зависимости приложений, включая все серверы в приложении в одном плане восстановления.
    • Можно добавить сценарии, модули runbook Azure и паузу для действий, выполняемых вручную.
  2. После активации начального переключения на резервный ресурс выполните его подтверждение, чтобы получить доступ к рабочей нагрузке из виртуальной машины Azure.

Процедура повторной синхронизации

  1. Иногда во время начальной репликации или при передаче разностных изменений могут возникнуть проблемы с сетевым подключением между исходным компьютером и сервером обработки или между сервером обработки и Azure. Любая из них может привести к сбоям при мгновенной передаче данных в Azure.
  2. Чтобы избежать проблем с целостностью данных и снизить затраты на их передачу, Site Recovery помечает компьютер для повторной синхронизации.
  3. Компьютер также можно пометить для повторной синхронизации в таких ситуациях, как показано ниже, чтобы обеспечить согласованность между исходным компьютером и данными, хранящимися в Azure.
    • Если устройство подвергается принудительному завершению работы
    • Если компьютер проходит процесс изменения в конфигурации, например изменение размера диска (размер диска изменяется с 2 ТБ на 4 ТБ)
  4. Повторная синхронизация отправляет в Azure только разностные данные. Передача данных между локальной средой и Azure минимизируется за счет вычисления контрольных сумм данных между исходным устройством и данными, хранящимися в Azure.
  5. По умолчанию повторная синхронизация автоматически выполняется в нерабочее время. Если вы не хотите ждать повторной синхронизации по умолчанию за пределами часов, можно повторно выполнить повторную синхронизацию системы вручную. Для этого перейдите к портал Azure, выберите физический компьютер >Resynchronize.
  6. Если повторная синхронизация, установленная по умолчанию, завершается сбоем в нерабочее время и требуется вмешательство вручную, то на определенном компьютере в портале Azure возникает ошибка. Вы можете устранить эту ошибку и запустить повторную синхронизацию вручную.
  7. После завершения повторной синхронизации будет возобновлена репликация разностных изменений.

Политика репликации

По умолчанию при включении репликации виртуальной машины Azure Site Recovery создает политику репликации, стандартные параметры которой представлены в следующей таблице.

Параметр политики Сведения По умолчанию
Хранение точки восстановления Указывает, как долго в Site Recovery хранятся точки восстановления. 1 дн.
Периодичность согласованных с приложениями моментальных снимков Как часто Site Recovery создаёт согласованный с приложением моментальный снимок Отключено

Моментальные снимки и точки восстановления

Точки восстановления создаются из моментальных снимков дисков компьютера, сделанных в определенный момент времени. При переключении системы на резерв используется точка восстановления для восстановления физического компьютера в виде виртуальной машины в целевом расположении.

Обычно при отработке отказа важно, чтобы виртуальная машина запускалась без повреждения или потери данных и чтобы данные на этой виртуальной машине сохраняли согласованность на уровне операционной системы и выполняемых приложений. Это зависит от типа создаваемых моментальных снимков.

Site Recovery создает моментальные снимки следующим образом.

  1. Site Recovery по умолчанию создает моментальные снимки данных без учета состояния приложений, а также моментальные снимки, согласованные на уровне приложений, если вы укажете для них частоту создания.
  2. Точки восстановления создаются из моментальных снимков и хранятся в соответствии с параметрами сохранения в политике репликации.

Согласованность

В следующей таблице описываются различные виды согласованности.

Консистентность при сбое

Description Сведения Рекомендация
Снимок, сохраняющий состояние при сбое, фиксирует данные, которые находились на диске в момент его создания. Он не содержит никакой информации из памяти компьютера.

Он содержит эквивалент данных на диске, которые будут присутствовать при сбое системы или если шнур питания вытащен из розетки в момент создания моментального снимка.

Согласованность сбоев не гарантирует согласованность данных для операционной системы или приложений на компьютере.
По умолчанию Site Recovery создает аварийно-консистентные точки восстановления каждые пять минут. Этот параметр нельзя изменять.

В настоящее время большинство приложений способны успешно восстанавливаться из краш-консистентных точек.

Точки восстановления после сбоя обычно вполне достаточны для репликации операционных систем и таких приложений, как DHCP-серверы и серверы печати.

согласованность на уровне приложений

Description Сведения Рекомендация
Точки восстановления с согласованностью на уровне приложений создаются на основе моментальных снимков с согласованностью на уровне приложений.

Моментальный снимок, согласованный с приложением, содержит все сведения в моментальном снимке, а также все данные в памяти и транзакциях.
Моментальные снимки с согласованностью на уровне приложений создаются с помощью службы теневого копирования томов (VSS).

1) Azure Site Recovery использует метод резервного копирования "только копирование" (VSS_BT_COPY). Он не изменяет время резервного копирования и порядковый номер в журнале транзакций Microsoft SQL.

2) При инициации создания моментального снимка VSS выполняет с томом операцию копирования при записи (COW).

3) Перед выполнением операции COW, VSS информирует каждое приложение на компьютере, что необходимо сбросить данные из оперативной памяти на диск.

4) VSS предоставляет приложению резервного копирования и аварийного восстановления (в нашем примере это Site Recovery) возможность считать данные моментального снимка и продолжить работу.
Моментальные снимки с согласованностью на уровне приложений создаются в соответствии с указанной вами частотой. Частота должна быть всегда меньше, чем установленная для ретенции точек восстановления. Например, если вы сохраняете точки восстановления с использованием настройки по умолчанию на 24 часа, установите частоту менее чем на 24 часа.

Такие моментальные снимки более сложны и требуют больше времени на создание, чем аварийно-согласованные моментальные снимки.

Они влияют на производительность приложений, работающих в системе с включенной функцией репликации.

Следующие шаги

Следуйте инструкциям из этого руководства , чтобы включить репликацию физического компьютера и VMware в Azure.