О модернизированном переходе на резервные мощности и возврате к локальному размещению в процессе аварийного восстановления.

В этой статье представлен обзор аварийного переключения и возврата при аварийном восстановлении локальных машин в Azure с использованием модернизированной версии Azure Site Recovery.

Дополнительные сведения об отработке отказа и возврате к исходному состоянию в классических версиях Azure Site Recovery см. в этой статье.

Этапы восстановления

Переключение при отказе и возврат к исходному состоянию в Site Recovery имеют четыре этапа:

  • Этап 1: Переключение в случае отказа из локальной среды. После настройки репликации в Azure для локальных компьютеров, когда происходит сбой локального сайта, вы переключаете эти компьютеры в Azure. После переключения из реплицированных данных создаются виртуальные машины Azure.
  • Этап 2. Повторное включение защиты виртуальных машин Azure. Повторно включите защиту виртуальных машин в Azure, чтобы начать их репликацию в локальное размещение. Во время повторного включения защиты локальная виртуальная машина (если она доступна) отключается, что обеспечивает согласованность данных.
  • Этап 3. Переключение из Azure. Когда локальный сайт снова работает в обычном режиме, вы запускаете другое переключение. На этот раз вы восстанавливаете виртуальные машины Azure на локальную инфраструктуру. Вы можете вернуться в исходное расположение, в которое произошёл переход, или в альтернативное расположение. Это действие называется плановым переключением.
  • Этап 4. Повторная защита локальных компьютеров. После возврата опять включите репликацию локальных компьютеров в Azure.

Резервное переключение

Выполните переключение на резерв в рамках стратегии непрерывности бизнес-процессов и аварийного восстановления (BCDR).

  • В качестве первого шага в стратегии BCDR реплицируйте локальные компьютеры в Azure на постоянной основе. Пользователи получают доступ к рабочим нагрузкам и приложениям, работающим на локальных компьютерах-источниках.
  • Если возникает необходимость, например в случае отказа оборудования на месте, переключите реплицируемые компьютеры на Azure. Виртуальные машины Azure создаются с реплицируемыми данными.
  • Для обеспечения непрерывности бизнес-процессов пользователи могут продолжать работать с приложениями на виртуальных машинах Azure.

Фейловер — это деятельность, состоящая из двух этапов:

  • Отработка отказа: этап, на котором виртуальная машина Azure создается и запускается с использованием выбранной точки восстановления.
  • Фиксирование: после переключения при отказе вы проверяете виртуальную машину в Azure:
    • Затем вы можете выполнить переключение на резервный узел на выбранной точке восстановления или выбрать другую точку для выполнения переключения.
    • После переключения на резервный сервер изменить точку восстановления невозможно.

Примечание.

Используйте аварийно устойчивую точку восстановления в Windows Server 2012 или более ранних версиях, поскольку время загрузки виртуальных машин после отработки отказа может быть больше для этих версий в случае использования согласованной точки восстановления приложений.

Подключение к Azure после переключения на резервный ресурс

Чтобы подключиться к виртуальным машинам Azure, созданным после восстановления после отказа с помощью RDP или SSH, существует несколько требований.

Отказоустойчивость Местонахождение Действия
Виртуальная машина Azure под управлением Windows На локальном компьютере до начала переключения на резервный Доступ через Интернет: включите RDP. Убедитесь, что добавлены правила для протоколов TCP и UDP для общедоступного профиля, а протокол RDP разрешен в разделе Брандмауэр Windows>Разрешенные программы для всех профилей.

Доступ через VPN типа "сеть — сеть": включите RDP на локальном компьютере. Протокол удаленного рабочего стола (RDP) должен быть разрешен в разделе Брандмауэр Windows ->Разрешенные приложения и компоненты для доменных и частных сетей.

Задайте для политики сети SAN операционной системы значение OnlineAll. Подробнее.

Прежде чем запустить отработку отказа, убедитесь, что на виртуальной машине нет ожидающих обновлений Windows. Windows Update может запуститься при переключении на резервную копию, и вы не сможете войти в виртуальную машину, пока обновления не завершатся.
Виртуальная машина Azure под управлением Windows На виртуальной машине Azure после аварийного переключения Добавьте общедоступный IP-адрес для виртуальной машины.

Правила группы безопасности сети на виртуальной машине после отказа (и подсеть Azure, к которой она подключена) должны разрешать входящие подключения к порту RDP.

Проверьте диагностику загрузки, чтобы просмотреть снимок виртуальной машины. Если вы не можете подключиться к виртуальной машине, убедитесь, что она запущена, и ознакомьтесь с рекомендациями по устранению неполадок.
Виртуальная машина Azure под управлением Linux На локальном компьютере до начала переключения на резервный Настройте автоматический запуск службы SSH на виртуальной машине при загрузке системы (если он еще не настроен).

Убедитесь, что правила брандмауэра разрешают SSH-подключение к виртуальной машине.
Виртуальная машина Azure под управлением Linux На виртуальной машине Azure после аварийного переключения Правила группы безопасности сети на переключенной виртуальной машине (и подсети Azure, к которой она подключена) должны разрешать входящие подключения к порту SSH.

Добавьте общедоступный IP-адрес для виртуальной машины.

Чтобы просмотреть снимок виртуальной машины, можно проверить диагностику загрузки.

Типы отказоустойчивости

Служба Site Recovery предоставляет различные варианты отработки отказа.

Отказоустойчивость Сведения Восстановление Рабочий процесс
Тестирование отказа Используется для выполнения теста проверки стратегии BCDR без потери данных или простоя. При этом создается копия виртуальной машины в Azure, что не влияет на текущую репликацию или на рабочую среду. 1. Запустите тестовый отказ на одной виртуальной машине или на нескольких виртуальных машинах в соответствии с планом восстановления.

2. Выберите точку восстановления для тестового переключения на резервный ресурс.

3. Выберите сеть Azure, в которой будет размещена виртуальная машина, создаваемая после выполнения операции отказа. Эта сеть должна использоваться только для тестовой отработки отказа.

4. Убедитесь, что тренировка прошла как ожидалось. Служба Site Recovery автоматически удаляет виртуальные машины, созданные в Azure во время тестирования.
Плановое переключение — Hyper-V Используется для запланированного простоя.

Исходные виртуальные машины завершают работу. Перед запуском отработки отказа синхронизируются самые последние данные.
Нулевая потеря данных в рамках запланированного рабочего процесса. 1. Запланируйте окно технического обслуживания и уведомьте об этом пользователей.

2. Переведите приложения, обслуживающие пользователей, в автономный режим.

3. Запустите плановое переключение на последнюю точку восстановления. Переключение на резерв не выполняется, если машина не выключена либо обнаружены ошибки.

4. После переключения убедитесь, что реплика виртуальной машины Azure активна в Azure.

5. Закрепите резервное переключение для завершения. Операция фиксации удаляет все точки восстановления.
Отказоустойчивость Hyper-V Обычно переключение происходит при незапланированном сбое или если основной сайт недоступен.

При необходимости завершите работу виртуальной машины и синхронизируйте последние изменения перед началом переключения на резервный сервер.
Потеря данных для приложений минимальна. 1. Запустите план BCDR.

2. Запустите переключение на резерв. Укажите, следует ли Site Recovery завершить работу виртуальной машины и синхронизировать или реплицировать последние изменения перед запуском переключения при сбое.

3. Вы можете переключиться на резервный режим по многим опциям точек восстановления, приведенных здесь.

Если параметр завершения работы виртуальной машины не включен или служба Site Recovery не сможет завершить работу виртуальной машины, используется последняя точка восстановления.
Отработка отказа выполняется, даже если не удается выключить машину.

4. После переключения на резервную копию убедитесь, что активна виртуальная машина Azure, созданная на основе реплики.
При необходимости можно выбрать другую точку восстановления в 24-часовом окне хранения.

5. Закрепите резервное переключение для завершения. Операция фиксации удаляет все доступные точки восстановления.
Отработка отказа — VMware Обычно переключение происходит при незапланированном сбое или если основной сайт недоступен.

При необходимости укажите, должна ли служба Site Recovery инициировать завершение работы виртуальной машины, а также синхронизировать и реплицировать последние изменения перед началом отработки отказа.
Потеря данных для приложений минимальна. 1. Запустите план BCDR.

2. Запустите отработку отказа из службы Site Recovery. Укажите, следует ли службе Site Recovery попробовать инициировать завершение работы виртуальной машины и выполнить синхронизацию перед переключением на резервное копирование.
Переключение на резерв выполняется, даже если невозможно отключить машины.

3. После отработки отказа убедитесь, что реплицированная виртуальная машина Azure активна в Azure.
При необходимости можно выбрать другую точку восстановления из окна удержания продолжительностью 72 часа.

5. Закрепите резервное переключение для завершения. Операция фиксации удаляет все точки восстановления.
При использовании виртуальных машин Windows Site Recovery отключает эти инструменты VMware во время переключения на резерв.
Плановое резервное переключение — VMware Можно выполнить планируемое переключение с Azure на локальные ресурсы. Так как это действие плановая отработка отказа, точка восстановления создается после активации задания плановая отработка отказа. Когда активируется плановая отработка отказа, ожидающие изменения копируются в локальную среду, создается последняя точка восстановления виртуальной машины и виртуальная машина Azure завершает работу.

Выполните процесс резервного переключения, как описано здесь. После этого локальный компьютер будет включен. После успешного планового переключения на резервный узел компьютер станет активным в вашей локальной среде.

Обработка отработки отказа

В некоторых сценариях переключение на резервное оборудование требует дополнительной обработки, которая длится около 8–10 минут. Тестовая отработка отказа может занимать больше времени для следующих систем:

  • виртуальные машины VMware без включенной службы DHCP;
  • виртуальные машины VMware без загрузочных драйверов storvsc, vmbus, storflt, intelide, atapi.

Варианты точек восстановления

При переходе на резервное оборудование можно выбрать множество параметров точки восстановления.

Параметр Сведения
Последняя (наименьшее значение RPO) Этот параметр обеспечивает наименьшую целевую точку восстановления (RPO). Сначала он обрабатывает все данные, получаемые службой Site Recovery, чтобы создать точку восстановления для каждой виртуальной машины, перед переключением на неё при сбое. Изначально он пытается обработать и применить все данные, получаемые службой Site Recovery в целевом расположении, и создать точку восстановления с помощью обработанных данных. Однако если во время запуска отработки отказа нет данных, отправленных в службу Site Recovery и ожидающих обработки, Azure Site Recovery не выполняет никакой обработки, поэтому не создает новую точку восстановления. В этом сценарии он переключается на резервный режим, используя только ранее обработанную точку восстановления.
Последняя обработанная Переключение виртуальных машин выполняется до последней точки восстановления, обработанной средством Site Recovery. Для просмотра последней точки восстановления конкретной виртуальной машины ознакомьтесь с разделом Последние точки восстановления в параметрах виртуальной машины. Этот вариант обеспечивает низкий показатель целевого времени восстановления, так как не требует времени на обработку данных.
Последняя с поддержкой согласованности приложений Этот параметр выполняет переключение виртуальных машин на последнюю точку восстановления, согласованную с приложением и обработанную Site Recovery, если включено создание согласованных с приложением точек восстановления. Проверьте последнюю точку восстановления в параметрах виртуальной машины.
Последняя обработанная для нескольких виртуальных машин Этот параметр доступен для планов восстановления, которые содержат одну или больше виртуальных машин с включенной согласованностью для нескольких ВМ. Виртуальные машины с этим параметром переключаются на последнюю общую точку восстановления, согласованную для нескольких виртуальных машин. Любые другие виртуальные машины в плане переключаются на последнюю обработанную точку восстановления.
Актуальная согласованность приложений для мульти-ВМ Этот параметр доступен для планов восстановления, которые содержат одну или больше виртуальных машин с включенной согласованностью для нескольких ВМ. Виртуальные машины, входящие в группу репликации, переключаются на последнюю общую согласованную с приложением точку восстановления для нескольких виртуальных машин. Другие виртуальные машины переключаются на свою последнюю точку восстановления, согласованную с приложением.
Настраиваемое Используйте этот параметр, чтобы выполнить переход на резервный узел для определенной виртуальной машины к конкретной точке восстановления во времени. Этот вариант недоступен для планов восстановления.

Примечание.

Невозможно перенести точки восстановления в другое хранилище служб восстановления.

Повторная защита и плановое переключение

После переключения на резерв в Azure реплицированные виртуальные машины Azure находятся в незащищенном состоянии.

  • Чтобы запустить процесс возврата на локальную площадку, необходимо начать репликацию виртуальных машин Azure на локальную площадку. Процесс повторной защиты зависит от типа компьютеров, для которых выполнялось переключение на резерв.
  • После того как машины реплицируются из Azure в локальную среду, вы можете выполнить переключение на резервный сайт из Azure в вашу локальную среду.
  • После повторного запуска виртуальных машин в локальной среде можно включить их репликацию в Azure для аварийного восстановления.
  • Только диски, реплицированные из локальной среды в Azure, реплицируются обратно из Azure во время повторной защиты. Недавно добавленные диски для отработки отказа виртуальной машины Azure не реплицируются на локальный компьютер.
  • Устройство может иметь до 60 дисков, подключенных к нему. Если у виртуальных машин, выполняющих возврат, общей сложностью больше 60 дисков, или если вы выполняете возврат больших объемов трафика, создайте отдельное устройство для восстановления.

Плановая отработка отказа работает следующим образом:

  • Чтобы вернуть выполнение на локальные ресурсы, виртуальной машине необходимо иметь как минимум одну точку восстановления. У всех виртуальных машин в плане восстановления должна быть по крайней мере одна точка восстановления.
  • Поскольку это запланированная процедура переключения на резервную копию, вы можете выбрать тип точки восстановления, которую вы хотите использовать для возврата. Используйте точку, согласованную с аварией.
    • Существует также вариант точки восстановления, согласованной с приложением. В этом случае одна виртуальная машина восстанавливается до своей последней доступной точки восстановления, согласованной с приложением. Если выполняется план восстановления для группы репликации, восстановление будет выполнено до общей доступной точки восстановления.
    • Согласованные с приложением точки восстановления могут быть позднее по времени. Из-за этого может произойти потеря данных.
  • Во время отработки отказа из Azure на локальный сайт Site Recovery завершает работу виртуальных машин Azure. При подтверждении отработки отказа Site Recovery удаляет виртуальные машины в Azure, которые были возвращены после сбоя.

Примечание.

Загрузка виртуальной машины аварийного переключения может занять больше времени в Windows Server 2012 или более ранних версиях при использовании точек восстановления, обеспечивающих согласованность при сбоях.

Повторная защита и обратное восстановление для серверов VMware и физических серверов.

Чтобы повторно защитить и вернуть в рабочее состояние виртуальные машины VMware и физические серверы из Azure в локальную инфраструктуру, убедитесь, что у вас есть работоспособное устройство.

Выбор устройства

  • Выберите любое из устройств репликации Azure Site Recovery, зарегистрированных в хранилище, чтобы повторно настроить защиту для локальной среды. Вам не нужен отдельный сервер обработки в Azure для повторной защиты или масштабируемого главного целевого сервера для виртуальных машин Linux.
  • Во время возврата устройство репликации не требует другого сетевого подключения или портов (по сравнению с прямой защитой). Вы можете использовать одно и то же устройство для защиты вперед и назад, если оно находится в работоспособном состоянии. Это не должно влиять на производительность репликаций.
  • При выборе устройства убедитесь, что устройство может получить доступ к целевому хранилищу данных, где находится исходный компьютер. Устройство всегда должно обращаться к хранилищу данных исходного компьютера. Даже если виртуальная машина и апплаенс находятся на разных серверах ESX, повторная защита завершается успешно, пока хранилище данных совместно используется между ними.

    Примечание.

    • vMotion хранилища реплицируемых объектов не поддерживается. Служба хранилища vMotion устройства репликации не поддерживается после повторной защиты.
    • При выборе устройства убедитесь, что целевое хранилище данных, на котором находится исходный компьютер, доступно устройством.

Повторная защита задания

  • Если это задание является новой операцией повторной защиты, Azure Site Recovery автоматически создает новую учетную запись хранения журналов по умолчанию в целевом регионе. Диск хранения не требуется.
  • Восстановление на альтернативном месте и на исходном месте предполагает извлечение оригинальных настроек исходных компьютеров.

    Примечание.

    • Не удается сохранить статический IP-адрес в случае повторной защиты альтернативного расположения (ALR) или повторного защиты исходного расположения (OLR).
    • Изменяются файлы fstab и LVMconf.

Сбой

  • Вы можете повторно запустить любое неудачное задание по защите. Во время повтора можно выбрать любое работоспособное устройство репликации.

При повторной защите машин Azure в локальной среде вы получите уведомление о возврате в исходное расположение или в альтернативное расположение.

  • Восстановление исходного расположения: эта операция возвращает данные из Azure на тот же исходный локальный компьютер, если он существует. В этом сценарии в локальную среду будет выполнена репликация только изменившихся данных.

    • Выбор хранилища данных во время OLR: хранилище данных, подключенное к исходному компьютеру, автоматически выбирается.
  • Восстановление в альтернативное расположение: если локальной машины не существует, вы можете выполнить возврат из Azure в альтернативное расположение. При повторном включении защиты виртуальной машины Azure в локальной среде создается локальный компьютер. Выполняется полная репликация данных из Azure в локальную среду. Ознакомьтесь с требованиями и ограничениями при восстановлении местоположения.

    • Выбор хранилища данных во время ALR: вы можете выбрать любое хранилище данных, управляемое vCenter, на котором находится устройство и доступно (разрешения на чтение и запись) устройством. Вы можете выбрать исходное или новое хранилище данных. Вы можете выбрать учетную запись хранения кэша, используемую для повторного защиты.
  • После завершения отработки отказа агент мобильности на виртуальной машине Azure автоматически регистрируется в службах Site Recovery. При сбое регистрации на виртуальной машине возникает критическая проблема работоспособности. После устранения проблемы регистрация активируется автоматически. Вы можете вручную завершить регистрацию после устранения ошибок.

Отмена переноса нагрузки

Если локальная среда не готова или если вы столкнулись с какими-либо проблемами, можно отменить переключение на резерв.

После того как вы инициируете плановое завершение отказа и оно успешно завершится, ваша локальная среда становится доступной для использования. Но после завершения операции, если вы хотите переключиться на другую точку восстановления, можно отменить отработку отказа.

  • Вы можете отменить только запланированное переключение на резерв.

  • Вы можете отменить планируемый отказ со страницы Реплицированные элементы в хранилище Служб восстановления.

  • После отмены переключения на отказоустойчивую систему компьютеры в Azure снова включаются, и репликация возобновляется из Azure в локальный центр обработки данных.

Следующие шаги