Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описывается поддержка надежности в Azure Private 5G Core. Она охватывает как региональную устойчивость с зонами доступности , так и аварийное восстановление между регионами и непрерывность бизнес-процессов. Общие сведения о надежности в Azure см. в статье " Надежность Azure".
Вы также можете развернуть частную службу Azure 5G Core как службу высокой доступности (HA) на парах устройств Azure Stack Edge (ASE). Дополнительные сведения см. в разделе "Выполнение необходимых задач" для развертывания частной мобильной сети.
Поддержка зоны доступности
Зоны доступности — это физически отдельные группы центров обработки данных в каждом регионе Azure. При сбое одной зоны службы могут переключиться на одну из оставшихся зон.
Служба Azure Private 5G Core автоматически развертывается с избыточностью по зонам в регионах Azure, поддерживающих зоны доступности, как указано в документе Регионы Azure с поддержкой зон доступности. Если регион поддерживает зоны доступности, все ресурсы Azure Private 5G Core, созданные в регионе, можно управлять из любой из зон доступности.
Для настройки или управления зонами доступности не требуется дополнительная работа. Переключение между зонами доступности выполняется автоматически.
Предпосылки
Сведения о продуктах, доступных по регионам Azure, где доступна частная служба Azure 5G Core.
Опыт снижения активности в зоне
В случае сбоя на уровне зоны пользователи не должны испытывать никаких последствий, так как служба будет автоматически переключаться на исправную зону. В начале сбоя на уровне зоны вы можете видеть, как запросы ARM на выполнение истекают по времени или завершаются сбоем. Новые запросы будут направляться на здоровые узлы без воздействия на пользователей, и любые неудачные операции должны быть повторно выполнены. Вы по-прежнему сможете создавать новые ресурсы и обновлять, отслеживать и управлять существующими ресурсами во время сбоя.
Методы безопасного развертывания
Приложение гарантирует, что все облачные состояния реплицируются между зонами доступности в регионе, поэтому все операции управления будут продолжаться без прерывания. Пакетное ядро работает на Edge и не подвержено сбою зоны, поэтому продолжит предоставлять услуги пользователям.
Аварийное восстановление между регионами и непрерывность бизнес-процессов
Аварийное восстановление (DR) относится к процедурам, которые организации используют для восстановления после событий значительного воздействия, таких как стихийные бедствия или ошибочные развертывания, которые приводят к простою и потере данных. Независимо от причины, лучшее средство для аварийного восстановления является хорошо определенным и проверенным планом аварийного восстановления и проектом приложения, который активно поддерживает аварийное восстановление. Прежде чем приступить к созданию плана аварийного восстановления, ознакомьтесь с рекомендациями по разработке стратегии аварийного восстановления.
Для восстановления после сбоя компания Microsoft использует модель общей ответственности. В этой модели корпорация Майкрософт гарантирует, что доступны базовые инфраструктуры и службы платформы. Однако многие службы Azure не делают автоматической репликации данных и не обеспечивают возврат из вышедшего из строя региона для перекрестной репликации в другой доступный регион. Для этих сервисов вы отвечаете за настройку плана аварийного восстановления, соответствующего вашей рабочей нагрузке. Большинство служб, работающих на платформе Azure как услуга (PaaS), предоставляют функции и рекомендации для поддержки аварийного восстановления. Вы можете использовать специализированные функции для поддержки быстрого восстановления и разработки плана аварийного восстановления.
Azure Private 5G Core доступен только в географиях с несколькими регионами (3+N). Служба автоматически реплицирует учетные данные SIM в регион резервного копирования в том же географическом регионе. Это означает, что в случае сбоя региона нет потери данных. В течение четырех часов после сбоя все ресурсы в регионе сбоем доступны для просмотра с помощью портала Azure и инструментов ARM, но будут доступны только для чтения до восстановления неисправного региона. Ядро пакета, работающее на границе сети, продолжает функционировать без перерывов, а сетевое подключение будет поддерживаться.
Корпорация Майкрософт отвечает за обнаружение сбоев, уведомление и поддержку облачных аспектов службы Azure Private 5G Core.
Обнаружение сбоев, уведомление и управление
Корпорация Майкрософт отслеживает базовые ресурсы, предоставляющие службу Azure Private 5G Core в каждом регионе. Если эти ресурсы начинают отображать сбои или оповещения мониторинга работоспособности, которые не ограничены одной зоной доступности, корпорация Майкрософт переместит службу в другой поддерживаемый регион в том же географическом регионе. Это шаблон Active-Active. Состояние служб для определенного региона можно найти в Службе состояния служб Azure (Azure Private 5G Core указан в разделе "Сеть"). Вы получите уведомление о сбоях в любом регионе через обычные каналы связи Azure.
Служба автоматически реплицирует учетные данные SIM, принадлежащие службе, в регион резервного копирования с помощью операций записи в нескольких регионах Cosmos DB, поэтому в случае сбоя региона нет потери данных.
Ресурсы Azure Private 5G Core, развернутые в неисправном регионе, становятся доступны только для чтения, но ресурсы во всех остальных регионах будут продолжать работать без изменений. Если вы должны постоянно записывать ресурсы, следуйте инструкциям в статье "Настройка аварийного восстановления и обнаружение сбоев ", чтобы выполнить собственную операцию аварийного восстановления и настроить службу в другом регионе.
Ядро пакета, работающее на границе сети, продолжает функционировать без перерывов, а сетевое подключение будет поддерживаться.
Настройка аварийного восстановления и обнаружения сбоев
В этом разделе описывается, какие возможные действия можно предпринять, чтобы обеспечить полностью активную управляющую плоскость для службы Azure Private 5G Core в случае отказа региона. Это необходимо, если вы хотите иметь возможность изменить свои ресурсы на случай сбоя региона.
Обратите внимание, что это приведет к сбою основной службы пакетов и прерыванию сетевого подключения к UEs до восьми часов, поэтому рекомендуется использовать только эту процедуру, если у вас есть критически важные для бизнеса причины для управления ресурсами, пока регион Azure не работает.
Перед началом мероприятия по аварийному восстановлению необходимо создать резервную копию конфигурации ресурсов в регионе, поддерживающем Azure Private 5G Core. При сбое региона можно повторно развернуть ядро пакета с помощью ресурсов в регионе резервного копирования.
Подготовка
Существует два типа данных конфигурации Azure Private 5G Core, которые необходимо сохранить для аварийного восстановления: конфигурация мобильной сети и учетные данные SIM-карты. Примите во внимание следующие рекомендации.
- Обновление учетных данных SIM в регионе резервного копирования при каждом добавлении новых SIM в основной регион
- Резервное копирование конфигурации мобильной сети по крайней мере один раз в неделю или чаще, если вы вносите частые или большие изменения в конфигурацию, например создание нового сайта.
Конфигурация мобильной сети
Следуйте инструкциям в разделе "Перемещение ресурсов в другой регион ", чтобы экспортировать конфигурацию ресурсов Azure Private 5G Core и отправить ее в новый регион. Рекомендуется использовать новую группу ресурсов для конфигурации резервного копирования, чтобы четко отделить ее от активной конфигурации. Вы должны предоставить новые имена ресурсов, чтобы отличить их от ресурсов в основном регионе. Этот новый регион является пассивной резервной копией, поэтому, чтобы избежать конфликтов, вы еще не должны связывать конфигурацию пакетного ядра с оборудованием вашего узла. Вместо этого сохраните значения из поля packetCoreControlPlanes.platform для каждого ядра пакетов в безопасном месте, доступном для всех, кто будет выполнять процедуру восстановления (например, учётная запись хранения, на которую ссылается внутренняя документация).
Данные SIM
По соображениям безопасности Azure Private 5G Core никогда не будет возвращать учетные данные SIM-карты, предоставленные службе в рамках её создания. Поэтому невозможно экспортировать конфигурацию SIM так же, как и другие ресурсы Azure. Мы рекомендуем каждый раз, когда новые SIM добавляются в основную службу, те же SIM также добавляются в службу резервного копирования, повторяя процесс подготовки новых SIM для резервной мобильной сети.
Другие ресурсы
Развертывание Azure Private 5G Core может использовать Azure Key Vaults для хранения ключей шифрования SIM или сертификатов HTTPS для локального мониторинга. Чтобы убедиться, что ключи и сертификаты будут доступны в регионе резервного копирования, необходимо следовать документации по Azure Key Vault .
Восстановление
В случае сбоя региона сначала убедитесь, что все ресурсы в регионе резервного копирования присутствуют, запрашивая конфигурацию через портал Azure или API (см. статью "Перемещение ресурсов в другой регион"). Если не все ресурсы присутствуют, остановитесь на этом этапе и не следуйте оставшейся процедуре. Возможно, вы не сможете восстановить сервис на удаленном узле без конфигурации ресурсов.
Процесс восстановления разделен на три этапа для каждого ядра пакета:
- Отключение устройства Azure Stack Edge от неудающегося региона путем сброса
- Подключение устройства Azure Stack Edge к региону резервного копирования
- Переустановите и проверьте установку.
Этот процесс необходимо повторить для каждого ядра пакетов в мобильной сети.
Осторожность
Процедура восстановления приведет к отключению пакетного ядра и прерыванию сетевого подключения к пользовательскому оборудованию до восьми часов для каждого пакетного ядра. Мы рекомендуем выполнять эту процедуру только в случае крайней необходимости для управления развертыванием Azure Private 5G Core через Azure в ситуации сбоя региона.
Отключение устройства Azure Stack Edge от региона, вышедшего из строя
Устройство Azure Stack Edge в настоящее время работает с программным обеспечением пакетного ядра и управляется из неисправного региона. Чтобы отключить устройство Azure Stack Edge от вышедшего из строя региона и удалить запущенное ядро сетевого пакета, выполните инструкции по сбросу и повторной активации в Сброс и повторная активация устройства Azure Stack Edge. Обратите внимание, что это приведет к удалению всех программ, работающих на устройстве Azure Stack Edge, а не только программного обеспечения для ядра пакетов, поэтому убедитесь, что у вас есть возможность переустановить любое другое программное обеспечение на устройстве. Это приведет к сбою сети для всех устройств, подключенных к ядру пакетов на этом устройстве Azure Stack Edge.
Подключение устройства Azure Stack Edge к новому региону
Следуйте инструкциям в Настройка кластера AKS, чтобы восстановить развертывание кластера службы Azure Kubernetes на устройстве Azure Stack Edge. Убедитесь, что вы используете другое имя для этой новой установки, чтобы избежать конфликтов при восстановлении сбойного региона. В рамках этого процесса вы получите новый идентификатор пользовательского расположения для кластера, который следует записать.
Переустановка и проверка
Скопируйте значения packetCoreControlPlanes.platform , хранящиеся в разделе "Подготовка" , и обновите поле packetCoreControlPlane.platform.customLocation с указанным выше идентификатором расположения. Убедитесь, что пакетCoreControlPlane.platform.azureStackEdgeDevice соответствует идентификатору устройства Azure Stack Edge, на которое вы хотите установить ядро пакета. Теперь следуйте инструкциям по изменению ядра пакетов , чтобы обновить ядро пакета резервного копирования со значениями платформы. Это приведет к запуску развертывания пакетного ядра на устройстве Azure Stack Edge.
Чтобы убедиться, что подключение UE восстановлено, и все сетевые функции работают, следует следовать обычному процессу проверки установки нового сайта. В частности, следует убедиться, что на панелях мониторинга сайта на портале Azure отображаются регистрации UE, а данные передаются через плоскость данных.
Ошибочный регион восстановлен
Когда не удалось восстановить регион, необходимо убедиться, что конфигурация в двух регионах синхронизирована, выполнив резервную копию из активного региона резервного копирования с восстановленным основным регионом, выполнив действия, описанные в разделе "Подготовка".
Кроме того, необходимо проверить и удалить все ресурсы в восстановленном регионе, который не был уничтожен на предыдущих шагах:
- Для каждого устройства Azure Stack Edge, перемещенного в регион резервного копирования (следуя инструкциям в восстановлении), необходимо найти и удалить старый ресурс кластера ARC. Идентификатор этого ресурса находится в поле packetCoreControlPlane.platform.customLocation из значений, которое вы сохранили в разделе Подготовка. Состояние этого ресурса будет отключено , так как соответствующий кластер Kubernetes был удален в процессе восстановления.
- Для каждого ядра пакета, перемещенного в регион резервного копирования (следуя инструкциям в восстановлении), необходимо найти и удалить все объекты NFM в восстановленном регионе. Они будут перечислены в той же группе ресурсов, что и ресурсы уровня управления ядра пакетов, а значение региона будет соответствовать восстановленному региону.
Затем у вас есть два варианта для текущего управления:
- Используйте рабочий регион резервного копирования в качестве нового основного региона и используйте восстановленный регион в качестве резервной копии. В дальнейших действиях нет необходимости.
- Сделайте восстановленный регион новым активным основным регионом, следуя инструкциям в разделе "Перемещение ресурсов в другой регион ", чтобы вернуться в восстановленный регион.
Тестирование
Если вы хотите протестировать планы аварийного восстановления, вы можете следовать процедуре восстановления для одного ядра пакетов в любое время. Обратите внимание, что это приведет к сбою службы ядра пакетов и прерыванию сетевого подключения к UEs до четырех часов, поэтому рекомендуется выполнять это только с непроизводственных развертываний ядра пакетов или в то время, когда сбой не повлияет на ваш бизнес.