Проектирование для обеспечения высокого уровня доступности с помощью ExpressRoute
ExpressRoute гарантирует высокий уровень доступности для обеспечения возможности подключения частной сети операторского уровня к ресурсам Майкрософт. Иными словами, по пути ExpressRoute в сети Майкрософт нет единой точки отказа. Чтобы максимально увеличить доступность, необходимо также разработать архитектуру с высоким уровнем доступности для стороны клиента и поставщика услуг для канала ExpressRoute. В этой статье мы рассмотрим рекомендации по архитектуре сети для создания надежного сетевого подключения с использованием ExpressRoute, а затем рассмотрим возможности тонкой настройки, которые помогут улучшить высокий уровень доступности канала ExpressRoute.
Примечание.
Основные понятия, описанные в этой статье, справедливы для создания канала ExpressRoute в Виртуальной глобальной сети или за ее пределами.
Рекомендации по архитектуре
На следующем рисунке показан рекомендуемый способ подключения с использованием канала ExpressRoute для максимизации доступности канала ExpressRoute.
Для обеспечения высокого уровня доступности важно поддерживать избыточность канала ExpressRoute во всей сети. Иными словами, необходимо обеспечить избыточность в локальной сети и не нарушать избыточность в сети поставщика услуг. Поддержание минимальной избыточности подразумевает отсутствие единой точки отказов в сети. При избыточности питания и охлаждения для сетевых устройств увеличивается высокий уровень доступности.
Рекомендации по проектированию физического слоя "первой мили"
В случае замыкания основного и вспомогательного каналов ExpressRoute на одно и то же оборудование конечных пользователей будет нарушен высокий уровень доступности в локальной сети. Кроме того, при настройке основных и вторичных подключений с использованием одного порта CPE партнер также заставляет партнера компрометировать высокий уровень доступности в своем сегменте сети. Это событие может произойти путем прекращения двух подключений в разных подмножиях или слиянием двух подключений в партнерской сети. Этот недостаток продемонстрирован на рисунке ниже.
С другой стороны, если вы замкнете основное и вспомогательное соединение каналов ExpressRoute на разные географические места, так может быть нарушено качество сетевого соединения. Если трафик активно распределяется по нагрузке между основным и вспомогательным соединениями, которые завершаются в разных географических местах, потенциально существенное различие в сетевой задержке между двумя путями приведет к неоптимальной производительности сети.
Сведения о геоизбыточном проектировании см. в статье Проектирование для аварийного восстановления с помощью ExpressRoute.
Соединения в режиме "активный — активный"
Сеть Майкрософт настроена для работы основного и вспомогательного соединений каналов ExpressRoute в режиме "активный — активный". Однако с помощью объявлений маршрутов можно принудительно создать избыточность соединений канала ExpressRoute в активном и пассивном режимах. Объявление более конкретных маршрутов и ожидаемого пути BGP AS — распространенные методы, позволяющие сделать один путь предпочтительнее другого.
Для повышения высокого уровня доступности рекомендуется работать как с подключением канала ExpressRoute в режиме "активный — активный". Если вы разрешите работу соединений в режиме "активный — активный", сеть Microsoft будет осуществлять балансировку сетевой нагрузки для распределения трафика между соединениями на основе каждого потока.
При запуске основного и вспомогательного соединения канала ExpressRoute в режиме "активный — пассивный" возникает риск сбоя обоих соединений после сбоя в активном пути. Распространенная причина сбоя при переключении на другое соединение — это отсутствие активного управления пассивным соединением, в результате чего пассивное соединение объявляет устаревшие маршруты.
Напротив, работа основного и вспомогательного соединений канала ExpressRoute в режиме "активный — активный" приводит к сбою и перенаправлению только примерно половины потоков. Таким образом, использование соединения в режиме "активный — активный" значительно улучшает показатель среднего времени для восстановления (MTTR).
Примечание.
Если плановое обслуживание или непредвиденные обстоятельства повлияют на одно из этих подключений, корпорация Майкрософт выполнит переключение на ожидаемый путь AS для передачи всего трафика в работоспособное подключение. Необходимо убедиться, что трафик может направляться по здоровому пути, когда предустановка пути настроена от Корпорации Майкрософт, и необходимые объявления маршрутов настроены соответствующим образом, чтобы избежать каких-либо нарушений работы службы.
NAT для пиринга Майкрософт
Пиринг Майкрософт предназначен для обмена данными между общедоступными конечными точками. Таким образом, локальные частные конечные точки работают с преобразованием сетевых адресов (NAT) в общедоступные IP-адреса на стороне клиента или партнерской сети до подключения к пиринговой сети Майкрософт. При условии, что в установке active-active используются первичные и вторичные подключения. Где и как ваш NAT влияет на то, как быстро восстановиться после сбоя в одном из подключений ExpressRoute. На следующем рисунке показаны два различных варианта NAT.
Вариант 1:
NAT применяется после разделения трафика между основным и вспомогательным подключениями канала ExpressRoute. Чтобы соблюсти требования NAT к отслеживанию состояния, для основного и вспомогательного устройств используются независимые пулы NAT. Обратный трафик поступает на то же пограничное устройство, через которое поток исходят.
В случае сбоя канала ExpressRoute нарушается возможность взаимодействия с соответствующим пулом NAT. Таким образом, все сломанные сетевые потоки должны быть восстановлены по протоколу TCP или по уровню приложения после соответствующего времени ожидания окна. В случае сбоя Azure не сможет обращаться к локальным серверам через соответствующий NAT, пока не восстановится соединение для основного или вспомогательного подключений канала ExpressRoute.
Вариант 2.
Используется общий пул NAT перед разделением трафика между основным и вспомогательным подключениями канала ExpressRoute. Важно сделать различие, что общий пул NAT перед разделением трафика не означает, что он представляет собой единую точку сбоя, так как такая компрометации высокой доступности.
Пул NAT остается доступным даже в случае сбоя основного или вспомогательного подключения. Таким образом, сетевой слой может перенаправить пакеты и ускорить восстановление после сбоя.
Примечание.
- Если вы используете первый вариант (независимые пулы NAT для основного и вспомогательного соединения ExpressRoute) и сопоставляете порт IP-адреса из одного из пулов NAT с локальным сервером, сервер не будет доступен через канал ExpressRoute при сбое соответствующего подключения.
- Завершение подключений BGP ExpressRoute на устройствах с отслеживанием состояний может привести к проблемам с отработкой отказа в случае планового или внепланового обслуживания, которое может проводиться корпорацией Майкрософт или поставщиком ExpressRoute. Вам следует тщательно протестировать используемую конфигурацию и убедиться, что при отработке отказа трафик направляется правильно. Насколько возможно, всегда лучше завершать сеансы BGP на устройствах без отслеживания состояния.
Возможности тонкой настройки для частного пиринга
В этом разделе мы рассмотрим дополнительные возможности (в зависимости от вашего развертывания Azure и того, насколько важен показатель MTTR), которые помогают повысить высокий уровень доступности канала ExpressRoute. В частности, давайте рассмотрим развертывание виртуальных сетевых шлюзов ExpressRoute с учетом зоны и обнаружение двунаправленной переадресации (BFD).
Виртуальные сетевые шлюзы ExpressRoute с учетом зоны доступности
Зона доступности в регионе Azure — это сочетание домена сбоя и домена обновления. Чтобы обеспечить максимальную устойчивость и доступность, необходимо настроить шлюз виртуальной сети ExpressRoute, избыточный между зонами. Дополнительные сведения см. в статье о шлюзах виртуальной сети, избыточных между зонами, в Azure Зоны доступности. Сведения о настройке шлюза виртуальной сети, избыточного между зонами, см. в статье "Создание шлюза виртуальной сети, избыточного между зонами" в Azure Зоны доступности.
Повышение быстроты обнаружения сбоев
ExpressRoute поддерживает BFD при частном пиринге. BFD сокращает время обнаружения сбоя по сети уровня 2 между Microsoft Enterprise Edge (MSEE) и соседями BGP на локальной стороне от 3 минут (по умолчанию) до менее чем 1 секунды. Быстрое обнаружения сбоев помогает ускорить восстановление после сбоев. Дополнительные сведения см. в статье Настройка обнаружения двунаправленной передачи через ExpressRoute.
Следующие шаги
В этой статье мы рассмотрели проектирование соединений канала ExpressRoute с учетом высокого уровня доступности. Точка пиринга каналов ExpressRoute закреплена в географическом расположении и поэтому влияет на катастрофический сбой, влияющий на все расположение.
Рекомендации по проектированию для создания геоизбыточного сетевого подключения к магистрали Майкрософт, которые могут противостоять катастрофическим сбоям, которые влияют на весь регион, см. в статье "Проектирование аварийного восстановления с помощью частного пиринга ExpressRoute".