Поделиться через


Надежность в Microsoft Fabric

В этой статье описывается поддержка надежности в Microsoft Fabric, а также как региональная устойчивость с зонами доступности, так и восстановлением между регионами и непрерывностью бизнес-процессов. Более подробный обзор надежности в Azure см. в статье "Надежность Azure".

Поддержка зоны доступности

Зоны доступности Azure — это по крайней мере три физически отдельные группы центров обработки данных в каждом регионе Azure. Центры обработки данных в каждой зоне оснащены независимой питанием, охлаждения и сетевой инфраструктурой. В случае сбоя локальной зоны зоны зоны создаются таким образом, чтобы при возникновении влияния одной зоны, региональных служб, емкости и высокой доступности поддерживались остальными двумя зонами.

Сбои могут варьироваться от сбоев программного обеспечения и оборудования до таких событий, как землетрясения, наводнения и пожары. Устойчивость к сбоям достигается с избыточностью и логической изоляцией служб Azure. Дополнительные сведения о зонах доступности в Azure см. в разделе "Регионы и зоны доступности".

Службы с поддержкой зон доступности Azure предназначены для обеспечения правильного уровня надежности и гибкости. Их можно настроить двумя способами. Они могут быть избыточными по зонам с автоматической репликацией между зонами или зональными экземплярами, закрепленными в определенной зоне. Эти подходы также можно объединить. Дополнительные сведения об зональной архитектуре, избыточной между зонами, см . в рекомендациях по использованию зональных зон и регионов.

Fabric делает коммерчески разумные усилия по поддержке зон доступности, избыточных между зонами, где ресурсы автоматически реплицируются между зонами без необходимости настраивать или настраивать.

Необходимые компоненты

  • В настоящее время Fabric обеспечивает поддержку частичной зоны доступности в ограниченном количестве регионов. Эта поддержка частичной зоны доступности охватывает интерфейсы (или определенные функциональные возможности в интерфейсе).
  • Такие возможности, как Потоки событий, не поддерживают зоны доступности.
  • Проектирование данных поддерживает зоны доступности, если используется OneLake. Если вы используете другие источники данных, такие как ADLS 2-го поколения, необходимо убедиться, что хранилище, избыточное между зонами (ZRS), включено.
  • Доступность зоны может быть недоступна для функций и функций и функций Fabric, доступных в предварительной версии.
  • Локальные шлюзы и большие семантические модели в Power BI не поддерживают зоны доступности.
  • Фабрика данных (конвейеры) поддерживает зоны доступности в Западной Европе, но новые или непрогрессные конвейеры могут завершиться сбоем в случае сбоя зоны.

Поддерживаемые регионы

Fabric делает коммерчески разумные усилия по обеспечению поддержки зоны доступности в различных регионах следующим образом:

Северная и Южная Америки Power BI Datamarts Хранилища данных Анализ в реальном времени Фабрика данных (конвейеры) Инжиниринг данных
Южная Бразилия
Центральная Канада
Центральная часть США
Восточная часть США
восточная часть США 2
Центрально-южная часть США
западная часть США 2
Западная часть США — 3
Европа
Центральная Франция
Центрально-Западная Германия
Северная Италия
Северная Европа
Восточная Норвегия;
Центральная Польша
южная часть Соединенного Королевства
Западная Европа
Ближний Восток
Центральный Катар
Израиль, центральный регион
Африка
Северная часть ЮАР;
Азиатско-Тихоокеанский регион
Восточная Австралия
Восточная Япония
Юго-Восточная Азия

Взаимодействие с зонами вниз

Во время сбоя на уровне зоны во время восстановления зоны не требуется никаких действий. Возможности структуры в регионах, перечисленных в поддерживаемых регионах , самостоятельно исцеляются и перебалансируются автоматически, чтобы воспользоваться преимуществами здоровой зоны. Выполнение заданий Spark может завершиться ошибкой, если главный узел находится в зоне сбоя. В таком случае задания должны быть повторно опущены.

Внимание

Хотя корпорация Майкрософт стремится обеспечить единую и согласованную поддержку зоны доступности, в некоторых случаях сбой зоны доступности емкости Fabric, расположенные в регионах Azure с более высокими колебаниями спроса клиентов, могут столкнуться с более высокой задержкой.

Аварийное восстановление между регионами и непрерывность бизнес-процессов

Аварийное восстановление (АВАРИЙНОе восстановление) заключается в восстановлении из событий высокой нагрузки, таких как стихийные бедствия или неудачные развертывания, которые приводят к простою и потере данных. Независимо от причины, лучшее средство для аварийного восстановления является хорошо определенным и проверенным планом аварийного восстановления и проектом приложения, который активно поддерживает аварийное восстановление. Прежде чем начать думать о создании плана аварийного восстановления, ознакомьтесь с рекомендациями по разработке стратегии аварийного восстановления.

Когда дело доходит до аварийного восстановления, корпорация Майкрософт использует модель общей ответственности. В модели общей ответственности корпорация Майкрософт гарантирует, что доступны базовые службы инфраструктуры и платформы. В то же время многие службы Azure не автоматически реплицируют данные или не реплицируются из неудающегося региона для перекрестной репликации в другой включенный регион. Для этих служб вы несете ответственность за настройку плана аварийного восстановления, который работает для рабочей нагрузки. Большинство служб, работающих на платформе Azure как услуга (PaaS), предоставляют функции и рекомендации для поддержки аварийного восстановления, и вы можете использовать специальные функции службы для поддержки быстрого восстановления для разработки плана аварийного восстановления .

В этом разделе описывается план аварийного восстановления для Fabric, предназначенный для обеспечения безопасности и доступности данных в организации при возникновении незапланированной региональной катастрофы. План охватывает следующие разделы:

  • Репликация между регионами: Структура предлагает репликацию между регионами для данных, хранящихся в OneLake. Вы можете отказаться от этой функции в зависимости от ваших требований.

  • Доступ к данным после аварии: в региональном сценарии аварии Fabric гарантирует доступ к данным с определенными ограничениями. Хотя создание или изменение новых элементов ограничено после отработки отказа, основное внимание уделяется обеспечению доступности и нетронутости существующих данных.

  • Руководство по восстановлению: Структура предоставляет структурированный набор инструкций, которые помогут вам выполнить процесс восстановления. Структурированное руководство упрощает переход к обычным операциям.

Power BI, которая теперь входит в состав Fabric, имеет надежную систему аварийного восстановления и предлагает следующие функции:

  • BCDR как по умолчанию: Power BI автоматически включает возможности аварийного восстановления в своем предложении по умолчанию. Вам не нужно включать или активировать эту функцию отдельно.

  • Репликация между регионами. Power BI использует геоизбыточное репликацию хранилища Azure и геоизбыточное репликацию SQL Azure, чтобы гарантировать наличие экземпляров резервного копирования в других регионах и их можно использовать. Это означает, что данные дублируются в разных регионах, повышая доступность и уменьшая риски, связанные с региональными сбоями.

  • Продолжающиеся службы и доступ после аварии: даже во время разрушительных событий элементы Power BI остаются доступными в режиме только для чтения. Элементы включают семантические модели, отчеты и панели мониторинга, гарантируя, что предприятия могут продолжать свои процессы анализа и принятия решений без значительных помех.

Дополнительные сведения см. в разделе "Высокий уровень доступности, отработка отказа и аварийное восстановление" в Power BI

Внимание

Для клиентов, чьи домашние регионы не имеют региона пары Azure и страдают от аварии, возможность использования емкостей Fabric может быть скомпрометирована, даже если данные в этих емкостях реплицируются. Это ограничение связано с инфраструктурой домашнего региона, важной для работы емкостей.

Функциональность домашнего региона и емкости

Для эффективного планирования аварийного восстановления важно понимать связь между домашним регионом и расположениями емкости. Общие сведения о домашних регионах и расположениях емкости помогают выбирать стратегические регионы емкости, а также соответствующие процессы репликации и восстановления.

Домашний регион для клиента и хранилища данных вашей организации устанавливается на адрес выставления счетов первого пользователя, который регистрируется. Дополнительные сведения о настройке арендатора см. в разделе "Планирование реализации Power BI: настройка клиента". При создании новых емкостей хранилище данных по умолчанию присваивается домашнему региону. Если вы хотите изменить регион хранения данных в другой регион, вам потребуется включить функцию Multi-Geo( Fabric Premium).

Внимание

Выбор другого региона для емкости не полностью перемещает все данные в этот регион. Некоторые элементы данных по-прежнему хранятся в домашнем регионе. Сведения о том, какие данные остаются в домашнем регионе и какие данные хранятся в регионе с поддержкой нескольких регионов, см. в разделе "Настройка поддержки нескольких регионов" для Fabric Premium.

В случае с домашним регионом, который не имеет парного региона, емкости в любом регионе с поддержкой нескольких регионов могут столкнуться с операционными проблемами, если домашний регион сталкивается с катастрофой, так как основные функции службы подключены к домашнему региону.

Если выбрать регион с поддержкой нескольких регионов в ЕС, вы гарантируете, что данные хранятся в пределах границы данных ЕС.

Сведения о том, как определить свой домашний регион, см. в статье "Поиск домашнего региона Fabric".

Настройка емкости аварийного восстановления

Fabric предоставляет переключатель аварийного восстановления на странице параметров емкости. Она доступна, когда региональные пары Azure соответствуют присутствию службы Fabric. Ниже приведены особенности этого параметра:

  • Доступ к роли: только пользователи с ролью администратора емкости или выше могут использовать этот параметр.

  • Степень детализации. Степень детализации коммутатора — это уровень емкости. Он доступен как для емкостей Premium, так и Fabric.

  • Область данных: переключатель аварийного восстановления специально обращается к данным OneLake, включая данные Lakehouse и Warehouse. Параметр не влияет на данные, хранящиеся за пределами OneLake.

  • Непрерывность BCDR для Power BI. Хотя аварийное восстановление для данных OneLake можно включить и отключить, BCDR для Power BI всегда поддерживается независимо от того, включен или отключен параметр.

  • Частота. После изменения параметра емкости аварийного восстановления необходимо ждать 30 дней, прежде чем снова изменить его. Период ожидания устанавливается для поддержания стабильности и предотвращения переключения констант,

Снимок экрана: параметр клиента аварийного восстановления.

Примечание.

После включения параметра емкости аварийного восстановления данные могут занять до одной недели, чтобы данные начали репликацию.

Репликация данных

Если включить параметр емкости аварийного восстановления, репликация между регионами включена как возможность аварийного восстановления для данных OneLake. Платформа Fabric соответствует регионам Azure для подготовки пар геоизбыточности. Однако в некоторых регионах нет региона пары Azure или регион пары не поддерживает Fabric. Для этих регионов репликация данных недоступна. Дополнительные сведения см. в разделе "Регионы с зонами доступности" и "Нет пары регионов" и "Доступность региона Fabric".

Примечание.

Хотя Fabric предлагает решение для репликации данных в OneLake для поддержки аварийного восстановления, существуют заметные ограничения. Например, данные баз данных и наборов запросов KQL хранятся внешне в OneLake, что означает, что требуется отдельный подход к аварийному восстановлению. Дополнительные сведения о подходе аварийного восстановления для каждого элемента Fabric см. в следующем документе.

Выставление счетов

Функция аварийного восстановления в Fabric обеспечивает георепликацию данных для повышения безопасности и надежности. Эта функция использует больше хранилища и транзакций, которые выставляются как хранилище BCDR и операции BCDR соответственно. Эти затраты можно отслеживать и управлять в приложении метрик емкости Microsoft Fabric, где они отображаются в виде отдельных элементов строки.

Исчерпывающие сведения обо всех связанных затратах на аварийное восстановление, которые помогут вам спланировать и бюджет соответствующим образом, см. в статье OneLake для вычислений и потребления хранилища.

Настройка аварийного восстановления

Хотя Fabric предоставляет функции аварийного восстановления для поддержки устойчивости данных, необходимо выполнить определенные действия вручную, чтобы восстановить службу во время сбоев. В этом разделе описаны действия, которые необходимо предпринять для подготовки к потенциальным нарушениям.

Этап 1. Подготовка

  • Активируйте параметры емкости аварийного восстановления: регулярно просматривайте и устанавливайте параметры емкости аварийного восстановления, чтобы убедиться, что они соответствуют вашим потребностям в защите и производительности.

  • Создание резервных копий данных. Скопируйте критически важные данные, хранящиеся вне OneLake, в другой регион таким образом, чтобы выровнять план аварийного восстановления.

Этап 2. Отработка отказа

Когда основная авария отрисовывает основной регион неустранимым, Microsoft Fabric инициирует региональную отработку отказа. Доступ к порталу Fabric недоступен до завершения отработки отказа, и уведомление будет размещено на странице поддержки Microsoft Fabric.

Время, необходимое для завершения отработки отказа, может отличаться, хотя обычно это занимает менее одного часа. После завершения отработки отказа вы можете ожидать следующее:

  • Портал Fabric: вы можете получить доступ к порталу, а операции чтения, такие как просмотр существующих рабочих областей и элементов, продолжают работать. Все операции записи, такие как создание или изменение рабочей области, приостановлены.

  • Power BI. Вы можете выполнять операции чтения, такие как отображение панелей мониторинга и отчетов. Обновления, операции публикации отчетов, изменения панели мониторинга и отчета, а также другие операции, требующие изменений в метаданных, не поддерживаются.

  • Lakehouse или Warehouse: вы не можете открыть эти элементы, но к файлам можно получить доступ через API-интерфейсы Или инструменты OneLake.

  • Определение задания Spark: нельзя открывать определения заданий Spark, но к файлам кода можно обращаться через API-интерфейсы Или средства OneLake. Все метаданные или конфигурации будут сохранены после отработки отказа.

  • Записная книжка: вы не можете открывать записные книжки, а содержимое кода не будет сохранено после аварии.

  • Модель машинного обучения или эксперимент. Нельзя открывать модели машинного обучения или эксперименты. Содержимое кода и метаданные, такие как метрики выполнения и конфигурации, не будут сохранены после аварии.

  • Поток данных 2-го поколения или конвейера или события: вы не можете открыть эти элементы, но для защиты данных можно использовать поддерживаемые назначения аварийного восстановления (озера или хранилища).

  • База данных или набор запросов KQL: после отработки отказа вы не сможете получить доступ к базам данных KQL и наборам запросов. Для защиты данных в базах данных и наборах запросов KQL требуются дополнительные действия.

В случае аварии портал Fabric и Power BI находятся в режиме только для чтения, а другие элементы Fabric недоступны, вы можете получить доступ к их данным, хранящимся в OneLake, с помощью API или сторонних средств. Портал и Power BI сохраняют возможность выполнять операции чтения и записи данных. Эта возможность гарантирует, что критически важные данные остаются доступными и изменяемыми и устраняют потенциальные нарушения бизнес-операций.

Данные OneLake по-прежнему доступны через несколько каналов:

Этап 3. План восстановления

Хотя Структура гарантирует, что данные остаются доступными после аварии, вы также можете действовать для полного восстановления служб в состоянии до инцидента. В этом разделе представлено пошаговое руководство по работе с процессом восстановления.

Действия по восстановлению

  1. Создайте новую емкость Fabric в любом регионе после аварии. Учитывая высокий спрос во время таких событий, рекомендуется выбрать регион за пределами основного географического региона, чтобы повысить вероятность доступности службы вычислений. Сведения о создании емкости см. в статье "Приобретение подписки Microsoft Fabric".

  2. Создайте рабочие области в созданной емкости. При необходимости используйте те же имена, что и старые рабочие области.

  3. Создайте элементы с теми же именами, что и те, которые требуется восстановить. Этот шаг важен, если вы используете пользовательский скрипт для восстановления озерных домов и складов.

  4. Восстановите элементы. Для каждого элемента следуйте соответствующему разделу в руководстве по аварийному восстановлению для конкретного опыта для восстановления элемента.

Следующие шаги