Поделиться через


Что такое документация по надежности Azure?

Azure предоставляет полный набор возможностей надежности, которые помогут вам удовлетворить требования к рабочей нагрузке. В документации по надежности Azure приводятся руководства по обеспечению надежности каждой службы Azure, таких как временная обработка сбоев, зоны доступности, поддержка нескольких регионов и поддержка резервного копирования. Чтобы ознакомиться с текущим списком руководств по службам надежности, см. Руководства по надежности по службам.

Помимо руководств по службам надежности, документация по надежности Azure также содержит общие сведения, такие как:

  • Регионы Azure: информация о регионах Azure, парных и непарных регионах и различных конфигурациях регионов.
  • Зоны доступности Azure: сведения о зонах доступности, в том числе о том, как они поддерживают высокий уровень доступности и аварийное восстановление. В этом разделе также содержатся списки служб и регионов Azure, поддерживающих зоны доступности.
  • Основные понятия надежности: основные понятия надежности, такие как:
    • Непрерывность бизнес-процессов, высокий уровень доступности и аварийное восстановление.
    • Избыточность, репликация (избыточность данных) и резервное копирование
    • Переключение на резерв и возврат к исходной системе.
    • Общая ответственность между корпорацией Майкрософт и вами.

Что такое надежность?

Надежность относится к способности рабочей нагрузки последовательно выполняться на ожидаемом уровне и в соответствии с требованиями непрерывности бизнес-процессов. Надежность — это ключевая концепция облачных вычислений. В Azure надежность достигается с помощью сочетания факторов, включая проектирование самой платформы, ее служб, архитектуру приложений и реализацию рекомендаций.

Ключевым подходом к обеспечению надежности рабочей нагрузки является устойчивость, которая заключается в способности рабочей нагрузки противостоять сбоям и восстанавливаться после отказов. Azure предлагает ряд функций устойчивости, таких как зоны доступности, поддержка нескольких регионов, репликация данных и возможности резервного копирования и восстановления. Эти функции следует учитывать при разработке рабочей нагрузки для удовлетворения требований к непрерывности бизнес-процессов.

Подсказка

Надежность также включает в себя другие элементы разработки решения, включая безопасное развертывание изменений, управление производительностью, чтобы избежать простоя из-за высокой нагрузки, а также способ тестирования и проверки каждой части решения. Дополнительные сведения см. в статье Azure Well-Architected Framework.

Регионы Azure

Azure предоставляет более 60 регионов по всему миру, расположенных в разных регионах. Каждый регион — это набор физических объектов, включающих центры обработки данных и сетевую инфраструктуру. Все регионы могут быть разделены на географические области, называемые географическими областями. Каждая география — это граница расположения данных и может содержать один или несколько регионов.

Регионы Azure предоставляют определенные типы параметров устойчивости. Многие регионы предоставляют зоны доступности, и некоторые из них имеют парный регион, а другие - непарные. При выборе региона для служб важно обратить внимание на параметры устойчивости, доступные в этом регионе.

Зоны доступности Azure

Многие регионы Azure предоставляют зоны доступности, которые разделены группами центров обработки данных в пределах региона. Зоны доступности — это важный способ обеспечения надежности на платформе Azure, так как они обеспечивают определенный уровень физической изоляции в пределах региона.

Зоны доступности достаточно близки, чтобы иметь подключения с низкой задержкой к другим зонам доступности, но достаточно далеко друг от друга, чтобы снизить вероятность того, что несколько из них будут затронуты локальными сбоями или погодой. Зоны доступности имеют независимую инфраструктуру питания, охлаждения и сетевой инфраструктуры. Они разработаны таким образом, чтобы если одна зона испытывала сбой, то региональные службы, емкость и высокий уровень доступности поддерживаются остальными зонами.

Основные понятия надежности

В разделе "Основные понятия надежности" представлен обзор некоторых ключевых понятий и принципов, лежащих в основе надежности в Azure.

Непрерывность бизнес-процессов, высокий уровень доступности и аварийное восстановление

Планирование непрерывности бизнес-процессов можно понять как текущий процесс управления рисками с помощью высокого уровня доступности и проектирования аварийного восстановления.

При рассмотрении непрерывности бизнес-процессов важно понимать следующие термины:

  • Непрерывность бизнес-процессов — это состояние, в котором бизнес может продолжать работу во время сбоев, сбоев или аварий. Для обеспечения непрерывности бизнес-процессов требуется упреждающее планирование, подготовка и реализация устойчивых систем и процессов.

  • Высокий уровень доступности заключается в разработке решения для удовлетворения потребностей бизнеса в доступности и устойчивости к повседневным проблемам, которые могут повлиять на требования времени простоя.

  • Аварийное восстановление заключается в планировании того, как справиться с редкими рисками и катастрофическими сбоями, которые могут привести.

Сведения о планировании непрерывности бизнес-процессов и непрерывности бизнес-процессов с помощью проектирования высокого уровня доступности и аварийного восстановления см. в статье "Что такое непрерывность бизнес-процессов, высокий уровень доступности и аварийное восстановление?".

Избыточность, репликация и резервное копирование

Мы часто думаем об облаке как глобально распределенной, универсальной системе. Однако в действительности облако состоит из оборудования, работающего в центрах обработки данных. Для обеспечения устойчивости необходимо учитывать некоторые риски, связанные с расположением физических мест выполнения облачных компонентов.

Избыточность — это возможность поддерживать несколько идентичных копий компонента службы, а также использовать эти копии таким образом, чтобы один компонент не стал одной точкой сбоя.

Репликация или избыточность данных — это возможность поддерживать несколько копий данных, называемых репликами.

Резервное копирование — это возможность поддерживать метку времени, которую можно использовать для восстановления потерянных данных.

Общие сведения о избыточности, репликации и резервном копировании см. в статье "Что такое избыточность, репликация и резервное копирование?".

Отказоустойчивость и восстановление после сбоя

Распространенной причиной сохранения избыточных копий как приложений, так и реплик данных является возможность выполнить переключение на резервную систему. При резервном переключении можно перенаправить трафик и запросы от неисправных экземпляров на исправные. Затем, как только исходные экземпляры снова станут работоспособными, вы можете выполнить возврат к исходной конфигурации.

Дополнительные сведения об отработке отказа и восстановлении после сбоя см. в разделе "Что такое отработка отказа и восстановление после сбоя?".

Общая ответственность

Устойчивость определяет способность рабочей нагрузки автоматически исправлять и восстанавливаться из-за различных видов сбоев или отказов. Службы Azure создаются для обеспечения устойчивости ко многим общим сбоям, и каждый продукт предоставляет соглашение об уровне обслуживания (SLA), описывающее время простоя, которое можно ожидать. Однако общая устойчивость рабочей нагрузки зависит от того, как вы разработали решение для удовлетворения бизнес-потребностей. Некоторые планы непрерывности бизнес-процессов могут рассматривать некоторые риски сбоя, которые могут быть неважными, в то время как другие могут рассматривать их критическими.

На общедоступной облачной платформе Azure устойчивость — это общая ответственность между корпорацией Майкрософт и вами. Так как в каждой рабочей нагрузке вы разрабатываете и развертываете разные уровни устойчивости, важно понимать, кто несет основную ответственность за каждый из этих уровней с точки зрения устойчивости. Чтобы лучше понять, как работает общая ответственность, особенно при столкновении с сбоем или катастрофой, см . раздел "Общая ответственность за устойчивость".