Поделиться через


Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)

Область применения:SQL Server

Экземпляры отказоустойчивого кластера SQL Server AlwaysOn используют отказоустойчивую кластеризацию Windows Server (WSFC) для обеспечения локальной высокой доступности. Экземпляр отказоустойчивого кластера (FCI) является избыточным на уровне экземпляра сервера. FCI — это один экземпляр SQL Server, установленный на узлах кластера Windows Server и, возможно, в нескольких подсетях. В сети FCI отображается как экземпляр SQL Server, работающий на одном компьютере, но FCI обеспечивает отработку отказа с одного узла WSFC на другой, если текущий узел становится недоступным.

FCI может использовать группы доступности AlwaysOn для обеспечения удаленного аварийного восстановления на уровне базы данных. Дополнительные сведения см. в разделе Отказоустойчивая кластеризация и группы доступности Always On (SQL Server).

Экземпляры отказоустойчивого кластера SQL Server поддерживают Storage Spaces Direct для ресурсов хранилища кластера, введённых в выпуске Windows Server 2016 Datacenter. Дополнительные сведения можно найти в статье о локальных дисковых пространствах в Windows Server.

Экземпляры отказоустойчивого кластера также поддерживают общие тома кластера (CSV). Дополнительные сведения см. в разделе "Общие тома кластера" в отказоустойчивом кластере.

Примечание.

Предварительная версия SQL Server 2025 (17.x) предоставляет поддержку применения строгих подключений к экземпляру отказоустойчивого кластера.

Преимущества узлов резервирования в кластере

При сбое оборудования или программного обеспечения сервера приложения или клиенты, подключающиеся к серверу, могут испытывать простой. Избыточные узлы обеспечивают доступность экземпляра SQL Server, если используется FCI, а не одиночный экземпляр. Только один из узлов в FCI принадлежит группе ресурсов WSFC одновременно. Если происходит сбой (например, сбой оборудования, сбой операционной системы, приложение или служба) или во время запланированного обновления, кластер перемещает владение группой ресурсов на другой узел WSFC. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server. Процесс сводит к минимуму время простоя приложения или клиентов во время сбоя. Ниже приведены некоторые ключевые преимущества, предоставляемые экземплярами отказоустойчивого кластера SQL Server:

  • Защита на уровне экземпляра с помощью избыточности.

  • Автоматическое переключение в случае сбоя (сбои оборудования, операционной системы или приложений и служб).

    Внимание

    В группе доступности автоматическая отработка отказа из FCI на другие узлы в группе доступности не поддерживается. Таким образом, кластерные экземпляры FCI и автономные узлы не должны быть объединены в одну группу высокой доступности, если автоматическое переключение при отказе является важным компонентом вашего решения для обеспечения высокой доступности. Однако такое объединение можно сделать для решения аварийного восстановления .

  • Поддержка широкого спектра решений для хранения, включая диски кластера WSFC (iSCSI, Fibre Channel и т. д.) и общие папки блока сообщений сервера (SMB).

  • Аварийное восстановление с помощью многоподсетевого FCI или запуск базы данных, размещенной в FCI, в группе доступности. При поддержке нескольких подсетей в SQL Server 2012 (11.x) многоподсети FCI не требует виртуальной локальной сети. Эта поддержка повышает управляемость и безопасность FCI с несколькими подсетями.

  • Ноль перенастройки приложений и клиентов во время отработки отказа.

  • Гибкая политика отработки отказа для событий детализации триггеров для автоматической отработки отказа.

  • Надежная отработка отказа через периодическое и подробное обнаружение работоспособности с помощью выделенных и сохраненных подключений.

  • Настройка и прогнозируемость во время отработки отказа через косвенные фоновые контрольные точки.

  • Регулирование использования ресурсов во время отработки отказа.

Рекомендации

В рабочей среде используйте статические IP-адреса в сочетании с виртуальным IP-адресом экземпляра отказоустойчивого кластера.

Не используйте DHCP в рабочей среде. В случае простоя, если срок действия аренды DHCP-IP-адреса истекает, требуется дополнительное время для повторной регистрации нового IP-адреса DHCP, связанного с DNS-именем.

Общие сведения об экземпляре отказоустойчивого кластера

FCI работает в группе ресурсов WSFC вместе с одним или несколькими узлами WSFC. При запуске FCI один из узлов берет на себя ответственность за группу ресурсов и переносит его экземпляр SQL Server в режим "в сети". Ресурсы, принадлежащие данному узлу включают в себя:

  • Имя сети
  • IP-адрес
  • Общие диски
  • Служба ядро СУБД SQL Server
  • служба агента SQL Server
  • Служба SQL Server Analysis Services, если она установлена
  • Один файловый ресурс общего доступа, если установлен компонент FILESTREAM

В любое время только владелец группы ресурсов (и ни один другой узел в FCI) выполняет соответствующие службы SQL Server в группе ресурсов. Когда происходит переключение на резерв, будь то автоматическое или плановое, происходит следующая последовательность событий:

  1. Если событие не является сбоем оборудования или системы, все «грязные» страницы в буферном кэше записываются на диск.

  2. Все соответствующие службы SQL Server в группе ресурсов остановлены на активном узле.

  3. Права владения группой ресурсов переносятся на другой узел в FCI.

  4. Новый владелец группы ресурсов запускает службы SQL Server.

  5. Запросы подключения к клиентскому приложению автоматически направляются на новый активный узел с использованием того же имени виртуальной сети.

FCI находится в сети до тех пор, пока его базовый кластер WSFC находится в хорошем состоянии кворума. (Большинство узлов WSFC кворума доступны в качестве целей для автоматического отработки отказа.) Когда кластер WSFC теряет свой кворум, будь то из-за сбоя аппаратного обеспечения, программного обеспечения, сети или неправильной конфигурации кворума, весь кластер WSFC вместе с FCI отключается. Для этого незапланированного сценария отработки отказа требуется вмешательство пользователя, который должен переустановить кворум для оставшихся доступных узлов, чтобы вернуть кластер WSFC и FCI обратно в сеть. Дополнительные сведения см. в режимах кворума WSFC и конфигурации голосования (SQL Server).

Прогнозируемая отработка отказа

В зависимости от того, когда экземпляр SQL Server последний раз выполнил операцию контрольной точки, в буферном кэше может быть значительное количество грязных страниц. Последующая отработка отказа длится столько, сколько потребуется времени для записи оставшихся «грязных» страниц на диск, что может увеличить время отработки отказа непредсказуемым образом. Начиная с SQL Server 2012 (11.x), FCI может использовать косвенные контрольные точки для регулирования количества грязных страниц, хранящихся в кэше буфера. Хотя это потребляет больше ресурсов в обычных рабочих нагрузках, это делает время переключения на отказоустойчивую систему более предсказуемым и более настраиваемым. Это полезно, если соглашение уровня обслуживания в организации указывает целевое время восстановления (RTO) для решения с высоким уровнем доступности. Дополнительные сведения см. в разделе "Косвенные контрольные точки".

Надежная политика мониторинга работоспособности и гибкой политики отработки отказа

После успешного запуска FCI служба WSFC отслеживает работоспособность базового кластера WSFC и работоспособность экземпляра SQL Server. Начиная с SQL Server 2012 (11.x), служба WSFC использует выделенное подключение для опроса активного экземпляра SQL Server для подробной диагностики компонентов с помощью системной хранимой процедуры. Существует три результирующего последствия:

  • Выделенное подключение к экземпляру SQL Server позволяет надежно опрашивать компонент диагностика все время, даже если FCI находится под тяжелой нагрузкой. Эта возможность позволяет отличать систему под тяжелой нагрузкой от системы, имеющей условия сбоя, таким образом предотвращая проблемы, такие как ложные переключения.

  • Подробная диагностика компонентов позволяет настроить более гибкую политику отказоустойчивости, при которой можно выбрать условия, при которых происходят переключения при отказах.

  • Подробная диагностика компонентов также позволяет лучше устранять ошибки автоматической отработки отказа. Диагностические сведения хранятся в файлах журналов, которые сопоставляются с журналами ошибок SQL Server. Их можно загрузить в средство просмотра файлов журнала, чтобы проверить состояния компонентов, приведшие к вхождению отказа, и определить причину переключения на резерв.

Для получения дополнительной информации см. политику отказоустойчивости для экземпляров отказоустойчивого кластера.

Настройка шифрования TLS 1.3

Предварительная версия SQL Server 2025 (17.x) предоставляет поддержку TDS 8.0, которая позволяет применять шифрование TLS 1.3 для обмена данными между отказоустойчивым кластером Windows Server и вашими экземплярами отказоустойчивого кластера.

Чтобы приступить к работе, ознакомьтесь с функцией Подключение с строгим шифрованием.

Примечание.

Установка экземпляра отказоустойчивого кластера SQL Server 2025 (17.x) завершается ошибкой, если на компьютере отключен протокол TLS 1.2.

Элементы экземпляра отказоустойчивого кластера

FCI состоит из набора физических серверов (узлов), содержащих аналогичную конфигурацию оборудования, а также идентичную конфигурацию программного обеспечения, которая включает версию операционной системы и уровень исправлений, а также версию SQL Server, уровень исправлений, компоненты и имя экземпляра. Идентичная конфигурация программного обеспечения необходима для обеспечения полностью функциональной работы FCI при переключении между узлами.

Группа ресурсов WSFC

FCI SQL Server выполняется в группе ресурсов WSFC. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и контрольных точек реестра, чтобы обеспечить полную функциональность FCI после переключения в случае отказа. Только один из узлов в кластере владеет группой ресурсов одновременно (активным узлом). Служба WSFC управляет кластером серверов, конфигурацией кворума, политикой отработки отказа и операциями отработки отказа в дополнение к имени виртуальной сети и виртуальным IP-адресам для FCI. Если возникает сбой (аппаратные сбои, сбои операционной системы или сбои приложений и служб) или плановое обновление, владение группой ресурсов перемещается на другой узел в FCI. Количество узлов, поддерживаемых в группе ресурсов WSFC, зависит от выпуска SQL Server. Также один кластер WSFC может запускать несколько FCI (множественные группы ресурсов), в зависимости от возможностей оборудования, например ЦП, памяти и числа дисков.

Двоичные файлы SQL Server

Исполняемые файлы продукта устанавливаются локально на каждом узле FCI в процессе, аналогичном независимым установкам SQL Server. Однако во время запуска службы не запускаются автоматически, и вместо этого управляются WSFC.

Хранилище

В отличие от группы доступности, FCI должен использовать общее хранилище между всеми узлами FCI для базы данных и хранилища журналов. Общее хранилище может быть в форме дисков кластера WSFC, дисков в сети SAN, технологии Storage Spaces Direct или общих файловых ресурсов на SMB. Таким образом, все узлы в кластере отказоустойчивости (FCI) имеют одинаковое представление данных экземпляра, когда происходит отказ. Однако это означает, что общее хранилище может быть единственной точкой сбоя, и что FCI зависит от базового решения хранилища для обеспечения защиты данных.

Имя сети

Имя виртуальной сети для FCI предоставляет единую точку подключения для FCI. Эта единая точка подключения позволяет приложениям подключаться к имени виртуальной сети без необходимости знать активный узел. При отработке отказа имя виртуальной сети регистрируется на новом активном узле после его запуска. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server, и позволяет свести к минимуму время простоя приложения или клиентов во время сбоя.

На следующем снимке экрана показано сетевое имя экземпляра отказоустойчивого кластера в диспетчере отказоустойчивости кластеров:

Снимок экрана: имя сети FCI в диспетчере отказоустойчивых кластеров.

Виртуальные IP-адреса

В случае многоподсетевого кластера FCI виртуальный IP-адрес присваивается каждой подсети FCI. Во время переключения на отказоустойчивый узел имя виртуальной сети на DNS-сервере обновляется, чтобы указать виртуальный IP-адрес для соответствующей подсети. Затем приложения и клиенты смогут подключиться к кластеру отказоустойчивости (FCI) с помощью того же имени виртуальной сети после отказоустойчивого переключения между несколькими подсетями.

Основные понятия и задачи отработки отказа SQL Server

Основные понятия и задачи Статья
Описывает механизм обнаружения сбоя и гибкую политику отработки отказа. Политика отработки отказа для экземпляров отказоустойчивого кластера
Описание основных понятий в управлении и обслуживании экземпляров отказоустойчивых кластеров. Администрирование и обслуживание экземпляра отказоустойчивого кластера
Описание конфигурации и концепций с несколькими подсетями. Кластеризация нескольких подсетей SQL Server

Поддерживаемая конфигурация SQL Server FCI в WSFC

Sql Server FCIs на основе WSFC поддерживается в следующих продуктах:

  • Windows Server 2012
  • Windows Server 2012 R2
  • Выпуски Windows Server 2016 Standard и Datacenter
  • Выпуски Windows Server 2019 Standard и Datacenter
  • Выпуски Windows Server 2022 Standard и Datacenter

Windows Server предоставляет два типа служб кластеризации:

Только решения кластера серверов можно использовать вместе с SQL Server для обеспечения высокой доступности, если узел потерян или возникла проблема с экземпляром SQL Server. Балансировка нагрузки сети может использоваться в некоторых случаях вместе с автономными установками SQL Server только для чтения.

Для каждого FCI SQL Server требуется:

  • Выделенная группа кластеров с буквами дискового диска, назначаемая уникальным образом.
  • По крайней мере один уникальный IP-адрес.
  • Уникальные имена виртуальных серверов и инстансов в рамках домена.

Поддержка решения кластеров от производителей, отличных от Майкрософт

SQL Server разрабатывается и тестируется с помощью кластеризации серверов Майкрософт. Если вы используете продукт кластеризации, отличный от Майкрософт, основной контакт поддержки по установке, производительности или поведению кластера должен быть поставщиком решений. Корпорация Майкрософт предоставляет коммерчески обоснованную поддержку для установки кластеров, не относящихся к продуктам Майкрософт, аналогичную поддержке автономных развертываний SQL Server.

Количество поддерживаемых узлов

Дополнительные сведения о максимальном количестве поддерживаемых узлов для экземпляров отказоустойчивого кластера Always On см. в следующей статье:

Поддерживаемая операционная система

Сведения о поддерживаемых операционных системах для отказоустойчивой кластеризации SQL Server см. в статье "Проверка операционной системы перед установкой отказоустойчивой кластеризации".

Подключенные диски

Использование подключенных дисков не поддерживается в кластерах, включающих установку SQL Server. Дополнительные сведения см. в статье о поддержке SQL Server для подключенных томов.

Общие тома кластера (CSV)

SQL Server 2012 (11.x) и более ранние версии не поддерживают использование CSV для SQL Server в отказоустойчивом кластере.

Сведения об использовании CSV с SQL Server 2014 (12.x) или более поздних версий см. в следующих ресурсах:

Ограничения контроллера домена

Экземпляры отказоустойчивого кластера SQL Server не поддерживаются на узлах экземпляров отказоустойчивого кластера, настроенных как контроллеры домена.

Рекомендации по миграции домена

SQL Server 2005 (9.x) и более поздних версий нельзя перенести в новый домен. Необходимо удалить и повторно установить компоненты отказоустойчивого кластера. Дополнительные сведения см. в разделе "Перемещение кластера Windows Server из одного домена в другой".

Перед удалением SQL Server необходимо выполнить следующие действия.

  • Задайте SQL Server для использования безопасности в смешанном режиме или добавьте новые учетные записи домена в имена входа SQL Server.

  • Переименуйте папку DATA , содержащую системные базы данных, чтобы ее можно было переключить обратно после повторной установки, чтобы сократить время простоя.

  • Не удаляйте файлы поддержки SQL Server, собственный клиент SQL Server, службы Integration Services или компоненты рабочей станции, если вы не перестроите весь узел.

Предупреждение

Если во время процесса удаления возникают ошибки, может потребоваться перестроить узел, чтобы успешно установить SQL Server еще раз.