Поделиться через


Знакомство с пулами вычислений в кластерах больших данных SQL Server

Область применения: SQL Server 2019 (15.x)

Это важно

Надстройка "Кластеры больших данных Microsoft SQL Server 2019" будет прекращена. Поддержка кластеров больших данных SQL Server 2019 завершится 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на этой платформе, а программное обеспечение будет продолжать поддерживаться с помощью накопительных обновлений для SQL Server до этого времени. Для получения дополнительной информации см. запись блога об объявлении и параметры работы с большими данными на платформе Microsoft SQL Server.

В этой статье описывается роль пулов вычислений SQL Server в кластере больших данных SQL Server. Пулы вычислений предоставляют вычислительные ресурсы горизонтального масштабирования для кластера больших данных SQL Server. Они используются для разгрузки вычислительных работ или промежуточных результирующих наборов из главного экземпляра SQL Server. В следующих разделах описываются архитектуры, функциональные возможности и сценарии использования пула вычислений.

Вы также можете просмотреть это 5-минутное видео для внедрения в пулы вычислений:

Архитектура пула вычислений

Пул вычислений состоит из одного или нескольких подов вычислений, работающих в Kubernetes. Автоматическое создание и управление этими модулями pod координируется главным экземпляром SQL Server. Каждый модуль pod содержит набор базовых служб и экземпляр ядра СУБД SQL Server.

Архитектура пула вычислений

Группы горизонтального масштабирования

Пул вычислений может выступать в качестве группы масштабирования PolyBase для распределенных запросов по разным внешним источникам данных, таким как SQL Server, Oracle, MongoDB, Teradata и HDFS. С помощью вычислительных модулей pod в Kubernetes кластер больших данных SQL Server может автоматизировать создание и настройку модулей pod вычислений для групп масштабирования PolyBase.

Сценарии пула вычислений

Сценарии, в которых используется пул вычислений, включают:

  • Когда запросы, отправленные в главный экземпляр, используют одну или несколько таблиц, расположенных в пуле носителей.

  • Когда запросы, отправленные в главный экземпляр, используют одну или несколько таблиц с распределением циклического перебора, расположенным в пуле данных.

  • При отправке запросов в главный экземпляр используют секционированные таблицы с внешними источниками данных SQL Server, Oracle, MongoDB и Teradata. Для этого сценария необходимо включить параметр указания запроса (FORCE SCALEOUTEXECUTION).

  • Если запросы, отправленные в главный экземпляр, используют одну или несколько таблиц, расположенных на уровне HDFS.

Сценарии, в которых пул вычислений не используется, включают:

  • Когда запросы, отправленные в главный экземпляр, используют одну или несколько таблиц в кластере Hadoop HDFS, находящемся вне системы.

  • Когда запросы, отправленные в главный экземпляр, используют одну или несколько таблиц в хранилище BLOB-объектов Azure.

  • Если запросы, отправленные в основной экземпляр, используют неразделенные таблицы с внешними источниками данных SQL Server, Oracle, MongoDB и Teradata.

  • Если параметр указания запроса (DISABLE SCALEOUTEXECUTION) включен.

  • Когда запросы, отправленные в главный экземпляр, применяются к базам данных, расположенным на главном экземпляре.

Дальнейшие шаги

Дополнительные сведения о кластерах больших данных SQL Server см. в следующих ресурсах: