Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Область применения: SQL Server 2019 (15.x)
Important
Кластеры больших данных Microsoft SQL Server 2019 прекращены. Поддержка кластеров больших данных SQL Server 2019 закончилась с 28 февраля 2025 г. Дополнительные сведения см. в записи блога объявлений и параметрах больших данных на платформе Microsoft SQL Server.
Скрипты Python и R можно запускать на главном экземпляре кластеров больших данных SQL Server с помощью служб машинного обучения.
Note
Вы также можете запустить код Java на главном экземпляре кластеров больших данных SQL Server с расширением языка Java. Ниже приведены инструкции по включению расширений языка SQL Server.
Включение служб машинного обучения
Службы машинного обучения устанавливаются по умолчанию в кластерах больших данных SQL Server 2019 и не требуют отдельной установки.
Чтобы включить службы машинного обучения, выполните следующую команду на главном экземпляре:
EXEC sp_configure 'external scripts enabled', 1
RECONFIGURE WITH OVERRIDE
GO
Теперь вы готовы запускать скрипты Python и R в главном экземпляре кластеров больших данных. Ознакомьтесь с краткими руководствами, описанными в разделе "Дальнейшие действия " для запуска первого сценария.
Note
Параметр конфигурации не может быть задан в подключении прослушивателя группы доступности. Если кластеры больших данных развертываются с высоким уровнем доступности, установите external scripts enabled
для каждой реплики. См. Включить в кластере с высокой доступностью.
Включить на кластере с высокой доступностью
При развертывании кластера больших данных SQL Server с высокой доступностью развертывание создает группу доступности для главного экземпляра. Чтобы включить службы машинного обучения, задайте external scripts enabled
для каждого экземпляра группы доступности. Для кластера больших данных необходимо выполнить sp_configure
на каждой реплике главного экземпляра SQL Server.
В следующем разделе описывается, как включить внешние скрипты для каждого экземпляра.
Создайте внешний балансировщик нагрузки для каждого экземпляра.
Для каждой реплики в группе доступности создайте балансировщик нагрузки, чтобы обеспечить возможность подключения к экземпляру.
kubectl expose pod <pod-name> --port=<connection port number> --name=<load-balancer-name> --type=LoadBalancer -n <kubernetes namespace>
В примерах в этой статье используются следующие значения:
-
<pod-name>
:master-#
-
<connection port number>
:1533
-
<load-balancer-name>
:mymaster-#
-
<kubernetes namespace>
:mssql-cluster
Обновите следующий скрипт для вашей среды и выполните команды:
kubectl expose pod master-0 --port=1533 --name=mymaster-0 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-1 --port=1533 --name=mymaster-1 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-2 --port=1533 --name=mymaster-2 --type=LoadBalancer -n mssql-cluster
kubectl
возвращает следующие выходные данные.
service/mymaster-0 exposed
service/mymaster-1 exposed
service/mymaster-2 exposed
Каждый балансировщик нагрузки представляет собой конечную точку главной реплики.
Включение выполнения скрипта для каждой реплики
Получите IP-адрес для конечной точки главной реплики.
Следующая команда возвращает внешний IP-адрес конечной точки реплики.
kubectl get services <load-balancer-name> -n <kubernetes namespace>
Чтобы получить внешний IP-адрес для каждой реплики в этом сценарии, выполните следующие команды:
kubectl get services mymaster-0 -n mssql-cluster kubectl get services mymaster-1 -n mssql-cluster kubectl get services mymaster-2 -n mssql-cluster
Note
До того, как внешний IP-адрес будет доступен, может потребоваться немного времени. Периодически запустите предыдущий скрипт, пока каждая конечная точка не возвращает внешний IP-адрес.
Подключитесь к конечной точке главной реплики и включите выполнение скрипта.
Выполните следующую инструкцию:
EXEC sp_configure 'external scripts enabled', 1 RECONFIGURE WITH OVERRIDE GO
Например, можно выполнить предыдущую команду с
sqlcmd
. В следующем примере выполняется подключение к конечной точке главной реплики и выполнение скрипта. Обновите значения в скрипте для вашей среды.sqlcmd -S <IP address>,1533 -U <user name> -P <password> -Q "EXEC sp_configure 'external scripts enabled', 1; RECONFIGURE WITH OVERRIDE;"
Повторите шаг для каждой реплики.
Demonstration
На следующем рисунке показан этот процесс.
Теперь вы готовы запускать скрипты Python и R в главном экземпляре кластеров больших данных. Ознакомьтесь с краткими руководствами, описанными в разделе "Дальнейшие действия " для запуска первого сценария.
Удалите конечные точки основной реплики
В кластере Kubernetes удалите конечную точку для каждой реплики. Конечная точка предоставляется в Kubernetes в качестве службы балансировки нагрузки.
Следующая команда удаляет службу балансировки нагрузки.
kubectl delete svc <load-balancer-name> -n mssql-cluster
В примерах этой статьи выполните следующие команды.
kubectl delete svc mymaster-0 -n mssql-cluster
kubectl delete svc mymaster-1 -n mssql-cluster
kubectl delete svc mymaster-2 -n mssql-cluster
Краткие руководства по применению машинного обучения в кластерах больших данных SQL Server.
Python quickstarts
R quickstarts
Учебники по машинному обучению кластеров больших данных SQL Server
Python tutorial
Прокат лыж (линейная регрессия)
Категоризация клиентов (кластеризация методом k-средних)
Чаевые за поездку в такси в Нью-Йорке (классификация)
- 1. Введение
- 2. Исследование данных
- 3. Проектирование компонентов
- 4. Обучение и развертывание
- 5 . Прогнозы
R tutorials
Прокат лыж (дерево принятия решений)
Категоризация клиентов (кластеризация методом k-средних)
Чаевые за поездку в такси в Нью-Йорке (классификация)
- 1. Введение
- 2. Исследование данных
- 3. Проектирование компонентов
- 4. Обучение и развертывание
- 5 . Прогнозы
Руководство по машинному обучению кластеров больших данных SQL Server
Исследование и моделирование данных
Преобразования типов данных
Deploy
Predictions
Package management
Установка новых пакетов Python
Установка новых пакетов R
- получение сведений о пакете R
- Установка с помощью sqlmlutils
- Создание репозитория miniCRAN
- Советы по использованию пакетов R
Monitor
Security
Машинное обучение Spark
- Использование машинного обучения Spark
- Обработка данных с помощью акселератора кода PROSE
- Модели машинного обучения Spark с MLeap