Поделиться через


Разница между рабочими областями Azure Synapse (ранее — хранилище данных SQL) и Azure Synapse Analytics

Первоначально опубликовано как блог на платформе TechCommunity по адресу: https://techcommunity.microsoft.com/t5/azure-synapse-analytics-blog/what-s-the-difference-between-azure-synapse-formerly-sql-dw-and/ba-p/3597772

Уже некоторое время существует путаница, когда дело касается документации Microsoft и двух отдельных наборов документации для выделенных SQL пулов. Когда вы выполняете поиск в Интернете документа, связанного с Azure Synapse, и попадаете на сайт Microsoft Learn Docs, таблица содержания имеет переключатель между двумя наборами документации.

В этой статье объясняется, какая документация применяется к среде Synapse Analytics.

Azure Synapse Analytics Выделенные пулы SQL (ранее — Хранилища данных SQL)
Снимок экрана с сайта Microsoft Learn Docs, показывающий оглавление Azure Synapse Analytics. Снимок экрана с сайта документации Microsoft Learn, показывающий оглавление старого выделенного пула SQL (прежнее название — хранилище данных SQL).

Вы также увидите заметки во многих документах, которые пытаются выделить, к какой реализации выделенных пулов SQL в Synapse ссылается документ.

Выделенные пулы SQL существуют в двух разных модалах

Автономные или существующие хранилища данных SQL были переименованы в "выделенные пулы SQL (прежнее название — хранилище данных SQL)" в ноябре 2020 года. С тех пор выделенные пулы SQL, созданные в Synapse Analytics, являются "выделенными пулами SQL в рабочих областях Synapse".

В 2016 году корпорация Майкрософт адаптировала свое устройство для массово-параллельной обработки (MPP) под облако, известное как "Azure SQL Data Warehouse" или, сокращенно, "SQL DW".

Историки помнят, что устройство было названо параллельным хранилищем данных (PDW), а затем системой платформ аналитики (APS), которая по-прежнему обеспечивает множество локальных решений для хранения данных.

Хранилище данных SQL Azure приняло конструкции базы данных SQL Azure, например логический сервер, где управляются администрирование и сеть. Хранилище данных SQL DW может существовать на том же сервере, что и другие базы данных SQL. Эта реализация облегчает текущим администраторам и специалистам по SQL Azure применение тех же самых концепций к работе с хранилищем данных.

Однако с 2016 года аналитика и пространство аналитики прошли через огромные изменения. Мы сделали смену парадигмы в том, как будут доставляться хранилища данных. Так как хранилище данных SQL обрабатывало хранение, рабочая область Synapse расширялась и округляла портфель аналитики. Новый интерфейс Рабочей области Synapse стал общедоступным в 2020 году.

Схема рабочей области Azure Synapse Analytics, интерфейса и платформы.

Исходный компонент хранилища данных SQL является лишь одной частью этого компонента. Это стало известно как выделенный пул SQL.

Схема различий для выделенного пула SQL из рабочей области Synapse.

Это было большое изменение и с большими возможностями. Вся платформа получила подходящее новое имя: Synapse Analytics.

Но как насчет всех существующих SQL-хранилищ данных? Будут ли они автоматически становиться рабочими пространствами Synapse?

Ребрендинг и миграция

Экземпляры хранилища данных SQL Azure не были автоматически обновлены до рабочих областей Synapse Analytics.

Многие факторы играют в крупные обновления платформы, и лучше всего позволить клиентам принять участие в этом. Хранилище данных SQL в Azure было переименовано в "выделенный пул SQL (прежнее хранилище данных SQL)" с целью создать четкое указание на то, что прежнее хранилище данных SQL фактически является тем же объектом, который находится в рамках Synapse Analytics.

Схема различий между выделенным пулом SQL (ранее — хранилищем данных SQL) и Azure Synapse Analytics.

В документации вы также увидите "Выделенный пул SQL (ранее — хранилище данных SQL)", который называется автономным выделенным пулом SQL.

Миграция выделенного пула SQL (прежнее название — хранилище данных SQL) относительно проста и упрощается всего несколькими шагами из портала Azure. Однако это не совсем полная миграция. Есть тонкое различие, заметное во всплывающем сообщении на портале Azure.

Скриншот из портала Azure, на котором вы видите пурпурную ленту, уведомляющую о том, что теперь к выделенному пулу SQL (прежнее название — хранилище данных SQL) можно получить доступ из рабочей области Synapse.

При миграции выделенный пул SQL (ранее — хранилище данных SQL) никогда не переносится. Он остается на логическом сервере, на который он был изначально включен. DNS-сервер server-123.database.windows.net никогда не становится server-123.sql.azuresynapse.net. Клиенты, которые "обновили" или "перенесли" хранилище данных SQL в Synapse Analytics, по-прежнему имеют полный логический сервер, который может использоваться в логическом сервере базы данных Azure SQL.

Рабочая область перенесённого хранилища данных SQL и Synapse

Путь обновления или миграции, описанный в предыдущем разделе, подключен к рабочей области Synapse. Для перенесенных сред используйте документацию в выделенном пуле SQL (ранее — хранилище данных SQL) для сценариев выделенного пула SQL. Все остальные компоненты Synapse Analytics будут доступны из документации Synapse Analytics.

Быстрый способ визуализировать это как "смесь" всех дополнительных возможностей рабочей области Synapse Analytics и исходного хранилища данных SQL следует.

Схема различий функций между перенесенным выделенным пулом SQL (ранее — хранилищем данных SQL) и Azure Synapse Analytics.

Если вы никогда не переносили хранилище данных SQL, и вы начали свое путешествие с созданием рабочей области Synapse Analytics, то вы просто используете документацию Synapse Analytics.

Различия в PowerShell

Одна из самых больших областей путаницы в документации между выделенным пулом SQL (прежнее название — хранилище данных SQL) и выделенными пулами SQL Synapse Analytics является PowerShell.

Исходная реализация SQL DW использует логический сервер, который совпадает с Базой данных SQL Azure. Существует общий модуль PowerShell с именем Az.Sql. В этом модуле, чтобы создать новый выделенный пул SQL (ранее SQL DW), командлет New-AzSqlDatabase имеет параметр Edition, который используется для указания создания именно такого пула DataWarehouse.

Когда Synapse Analytics был выпущен, он включал в себя другую версию модуля PowerShell Az.Synapse. Чтобы создать выделенный пул SQL в рабочей области Synapse Analytics, используйте New-AzSynapseSqlPool. В этом модуле PowerShell нет необходимости включать параметр "Edition", так как он используется исключительно для Synapse.

Эти два модуля НЕ равны во всех случаях. Некоторые действия можно выполнять в Az.Sql, но их нельзя выполнить в Az.Synapse. Например, для восстановления выделенного пула SQL (прежнее название — хранилище данных SQL) используется командлет Restore-AzSqlDatabase, и в Synapse Analytics используется Restore-AzSynapseSqlPool. Однако действие восстановления подписки через границу доступно только в модуле Az.Sql с Restore-AzSqlDatabase.