Condividi tramite


Introduzione al pool master nei cluster Big Data di SQL Server

Si applica a:SQL Server 2019 (15.x)

Important

I cluster Big Data di Microsoft SQL Server 2019 sono stati ritirati. Il supporto per i cluster Big Data di SQL Server 2019 è terminato a partire dal 28 febbraio 2025. Per altre informazioni, vedere il post di blog sull'annuncio e le opzioni per Big Data nella piattaforma Microsoft SQL Server.

Questo articolo descrive il ruolo dell'istanza master di SQL Server in un cluster Big Data di SQL Server. Il pool master contiene l'istanza master di SQL Server. L'istanza master è un'istanza di SQL Server in esecuzione in un cluster Big Data di SQL Server. L'istanza master gestisce la connettività, le query con scalabilità orizzontale, i metadati e i database utente e i servizi di Machine Learning.

L'istanza master di SQL Server offre le funzionalità seguenti:

Connectivity

L'istanza master di SQL Server fornisce un endpoint TDS accessibile esternamente per il cluster. È possibile connettere applicazioni o strumenti di SQL Server come Azure Data Studio o SQL Server Management Studio a questo endpoint esattamente come qualsiasi altra istanza di SQL Server.

Gestione delle query con scalabilità orizzontale

L'istanza master di SQL Server contiene il motore di query con scalabilità orizzontale usato per distribuire query tra istanze di SQL Server nei nodi del pool di calcolo. Il motore di query con scalabilità orizzontale fornisce anche l'accesso tramite Transact-SQL a tutte le tabelle Hive nel cluster senza altre configurazioni.

Metadati e database degli utenti

Oltre ai database di sistema di SQL Server standard, l'istanza master SQL contiene anche:

  • Database di metadati che contiene i metadati della tabella HDFS.
  • Mappa dei frammenti del piano dati.
  • Dettagli delle tabelle esterne che forniscono l'accesso al piano dati del cluster.
  • Origini di dati esterni PolyBase e tabelle esterne definite nei database degli utenti.

È anche possibile scegliere di aggiungere database utente personalizzati all'istanza master di SQL Server.

Servizi di Apprendimento Automatico

La funzionalità Machine Learning Services di SQL Server è una funzionalità aggiuntiva per il motore di database. Funzionalità di Machine Learning Services usata per l'esecuzione di codice Java, R e Python in SQL Server. Questa funzionalità si basa sul framework di estendibilità di SQL Server, che isola i processi esterni dai processi del motore di base, ma si integra completamente con i dati relazionali come stored procedure, come script T-SQL contenente istruzioni R o Python o come codice Java, R o Python contenente T-SQL.

Come parte di un cluster Big Data di SQL Server, i servizi di Machine Learning saranno disponibili nell'istanza master di SQL Server per impostazione predefinita. Quando l'esecuzione di script esterni è abilitata nell'istanza master di SQL Server, è possibile eseguire script Java, R e Python usando sp_execute_external_script.

Vantaggi dei servizi di Machine Learning in un cluster Big Data

I cluster Big Data di SQL Server semplificano l'aggiunta di Big Data ai dati dimensionali in genere archiviati nel database aziendale. Il valore dei Big Data aumenta notevolmente quando non è solo nelle mani di parti di un'organizzazione, ma è incluso anche in report, dashboard e applicazioni. Allo stesso tempo, i data scientist possono continuare a usare gli strumenti dell'ecosistema Spark/HDFS e avere accesso semplice e in tempo reale ai dati nell'istanza master di SQL Server e in origini dati esterne accessibili tramite l'istanza master di SQL Server.

Con i cluster Big Data di SQL Server è possibile eseguire altre operazioni con i data lake aziendali. Gli sviluppatori e gli analisti di SQL Server possono:

  • Creare applicazioni che usano dati provenienti da data lake aziendali.
  • Ragiona su tutti i dati con query Transact-SQL.
  • Usare l'ecosistema esistente di strumenti e applicazioni di SQL Server per accedere e analizzare i dati aziendali.
  • Ridurre la necessità di spostamento dei dati tramite la virtualizzazione dei dati e i data mart.
  • Continuare a usare Spark per scenari di Big Data.
  • Creare applicazioni aziendali intelligenti usando Spark o SQL Server per eseguire il training di modelli su data lake.
  • Rendere operativi i modelli nei database di produzione per ottenere prestazioni ottimali.
  • Trasmettere i dati direttamente ai data mart aziendali per l'analisi in tempo reale.
  • Esplorare visivamente i dati usando strumenti interattivi di analisi e business intelligence.

Next steps

Per altre informazioni sui cluster Big Data di SQL Server, vedere le risorse seguenti: