Introduzione ai pool di calcolo nei cluster Big Data di SQL Server

Si applica a:SQL Server 2019 (15.x)

Important

I cluster Big Data di Microsoft SQL Server 2019 sono stati ritirati. Il supporto per i cluster Big Data di SQL Server 2019 è terminato a partire dal 28 febbraio 2025. Per altre informazioni, vedere il post di blog sull'annuncio e le opzioni per Big Data nella piattaforma Microsoft SQL Server.

Questo articolo descrive il ruolo dei pool di calcolo di SQL Server in un cluster Big Data di SQL Server. I pool di calcolo forniscono risorse di calcolo con scalabilità orizzontale per un cluster Big Data di SQL Server. Vengono usati per eseguire l'offload del lavoro di calcolo o dei set di risultati intermedi dall'istanza master di SQL Server. Le sezioni seguenti descrivono gli scenari di architettura, funzionalità e utilizzo di un pool di calcolo.

È anche possibile guardare questo video di 5 minuti per un'introduzione ai pool di calcolo:

Architettura del gruppo di calcolo

Un pool di calcolo è costituito da uno o più pod di calcolo in esecuzione in Kubernetes. La creazione e la gestione automatizzate di questi pod sono coordinate dall'istanza master di SQL Server. Ogni pod contiene un set di servizi di base e un'istanza del motore di database di SQL Server.

Architettura del pool di calcolo

Scale-out groups

Un pool di calcolo può fungere da gruppo con scalabilità orizzontale PolyBase per query distribuite su origini dati esterne diverse, ad esempio SQL Server, Oracle, MongoDB, Teradata e HDFS. Usando i pod di calcolo in Kubernetes, un cluster Big Data di SQL Server può automatizzare la creazione e la configurazione dei pod di calcolo per i gruppi con scalabilità orizzontale PolyBase.

Scenari di pool di calcolo

Gli scenari in cui viene usato il pool di calcolo includono:

Quando le query inviate all'istanza master usano una o più tabelle che si trovano nel pool di archiviazione.
Quando le query inviate all'istanza principale usano una o più tabelle con distribuzione round robin che si trovano nel pool di dati.
Quando le query inviate all'istanza master usano tabelle partizionate con origini dati esterne di SQL Server, Oracle, MongoDB e Teradata. Per questo scenario, è necessario abilitare l'hint di query OPTION (FORCE SCALEOUTEXECUTION).
Quando le query inviate all'istanza master utilizzano una o più tabelle situate nel tier HDFS.

Gli scenari in cui il pool di calcolo non viene usato includono:

Quando le query inviate all'istanza master utilizzano una o più tabelle nel cluster HDFS Hadoop esterno.
Quando le query inviate all'istanza master usano una o più tabelle in Azure Blob Storage.
Quando le query inviate all'istanza master usano tabelle non partizionate con origini dati esterne di SQL Server, Oracle, MongoDB e Teradata.
Quando l'hint per la query OPTION (DISABLE SCALEOUTEXECUTION) è abilitato.
Quando le query inviate all'istanza master si applicano ai database che si trovano nell'istanza master.

Next steps

Per altre informazioni sui cluster Big Data di SQL Server, vedere le risorse seguenti:

Last updated on 2020-10-15

Condividi tramite

Introduzione ai pool di calcolo nei cluster Big Data di SQL Server

Architettura del gruppo di calcolo

Scale-out groups

Scenari di pool di calcolo

Next steps

Risorse aggiuntive