Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo articolo spiega come configurare il numero di dischi gestiti usati da Apache Kafka in HDInsight.
Kafka in HDInsight usa il disco locale delle macchine virtuali nel cluster HDInsight. Dal momento che in Kafka i processi I/O sono intensivi, viene usata la funzionalità Azure Managed Disks per assicurare una velocità effettiva elevata e fornire maggiore spazio di archiviazione per ogni nodo. Se si usano le tradizionali unità disco rigido virtuali (VHD) per Kafka, ogni nodo è limitato a 1 TB. Con i dischi gestiti, è possibile usare più dischi per ottenere 16 TB per ogni nodo del cluster.
Il diagramma seguente offre un confronto tra Kafka in HDInsight prima dei dischi gestiti e Kafka in HDInsight con i dischi gestiti:
Configurare i dischi gestiti: portale di Azure
Seguire i passaggi riportati in Creare un cluster HDInsight per comprendere le operazioni principali per creare un cluster tramite il portale. Non completare il processo di creazione del portale.
Nella sezione Configurazione e prezzi usare il campo Numero di nodi per configurare il numero di dischi.
Nota
Il tipo di disco gestito può essere Standard (HDD) o Premium (SSD). I dischi Premium sono usati con le macchine virtuali serie DS e GS. Tutti gli altri tipi di macchine virtuali usano standard.
Configurare i dischi gestiti: modello di Resource Manager
Per controllare il numero di dischi usati dai nodi di lavoro in un cluster Kafka, utilizzare la seguente sezione del modello.
"dataDisksGroups": [
{
"disksPerNode": "[variables('disksPerWorkerNode')]"
}
],
Passaggi successivi
Per ulteriori informazioni su come lavorare con Apache Kafka su HDInsight, consultare i documenti seguenti.