Condividi tramite


Scegliere una tecnologia per l'analisi dei dati e la creazione di report in Azure

L'obiettivo della maggior parte delle soluzioni per Big Data è fornire informazioni dettagliate sui dati tramite strumenti di analisi e report. L'analisi e la creazione di report possono includere report e visualizzazioni preconfigurati o l'esplorazione interattiva dei dati.

Opzioni tecnologiche per l'analisi dei dati

Sono disponibili diverse opzioni per l'analisi e la creazione di visualizzazioni e report in Azure, in base alle esigenze specifiche:

Power BI

Power BI è una famiglia di strumenti di analisi business Può connettersi a centinaia di origini dati ed è possibile usarla per l'analisi non pianificata. Usare Power BI Embedded per integrare Power BI all'interno delle proprie applicazioni senza richiedere licenze aggiuntive.

Power BI può essere usato per generare report e pubblicarli all'interno di un'organizzazione. Qualsiasi utente può creare dashboard personalizzati, con governance e sicurezza integrata. Power BI usa Microsoft Entra ID per autenticare gli utenti che accedono al servizio Power BI. Usa le credenziali di Power BI quando un utente tenta di accedere alle risorse che richiedono l'autenticazione.

Notebook di Jupyter

I notebook di Jupyter offrono una shell basata su browser che consente ai data scientist di creare file di notebook contenenti codice Python, Scala o R e testo Markdown. Queste funzionalità rendono i notebook un modo efficace per collaborare condividendo e documentando il codice e comportando un singolo documento.

La maggior parte delle varietà di cluster HDInsight, ad esempio Spark o Hadoop, è preconfigurata con i notebook di Jupyter per interagire con i dati e inviare processi per l'elaborazione. A seconda del tipo di cluster HDInsight usato, vengono forniti uno o più kernel per interpretare ed eseguire il codice. Ad esempio, i cluster Spark in HDInsight forniscono kernel correlati a Spark che è possibile selezionare per eseguire codice Python o Scala usando il motore Spark.

I notebook di Jupyter offrono un ambiente efficace per l'analisi, la visualizzazione e l'elaborazione dei dati prima di creare visualizzazioni più avanzate usando uno strumento di creazione di report bi come Power BI.

Notebook di Zeppelin

I notebook Zeppelin forniscono anche una shell basata su browser con funzionalità simili ai notebook di Jupyter. Alcuni cluster di HDInsight sono preconfigurati con i notebook Zeppelin. Tuttavia, se si usa un cluster HDInsight Interactive Query (denominato anche Apache Hive LLAP), Zeppelin è l'unico notebook che è possibile usare per eseguire query Hive interattive. Inoltre, se si usa un cluster HDInsight unito a un dominio, i notebook Zeppelin sono l'unico tipo di notebook che consente di assegnare credenziali utente diverse per controllare l'accesso ai notebook e alle tabelle Hive sottostanti.

Notebook di Jupyter in VS Code

VS Code è un editor di codice gratuito e una piattaforma di sviluppo che è possibile usare in locale o connesso al calcolo remoto. Quando si usa VS Code con l'estensione Jupyter, offre un ambiente completamente integrato per lo sviluppo di Jupyter che può essere migliorato con più estensioni del linguaggio. Scegliere questa opzione se si vuole un'esperienza Jupyter ottimale e gratuita e poter usare il calcolo preferito.

Usando VS Code, è possibile sviluppare ed eseguire notebook su remoti e contenitori. Per semplificare la transizione dai notebook di Azure, l'immagine del contenitore è disponibile anche per l'uso con VS Code.

Jupyter (in precedenza IPython Notebook) è un progetto open source che consente di combinare facilmente il testo Markdown e il codice sorgente Python eseguibile in un'area di disegno denominata notebook. VS Code supporta l'uso di notebook jupyter in modo nativo e tramite file di codice Python.

Criteri di scelta principali

Iniziare a restringere le scelte rispondendo alle domande seguenti:

  • È necessario connettersi a numerose origini dati e fornire una posizione centralizzata per creare report per la distribuzione dei dati in tutto il dominio? In questo caso, scegliere un'opzione che consente di connettersi a centinaia di origini dati.

  • Si vogliono incorporare visualizzazioni dinamiche in un'applicazione o un sito Web esterno? In tal caso, scegliere un'opzione che fornisce funzionalità di incorporamento.

  • Si vogliono progettare visualizzazioni e report in modalità offline? In questo caso, scegliere un'opzione con funzionalità offline.

  • È necessaria una potenza di elaborazione elevata per eseguire il training di modelli di intelligenza artificiale di grandi dimensioni o complessi o lavorare con set di dati di grandi dimensioni? In questo caso, scegliere un'opzione in grado di connettersi a un cluster Big Data.

Matrice delle funzionalità

La tabella seguente riepiloga le principali differenze nelle funzionalità.

Funzionalità generali

Capacità Power BI Notebook di Jupyter Notebook di Zeppelin Notebook di Jupyter in VS Code
Connettersi ai cluster Big Data per l'elaborazione avanzata NO
Servizio gestito 1 1
Connettersi a centinaia di origini dati NO NO NO
Funzionalità offline 2 NO NO NO
Funzionalità di incorporamento NO NO NO
Aggiornamento automatico dei dati NO NO NO
Accesso a numerosi pacchetti open source NO 3 3 4
Opzioni di trasformazione o pulizia dei dati Power Query, R 40 linguaggi, inclusi Python, R, Julia e Scala Più di 20 interpreti, tra cui Python, JDBC e R Python, F#, R
Prezzi Gratuito per Power BI Desktop (creazione). Vedere Prezzi di Power BI per le opzioni di hosting. Gratuito Gratuito Gratuito
Collaborazione multiutente Sì (tramite condivisione o con un server multiutente come JupyterHub) Sì (tramite condivisione)

[1] Quando è usato come parte di un cluster HDInsight gestito.

[2] Con l'uso di Power BI Desktop.

[3] È possibile cercare i pacchetti forniti dalla community nel repository Maven .

[4] È possibile installare pacchetti Python usando pip o Conda. È possibile installare pacchetti R da CRAN o GitHub. È possibile installare pacchetti in F# tramite nuget.org utilizzando Gestione dipendenze di Packet.

Collaboratori

Microsoft gestisce questo articolo. I collaboratori seguenti hanno scritto questo articolo.

Autore principale:

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Passaggi successivi