Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
OneLake è un singolo data Lake logico e unificato per l'intera organizzazione. Come OneDrive, OneLake viene fornito automaticamente con ogni tenant di Microsoft Fabric ed è progettato per essere l'unica posizione per tutti i dati di analisi.
OneLake offre alla società:
- Un data lake per l'intera organizzazione
- Una copia dei dati da usare con più motori analitici
Un data Lake per l'intera organizzazione
Prima di OneLake, molte organizzazioni hanno creato più laghi per diversi gruppi aziendali, con un sovraccarico aggiuntivo per la gestione di più risorse. OneLake elimina queste sfide migliorando la collaborazione:
- Ogni tenant di Fabric ottiene automaticamente un oneLake
- Non è possibile creare più OneLake o eliminare OneLake
- Nessuna risorsa aggiuntiva per il provisioning o la gestione
Questa semplicità consente all'organizzazione di collaborare su un singolo data lake unificato.
Regolamentato per impostazione predefinita con la titolarità distribuita per la collaborazione
Il livello principale di organizzazione e governance per i dati di Fabric è il tenant. Tutti i dati inseriti in OneLake vengono protetti automaticamente dai criteri a livello di tenant per la sicurezza, la conformità e la gestione dei dati.
All'interno di un tenant, la collaborazione avviene all'interno delle aree di lavoro. È possibile creare un numero qualsiasi di aree di lavoro per organizzare i dati. Le aree di lavoro consentono a diverse parti dell'organizzazione di distribuire i criteri di titolarità e di accesso. Ogni area di lavoro fa parte di una capacità associata a un'area specifica e fatturata separatamente.
All'interno di un'area di lavoro, è possibile creare e accedere a tutti i dati tramite elementi di dati. Analogamente a come Office archivia i file di Word, Excel e PowerPoint in OneDrive, Fabric archivia lakehouse, warehouse e altri elementi in OneLake. Ogni tipo di elemento offre esperienze personalizzate per utenti diversi, ad esempio l'esperienza di sviluppo di Apache Spark in una lakehouse.
Basato su standard e formati aperti
OneLake è basato su Azure Data Lake Storage (ADLS) Gen2 e può supportare qualsiasi tipo di file, strutturato o non strutturato. Tutti gli elementi di dati di Fabric, come i data warehouse e lakehouse, archiviano automaticamente i dati in OneLake in formato Delta Parquet. Se un ingegnere dei dati carica i dati in un lakehouse usando Apache Spark e uno sviluppatore SQL usa T-SQL per caricare i dati in un data warehouse completamente transazionale, entrambi contribuiscono allo stesso data Lake. OneLake archivia tutti i dati tabulari in formato Delta Parquet.
OneLake supporta le stesse API e GLI SDK di ADLS Gen2 per essere compatibili con le applicazioni ADLS Gen2 esistenti, tra cui Azure Databricks. È possibile gestire i dati in OneLake come se fosse un account di archiviazione ADLS di grandi dimensioni per l'intera organizzazione. Ogni area di lavoro viene visualizzata come contenitore all'interno di tale account di archiviazione e gli elementi di dati diversi vengono visualizzati come cartelle all'interno di tali contenitori.
Per altre informazioni sulle API e gli endpoint, vedere Accesso e API di OneLake. Per esempi di integrazioni di OneLake con Azure, vedere gli articoli Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks e Azure HDInsight .
Esplora file di OneLake per Windows
È possibile esplorare i dati di OneLake da Windows usando OneLake File Explorer per Windows. È possibile esplorare tutte le aree di lavoro e gli elementi di dati, caricare, scaricare o modificare file in modo semplice come in Office. Esplora file di OneLake semplifica l'uso dei data Lake, consentendo anche agli utenti aziendali non tecnici di usarli.
Per altre informazioni, vedere OneLake File Explorer.
Una copia dei dati
OneLake mira a offrire il massimo valore possibile da una singola copia di dati senza spostamento o duplicazione dei dati. Non è necessario copiare i dati solo per usarli con un altro motore o per analizzare i dati da più origini.
I collegamenti connettono i dati tra domini senza spostamento dati
Un collegamento è un riferimento ai dati archiviati in altre posizioni di file. Questi percorsi di file possono trovarsi all'interno della stessa area di lavoro o in aree di lavoro diverse, all'interno di OneLake o esterni a OneLake come ADLS, S3 o Dataverse. Indipendentemente dalla posizione, i collegamenti fanno sembrare che i file e le cartelle siano stati archiviati in locale.
I collegamenti consentono all'organizzazione di condividere dati tra utenti e applicazioni senza dover spostare e duplicare le informazioni inutilmente. Quando i team lavorano in modo indipendente in aree di lavoro separate, i collegamenti consentono di combinare i dati in diversi gruppi e domini aziendali in un prodotto dati virtuale che soddisfi le esigenze specifiche di un utente.
Per ulteriori informazioni su come utilizzare i collegamenti rapidi, consulta Collegamenti a OneLake.
Connettere i dati a più motori analitici
I dati sono spesso ottimizzati per un singolo motore, che rende difficile riutilizzare gli stessi dati per più applicazioni. Con Fabric, i diversi motori analitici (T-SQL, Apache Spark, Analysis Services e altri) archiviano i dati nel formato Delta Parquet aperto per consentire l'uso degli stessi dati tra più motori.
Non è necessario copiare i dati solo per usarli con un altro motore o sentirsi bloccati con l'uso di un motore specifico perché questo è il punto in cui si trovano i dati. Si supponga, ad esempio, che un team di ingegneri SQL costruisca un data warehouse completamente transazionale. Possono usare il modulo T-SQL e la piena potenza di T-SQL per creare tabelle, trasformare i dati e caricarli nelle tabelle. Se un data scientist vuole usare questi dati, non è necessario usare un driver Spark/SQL speciale. OneLake archivia tutti i dati in formato Delta Parquet. Il data scientist può usare la potenza completa del motore Spark e delle librerie open source direttamente sui dati.
Gli utenti aziendali possono creare report di Power BI direttamente su OneLake usando la modalità Direct Lake nel motore di Analysis Services. Il motore di Analysis Services supporta i modelli semantici di Power BI e offre sempre due modalità di accesso ai dati: importazione e query diretta. Questa terza modalità, la modalità Direct Lake, offre agli utenti tutta la velocità di importazione senza dover copiare i dati, combinando il meglio dell'importazione e della query diretta. Per altre informazioni, vedere Direct Lake.
Passaggi successivi
Sei pronto per iniziare a usare OneLake? Ecco come iniziare: