Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
si applica a:✅ Magazzino di dati in Microsoft Fabric
Uno snapshot del magazzino è una rappresentazione di sola lettura di un articolo di magazzino in un momento specifico, conservato fino a 30 giorni. Per iniziare, creare uno snapshot del warehouse.
Annotazioni
Gli snapshot del magazzino sono attualmente una funzionalità di anteprima.
Gli snapshot del magazzino dati possono essere facilmente "ripristinati in avanti" su richiesta, consentendo agli utenti di connettersi allo stesso snapshot o di usare una stringa di connessione coerente con il magazzino dati per accedere a una versione precedente dei dati. Quando viene eseguito il rollforward del timestamp dello snapshot, gli aggiornamenti vengono applicati immediatamente, come in una singola transazione atomica. Lo snapshot del warehouse garantisce che i data engineer possano fornire agli utenti analitici un set di dati coerente, anche quando si verificano aggiornamenti in tempo reale. Gli analisti possono eseguire SELECT
query in base allo snapshot senza alcuna interferenza ETL.
Uno snapshot può essere utile negli scenari in cui un processo ETL potrebbe aver creato un danneggiamento dei dati. Questo elemento figlio di sola lettura garantisce stabilità e coerenza per i dati che altrimenti potrebbero essere modificati da alcuni processi ETL.
Guida decisionale per l'istantanea del magazzino
Questa tabella confronta l'endpoint di analisi SQL di Lakehouse con uno snapshot del warehouse.
Caratteristica / Funzionalità | Endpoint di analisi SQL del Lakehouse | Snapshot del magazzino |
---|---|---|
Creato | Generato automaticamente dal sistema | Elemento figlio creato dall'utente del magazzino padre |
Funzionalità principali | Esecuzione di query sulle tabelle Delta in Lakehouse. Supporta l'analisi sulle tabelle Lakehouse Delta e le cartelle Delta Lake a cui si fa riferimento tramite collegamenti | Effettuare una query a un momento specifico del magazzino padre |
Modifica dei dati | Sola lettura | Sola lettura |
Formato di archiviazione | Delta | Nessuna archiviazione separata, si affida al magazzino di origine, senza file Parquet |
Caricamento dei dati | Spark, pipeline, flussi di dati, collegamenti | Dati caricati nel warehouse padre |
Supporto di T-SQL | DQL completo (linguaggio di query dei dati), nessun DML (Linguaggio di manipolazione dei dati), DDL limitato (Data Definition Language), ad esempio il supporto per le viste, le funzioni con valori di tabella | DQL completo, nessun DML, nessun DDL (ad eccezione del timestamp dello snapshot aggiornato da amministratore, membro o collaboratore), nessuna creazione di viste o funzioni con valori di tabella |
Casi d'uso | Esplorazione ed esecuzione di query sulle tabelle delta del lakehouse, gestione dei dati di staging, architettura del medallion lakehouse con zone per l'analisi Bronzo, Argento e Oro | Accedere a una versione stabile di un magazzino, coerenza ETL, analisi cronologica, accuratezza dei report, soddisfare esigenze aziendali specifiche creando snapshot orari, giornalieri o settimanali del magazzino |
Autorizzazioni
Le autorizzazioni di sicurezza devono essere impostate nel database di origine.
- Un utente con ruoli dell'area di lavoro di amministratore, membro o collaboratore può creare e gestire uno snapshot del magazzino.
- Un utente con ruolo di amministratore, membro o collaboratore può modificare il timestamp dello snapshot tramite T-SQL e il portale di Fabric.
- Un utente con un ruolo di amministratore, membro, collaboratore o visualizzatore nell'area di lavoro, o un destinatario condiviso nell'accesso al magazzino padre, può interrogare lo snapshot figlio.
Aggiornare il timestamp dello snapshot
L'aggiornamento del timestamp dello snapshot può fornire ai consumer analitici una versione stabile dei dati. Le query in corso verranno sempre completate rispetto alla versione dei dati in base alla quale sono state avviate. Quando viene eseguito il rollforward del timestamp dello snapshot, gli aggiornamenti dei dati sono immediatamente disponibili, senza latenza o incoerenza nei dati.
Gli utenti possono aggiornare il timestamp di uno snapshot del warehouse esistente in qualsiasi momento. Questa operazione viene completata immediatamente.
Per aggiornare il timestamp di uno snapshot del warehouse, vedere Aggiornare il timestamp dello snapshot.
Quando viene eseguita una query T-SQL, vengono incluse informazioni sulla versione corrente dei dati a cui si accede. Ad esempio, è possibile visualizzare il timestamp nei Messaggi dell'editor di query del portale Fabric:
Sicurezza e gestione
- Gli snapshot ereditano le autorizzazioni dal warehouse di origine. Gli snapshot del magazzino sono di sola lettura per tutti i consumatori, indipendentemente dal livello di autorizzazione nel magazzino di origine. L'unica eccezione è che l'amministratore/membro/collaboratore può aggiornare il timestamp dello snapshot tramite TSQL o il portale di Fabric.
- Tutte le modifiche alle autorizzazioni nel warehouse di origine si applicano immediatamente allo snapshot. L'accesso utente, ad esempio GRANT, DENY, REVOKE e UNMASK, riflette lo stato del warehouse di origine indipendentemente dal timestamp dello snapshot.
- Gli utenti non possono eseguire query sullo snapshot se perdono l'accesso in un secondo momento.
- Ad esempio, se al consumatore viene negato l'accesso ai dati alle 12:00, questo vale sia per il magazzino che per lo snapshot. Se il timestamp dello snapshot è impostato su 11:00am, i privilegi negati vengono applicati immediatamente nello snapshot.
Annotazioni
La promessa di creazione di report stabile in Fabric Data Warehouse si applica ai dati, non allo schema. Ad esempio, se un report fa riferimento a una tabella, una vista o una colonna da uno snapshot e tale oggetto viene eliminato, rinominato o modificato dal warehouse padre, lo snapshot riflette tale modifica. Di conseguenza, il report potrebbe interrompersi. Questo comportamento è previsto, poiché il meccanismo di snapshot è progettato per mantenere la coerenza dei dati, non la stabilità dello schema.
Gestire gli snapshot
- Gli snapshot del magazzino richiedono nomi univoci, diversi sia dal magazzino sia dall'endpoint di analisi SQL.
- Le istantanee del magazzino non esistono senza il magazzino di origine. Quando il magazzino viene eliminato, tutti gli snapshot vengono eliminati. Gli snapshot del data warehouse devono essere ricreati se il magazzino dati viene ripristinato.
- Gli snapshot del magazzino sono validi per un massimo di 30 giorni retroattivamente. Data e ora dello snapshot può essere impostata su qualsiasi data precedente fino a 30 giorni fa o all'ora di creazione del database, a seconda di quale dei due è più recente.
Limitazioni
- Gli snapshot del magazzino possono essere creati solo in base ai nuovi articoli del magazzino creati dopo marzo 2025.
- Gli snapshot del magazzino non compaiono in Esplora oggetti di SSMS, ma appaiono nel menu a discesa di selezione del database.
- Tabelle, viste e procedure archiviate modificate dopo il timestamp dello snapshot diventano invalide nello snapshot.
- Gli snapshot del warehouse richiedono la modalità Direct Query o Import in Power BI e non supportano la modalità Direct Lake .
- Gli snapshot del warehouse non sono supportati nell'endpoint di analisi SQL di Lakehouse.
- Gli snapshot del magazzino non sono supportati come origine per i collegamenti a OneLake.