Spostare i dati dal DB di Azure SQL a Lakehouse tramite pipeline

In questa esercitazione si creerà una pipeline per spostare i dati nel database SQL di Azure in Lakehouse. Questa esperienza illustra una rapida demo su come usare l'attività di copia della pipeline e su come caricare i dati in Lakehouse.

Prerequisiti

Per iniziare, è necessario soddisfare i prerequisiti seguenti:

  • Un account tenant Microsoft Fabric con una sottoscrizione attiva. Creare un account gratuitamente.
  • Assicurarsi di disporre di un'area di lavoro abilitata per Microsoft Fabric: Creare un'area di lavoro.

Creare un flusso di lavoro

  1. Accedere a Power BI.

  2. Selezionare l'icona di Power BI nella parte inferiore sinistra della schermata, quindi selezionare Infrastruttura per aprire la home page di Data Factory.

  3. Accedere all'area di lavoro di Microsoft Fabric. Se hai già creato una nuova area di lavoro nella sezione precedente Prerequisiti, usare questa.

    Screenshot della finestra delle aree di lavoro in cui si passa alla propria area di lavoro.

  4. Selezionare + Nuovo elemento.

  5. Cercare e selezionare Pipeline e quindi immettere un nome di pipeline per creare una nuova pipeline. per creare una nuova pipeline.

    Screenshot che mostra il pulsante della nuova pipeline nell'area di lavoro appena creata.

    Screenshot che mostra il nome della creazione di una nuova pipeline.

Copia i dati utilizzando una pipeline

In questa sessione si inizia a creare la pipeline seguendo questa procedura per copiare dati dal database SQL di Azure a Lakehouse.

Aggiungere un'attività di copia

  1. Aprire una pipeline esistente o creare una nuova pipeline.

  2. Aggiungere un'attività Copy selezionando oppure selezionando Copia dati>Aggiungi all'area di lavoro nella scheda .

    Screenshot che mostra due modi per aggiungere un'attività di copia.

Configurare l'origine nella scheda Origine

  1. In Connessione selezionare una connessione esistente o selezionare Altro per creare una nuova connessione.

    1. Scegliere il tipo di origine dati dalla finestra popup. In questo esempio verrà usato il database SQL di Azure. Selezionare Database SQL di Azure e quindi selezionare Continua.

      Screenshot che mostra come selezionare l'origine dati.

    2. Si passa alla pagina di creazione della connessione. Inserire le informazioni di connessione richieste nel pannello, quindi selezionare Crea. Per informazioni dettagliate sulla creazione della connessione per ogni tipo di origine dati, è possibile fare riferimento a ogni articolo del connettore.

    3. Dopo aver creato correttamente la connessione, viene visualizzata nuovamente la pagina della pipeline. Selezionare poi Aggiorna per recuperare la connessione creata dall'elenco a discesa. È anche possibile scegliere una connessione di database SQL di Azure esistente direttamente dall'elenco a discesa se è già stata creata in precedenza. Le funzionalità di Connessione di test e Modifica sono disponibili per ogni connessione selezionata. Selezionare poi Database SQL di Azure nel tipo di connessione.

  2. Specificare una tabella da copiare. Selezionare Anteprima dei dati per visualizzare in anteprima la tabella di origine. È anche possibile usare Query e Stored procedure per leggere i dati dall'origine.

  3. Espandere Advanced per impostazioni più avanzate.

    Screenshot delle impostazioni avanzate.

Configurare la destinazione nella scheda destinazione

  1. In Connessione selezionare una connessione esistente oppure selezionare Altro e quindi cercare il lakehouse.

  2. Dopo aver creato correttamente la connessione, viene visualizzata nuovamente la pagina della pipeline. Selezionare poi Aggiorna per recuperare la connessione creata dall'elenco a discesa. Si può anche scegliere direttamente una connessione Lakehouse esistente dal menu a discesa, se già creata in precedenza.

  3. Specificare una tabella o configurare il percorso del file per definire il file o la cartella come destinazione. In questo caso selezionare Tabelle e specificare una tabella per scrivere i dati.

  4. Espandere Advanced per impostazioni più avanzate.

È ora possibile salvare la pipeline con questa singola attività di copia o continuare a progettare la pipeline.

Eseguire e pianificare la pipeline

Dopo aver completato la configurazione della pipeline, eseguire la pipeline per attivare l'attività di copia. Se necessario, è anche possibile pianificare l'esecuzione della pipeline.

  1. Passare alla scheda Home e selezionare Esegui. Verrà visualizzata una finestra di dialogo di conferma. Selezionare quindi Salva ed esegui per avviare l'attività.

    Screenshot del salvataggio e dell'esecuzione dell'attività.

  2. È possibile monitorare il processo in esecuzione e controllare i risultati nella scheda Output sotto l'area di disegno della pipeline. Selezionare il pulsante Dettagli esecuzione (con l'icona degli occhiali evidenziata) per visualizzare i dettagli dell'esecuzione.

    Screenshot dell'output della pipeline.

  3. I dettagli dell'esecuzione mostrano la quantità di dati letti e scritti e vari altri dettagli sull'esecuzione.

    Screenshot dei dettagli dell'attività di Copy.

  4. È anche possibile pianificare l'esecuzione della pipeline con una frequenza specifica in base alle esigenze. Ecco un esempio di come pianificare l'esecuzione della pipeline ogni 15 minuti. Specificare l'ora di inizio e l'ora di fine per la pianificazione del processo. Se non si specifica un'ora di inizio, l'ora di inizio è l'ora di applicazione della pianificazione. Se non si specifica un'ora di fine, l'esecuzione della pipeline si ripeterà ogni 15 minuti.

    Screenshot della pianificazione della pipeline.