Condividi tramite


Scrivere query ed esplorare i dati nel nuovo editor SQL

L'interfaccia utente di Databricks include un editor SQL che è possibile usare per creare query, collaborare con i colleghi, esplorare i dati disponibili e creare visualizzazioni. Questa pagina illustra come usare l'editor SQL per scrivere, eseguire, gestire e condividere query.

Questo articolo illustra come usare il nuovo editor SQL. Per informazioni sull'uso dell'editor SQL legacy, vedere Scrivere query ed esplorare i dati nell'editor SQL legacy.

Aprire l'editor SQL

Per aprire l'editor SQL nell'interfaccia utente di Azure Databricks, fare clic su Icona dell'editor SQLEditor SQL nella barra laterale.

L'editor SQL si apre all'ultima query aperta. Se non esiste alcuna query o tutte le query sono state chiuse in modo esplicito, verrà visualizzata la pagina di destinazione dell'editor SQL.

Attivare il nuovo editor SQL

Usare l'interruttore Nuovo editor SQL a destra dei selettori a discesa catalogo e schema per attivare il nuovo editor. Nelle visualizzazioni strette è possibile trovare l'interruttore Nuovo editor SQL facendo clic sull'icona del menu Kebab a destra dei selettori dei cataloghi e degli schemi.

Screenshot che mostra l'editor SQL con il nuovo editor di query disattivato

Abilitare il nuovo editor per qualsiasi query di cui si è proprietari:

  • Fare clic su Nuovo editor SQL: OFF. Viene visualizzato un menu a comparsa Nuovo editor SQL.
    • La casella di controllo Applica a tutte le query è selezionata per impostazione predefinita. Mantenere questa impostazione per abilitare l'editor per tutte le query di cui si è proprietari.
    • Per abilitare il nuovo editor solo per la query attiva, deselezionare la casella di controllo Applica a tutte le query.
  • Impostare l'opzione Nuovo editor SQL su ON.

Non è possibile usare il nuovo editor SQL per tutte le query. Non è possibile passare al nuovo editor SQL per una query se una delle condizioni seguenti è vera:

  • La query non è proprietaria.
  • La query contiene elenchi a discesa basati su richiesta, che non sono supportati. Vedere Usare i parametri di query.

Quando si attiva il nuovo editor SQL, la query viene riaperta nella nuova interfaccia utente. Il set di risultati è vuoto fino a quando non si esegue la query.

Nota

I risultati delle query vengono condivisi con tutti i collaboratori e sono limitati a 64.000 righe.

Orientamento

Questa sezione evidenzia le principali differenze nell'interfaccia utente e spiega come trovare e usare le funzionalità disponibili.

Screenshot che mostra l'editor SQL con callout etichettati come indicato nel testo.

  1. Accedere al file system dell'area di lavoro: è possibile accedere e organizzare gli oggetti dell'area di lavoro direttamente dall'editor SQL.
  2. Usare l'Assistente Databricks integrato: chat con l'assistente per scrivere, perfezionare o comprendere le query. Eseguire il codice generato dall'assistente dal pannello laterale.
  3. Comprimi sezioni di codice: fai clic sulla freccia di compressione a sinistra di un blocco di codice per nascondere ed espandere in modo selettivo le sezioni di codice. Questo può semplificare l'uso di file di grandi dimensioni.
  4. Aprire il riquadro comandi: il riquadro comandi include azioni comuni, tasti di scelta rapida, temi personalizzati e collegamenti che consentono di trovare rapidamente ciò che serve. Dopo averlo aperto, usare la barra di ricerca per cercare strumenti e collegamenti specifici.
  5. Commento sul codice: aggiungere commenti al codice per migliorare la collaborazione.
  6. Esaminare la cronologia delle versioni: esaminare le modifiche recenti alla query.

Connessione all’ambiente di calcolo

Per eseguire query, è necessario disporre almeno delle autorizzazioni CAN USE per un'istanza di SQL warehouse in esecuzione. È possibile usare l'elenco a discesa nella parte superiore dell'editor per visualizzare le opzioni disponibili. Per filtrare l'elenco, immettere testo nella casella di testo.

Selettore di SQL warehouse

La prima volta che si crea una query, l'elenco dei warehouse SQL disponibili viene visualizzato in ordine alfabetico. L'ultima istanza di SQL warehouse usata viene selezionata alla successiva creazione di una query.

L'icona accanto a SQL warehouse indica lo stato:

  • In esecuzione In esecuzione
  • Avvio Avvio
  • Arrestato Arrestato

Nota

Se nell'elenco non sono presenti warehouse SQL, contattare l'amministratore dell'area di lavoro.

L'istanza di SQL warehouse selezionata verrà riavviata automaticamente quando si esegue la query. Vedere Avviare un'istanza di SQL warehouse per informazioni su altri modi per avviare un'istanza di SQL warehouse.

Esplorare gli asset e ottenere assistenza

Usare il riquadro sinistro nell'editor SQL per esplorare i file dell'area di lavoro, visualizzare gli oggetti dati e ottenere assistenza da Databricks Assitant.

Il riquadro sinistro nell'editor SQL include le schede per il browser di file dell'area di lavoro, il browser dello schema e Databricks Assistant.

Esplorare i file dell'area di lavoro

Fare clic sull'icona della cartella per aprire la cartella utente dell'area di lavoro. È possibile spostarsi tra tutti i file dell'area di lavoro a cui si ha accesso da questa parte dell'interfaccia utente.

Esplorare gli oggetti dati

Se si dispone dell'autorizzazione di lettura dei metadati, il browser dello schema nell'editor SQL mostra i database e le tabelle disponibili. È anche possibile esplorare oggetti di dati dall'Esplora Cataloghi .

È possibile esplorare gli oggetti di database regolati dal catalogo Unity in Esplora cataloghi senza calcolo attivo. Per esplorare i dati nel hive_metastore e in altri cataloghi non regolati dal catalogo Unity, è necessario connettersi alle risorse di calcolo con privilegi appropriati. Vedere Governance dei dati con Azure Databricks.

Nota

Se nel browser degli schemi o nel Catalog Explorer non sono presenti oggetti dati, contattare l'amministratore dell'area di lavoro.

Fare clic su Icona di aggiornamento schema vicino alla parte superiore del browser dello schema per aggiornare lo schema. È possibile digitare nella barra di ricerca per filtrare gli asset in base al nome. Fare clic sull'icona Filtro. Icona filtro per filtrare gli oggetti in base al tipo.

Fare clic sul nome di un oggetto nel browser per visualizzare altri dettagli sull'oggetto. Ad esempio, fare clic su un nome di schema per visualizzare le tabelle nello schema. Fare clic su un nome di tabella per visualizzare le colonne nella tabella.

Ottenere assistenza da Databricks Assistant

Fare clic sull'icona Assistente DB per aprire una finestra di chat con l'Assistente Databricks. Fare clic su una domanda suggerita o immettere la propria domanda per interagire con Databricks Assistant.

Creare una query

È possibile immettere testo per creare una query nell'editor SQL. È possibile inserire elementi dal browser dello schema per fare riferimento a cataloghi e tabelle.

  1. Digitare la query nell'editor SQL.

    L'editor SQL supporta il completamento automatico. Durante la digitazione, il completamento automatico suggerisce i completamenti. Ad esempio, se un completamento valido nella posizione del cursore è una colonna, il completamento automatico suggerisce un nome di colonna. Se si digita select * from table_name as t where t., il completamento automatico riconosce che t è un alias per table_name e suggerisce le colonne all'interno di table_name. È anche possibile usare il completamento automatico per fare riferimento ai frammenti di query.

    Completamento automatico alias

  2. (Facoltativo) Al termine dell'azione di modifica, fare clic su Salva. Per impostazione predefinita, la query viene salvata nella home folder dell'utente. Per salvare la query in un percorso diverso, selezionare la cartella di destinazione e fare clic su Sposta.

Nota

Le nuove query vengono denominate automaticamente Nuova query con il timestamp di creazione aggiunto nel titolo. Per impostazione predefinita, le nuove query create senza un contesto di cartella specifico vengono create nella cartella Bozze nella home directory. Quando le nuove query vengono salvate o rinominate, vengono rimosse dalle bozze.

Eseguire query su origini dati

È possibile identificare un'origine della query usando un nome di tabella completo nella query stessa o selezionando una combinazione di catalogo e schema dai menu a tendina insieme al nome della tabella nella query. Un nome di tabella completo nella query annulla le opzioni di catalogo e schema nell'editor SQL. Se un nome di tabella o colonna include spazi, racchiudi tali identificatori tra backtick nelle query SQL.

Negli esempi seguenti viene illustrato come eseguire query su vari oggetti simili a tabelle che è possibile archiviare in un catalogo.

Eseguire una query su una tabella o vista standard

Il seguente esempio esegue una query su una tabella del catalogo samples.

SELECT
  o_orderdate,
  o_orderkey,
  o_custkey,
  o_totalprice,
  o_shippriority
FROM
  samples.tpch.orders

Eseguire query su una visualizzazione metrica

Nell'esempio seguente viene eseguita una query su una vista metrica che usa una tabella del catalogo degli esempi come origine. Valuta le tre misure elencate e le aggregazioni su Order Month e Order Status. Restituisce i risultati ordinati in base a Order Month. Per creare una visualizzazione metrica simile nell'area di lavoro, vedere Creare una visualizzazione delle metriche.

Tutte le valutazioni delle misure devono essere incluse nella funzione MEASURE. Vedere la funzione di aggregazione measuree.


SELECT
 `Order Month`,
 `Order Status`,
 MEASURE(`Order Count`),
 MEASURE(`Total Revenue`),
 MEASURE(`Total Revenue per Customer`)
FROM
 orders_metric_view
GROUP BY ALL
ORDER BY 1 ASC;

Ottimizzare una query con Databricks Assistant

Fare clic sull'icona Assistente database. Icona assistente sul lato destro dell'editor per ottenere informazioni e suggerimenti inline durante la scrittura di query. Il comando slash /optimize invita l'Assistente a valutare e ottimizzare le query. Per altre informazioni, vedere Ottimizzare codice Python, PySpark e SQL.

Query ottimizzata generata usando il comando /optimize con Databricks Assistant

Modificare più schede di query

Per impostazione predefinita, l'editor SQL usa le schede in modo da poter aprire e modificare più query contemporaneamente. Per aprire una nuova scheda, cliccare su +, quindi selezionare Crea nuova query o Apri query esistente. Fare clic su Apri query esistente per visualizzare un elenco di query. La scheda For you offre un elenco curato di suggerimenti basati sull'utilizzo. Utilizzare la scheda Tutti per trovare qualsiasi query a cui si ha accesso.

Finestra di dialogo Query

Eseguire una singola query o query con più istruzioni

È possibile scrivere query con più istruzioni in una singola scheda dell'editor. Per usare più istruzioni di query in una singola scheda, terminare ogni istruzione con un punto e virgola (;).

Per eseguire una singola query:

  1. Selezionare un magazzino SQL.
  2. Evidenziare una query nell'editor SQL (se nel riquadro query sono presenti più query).
  3. Premere Ctrl/Cmd + Invio oppure fare clic su Run (1000) per visualizzare i risultati come tabella nel riquadro dei risultati.

Nota

Per impostazione predefinita, vengono selezionate Esegui tutte le istruzioni e Limite 1000.

  • Per eseguire solo l'istruzione attiva, deselezionare Esegui tutte le istruzioni.
  • Se una query viene salvata con l'impostazione Limite 1000 , questa impostazione si applica a tutte le esecuzioni di query. Per restituire tutte le righe (fino a 64.000), deselezionare LIMIT 1000 dal menu a discesa Esegui (1000). Per specificare un limite diverso per il numero di righe, aggiungere una LIMIT clausola nella query. Il numero massimo di righe restituite in una tabella è 64.000.

Terminare una query

Per terminare una query mentre è in esecuzione, fare clic su Annulla. Un amministratore può interrompere una query in esecuzione avviata da un altro utente visualizzando Terminate un query in esecuzione.

Condividi una query

Il nuovo editor SQL gestisce le autorizzazioni in due parti:

Esecuzione interattiva: le query nel nuovo editor SQL vengono sempre eseguite utilizzando le credenziali di visualizzazione. I risultati delle query sono accessibili a chiunque abbia accesso alla query. Gli utenti con autorizzazioni CAN EDIT o versione successiva possono modificare la bozza di query condivisa. Inoltre, le modifiche non salvate sono visibili a chiunque disponga delle autorizzazioni CAN VIEW o versioni successive. Per eseguire query, gli utenti devono disporre almeno dell'autorizzazione CAN USE per il warehouse associato.

Impostazioni credenziali: Le impostazioni di autorizzazione per gli avvisi, i flussi di lavoro e i dashboard legacy sono uguali a quelli per l'editor SQL legacy. A seconda delle preferenze, questi asset possono essere eseguiti usando le credenziali del proprietario o del visualizzatore.

Vedere Configurare le autorizzazioni di query per informazioni sulle impostazioni delle credenziali Esegui come proprietario e Esegui come visualizzatore. Per informazioni su come gestire l'accesso all'oggetto query, vedere ACL di query.

Collabora ai file in tempo reale

GIF che mostra più utenti che modificano una query.

Dopo aver condiviso la query, è possibile creare un coautore o eseguire il debug delle query in tempo reale tramite la modifica collaborativa. Gli editor possono anche commentare singole righe di codice per porre domande o aggiungere suggerimenti.

controllo del codice sorgente una query

I file di query SQL di Databricks (estensione: .dbquery.ipynb) sono supportati nelle cartelle Git di Databricks . È possibile usare una cartella Git per controllare i file di query e condividerli in altre aree di lavoro con cartelle Git che accedono allo stesso repository Git. Se si sceglie di non utilizzare il nuovo editor SQL dopo aver effettuato il commit o la clonazione di una query in una cartella Git di Databricks, eliminare e riclonare quella cartella Git per evitare comportamenti imprevisti.

Salvare una interrogazione

Il contenuto delle query nel nuovo editor SQL viene salvato automaticamente in modo continuo. Il pulsante Salva controlla se il contenuto della query bozza deve essere applicato agli asset correlati, ad esempio dashboard legacy, flussi di lavoro o avvisi legacy. Se la query viene condivisa con le credenziali di proprietario Esegui come proprietario, solo il proprietario della query può usare il pulsante Salva per propagare le modifiche. Se la credenziale è impostata su Esegui come visualizzatore, qualsiasi utente con almeno CAN MANAGE l'autorizzazione può salvare la query.

Visualizza i risultati delle query

È possibile confrontare l'output di ogni istruzione con più istruzioni di risultato. Quando si eseguono più istruzioni SQL da una singola finestra di modifica, è possibile usare l'interfaccia utente nel pannello output nella parte inferiore della schermata per scorrere i diversi set di risultati.

Nuovo editor SQL consente di scorrere le diverse tabelle nel pannello di output.

È possibile interagire ed esplorare i risultati della query usando il riquadro dei risultati. Il riquadro dei risultati include le funzionalità seguenti per l'esplorazione dei risultati.

Visualizzazioni

Fare clic sull'icona segno più per aggiungere una visualizzazione. Le visualizzazioni consentono di esplorare il set di risultati. Per un elenco completo dei tipi di visualizzazione disponibili, vedere Tipi di visualizzazione.

Fare clic sulla freccia verso il basso in una scheda di visualizzazione per visualizzare opzioni aggiuntive.

Opzioni per personalizzare una visualizzazione o aggiungere a un dashboard.

  • Fare clic su Scarica per scaricare i dati rappresentati nella visualizzazione come file CSV, TSV o Excel.
  • Fare clic su Rimuovi per eliminare la visualizzazione.
  • Fare clic su Duplica per clonare la scheda dei risultati.
  • Cliccare Rinomina per rinominare la visualizzazione.
  1. Fare clic su Modifica per modificare la visualizzazione.

  2. Fare clic su Aggiungi al dashboard per copiare la query e la visualizzazione in un nuovo dashboard di intelligenza artificiale/BI.

  3. Selezionare Crea nuovo dashboard o Aggiungi al dashboard esistente.

    • Creare un nuovo dashboard: Crea un nuovo dashboard che include tutte le visualizzazioni associate alla query. Viene richiesto di scegliere un nome per il nuovo dashboard. Il dashboard importato viene salvato nella cartella utente.
    • Aggiungi al dashboard esistente: Aggiunge la tua query e le visualizzazioni associate al dashboard esistente. Usare il menu a discesa per scegliere il dashboard a cui aggiungere il set di dati e la visualizzazione.

Scaricare i risultati

È possibile scaricare i risultati come file CSV o Excel. I download CSV supportano fino a circa 5 GB di dati. Fare clic sul cursore in basso in una scheda dei risultati per visualizzare le opzioni di download. Le dimensioni di download del file finale potrebbero essere leggermente superiori o inferiori a 5 GB, perché il limite di 5 GB viene applicato a un passaggio precedente rispetto al download finale del file.

Opzioni per scaricare i risultati e aggiungere ai dashboard.

Nota

Se non è possibile scaricare una query, l'amministratore dell'area di lavoro ha disabilitato il download per l'area di lavoro.

Filtri

I filtri consentono di limitare il set di risultati dopo l'esecuzione di una query. È possibile applicare filtri per visualizzare in modo selettivo subset diversi dei dati. Usare Assistente per aggiungere un filtro per i risultati.

Per aggiungere un filtro:

  1. Fare clic sull'icona Filtro. L'icona del filtro.
  2. Immettere il testo per descrivere il tipo di filtro da applicare. Al set di risultati viene applicato un filtro denominato.

Per modificare un filtro:

  1. Fare clic sul nome del filtro.
  2. Usare i menu a discesa e i campi di testo per modificare le impostazioni del filtro.
  3. (Facoltativo) Selezionare Sensibilità alle maiuscole per rendere il filtro sensibile alle maiuscole e minuscole.
  4. (Facoltativo) Fare clic su Aggiungi condizione OR per aggiungere un filtro aggiuntivo.

Aggiungere parametri

I parametri consentono di limitare il set di risultati sostituendo i valori in una query in fase di esecuzione. Vedere Usare i parametri di query per informazioni su come applicare i parametri.

Modifiche alla sintassi dei parametri

Le query scritte nell'editor SQL legacy che usano parentesi graffe doppie ({{}}) per contrassegnare i parametri devono essere modificate per l'utilizzo nel nuovo editor SQL. Il nuovo editor SQL usa la stessa sintassi dei parametri degli altri strumenti di Databricks, ad esempio dashboard di intelligenza artificiale/BI, intelligenza artificiale/BI Genie e notebook.

I parametri nel nuovo editor SQL vengono definiti usando la sintassi dei parametri denominati. I parametri denominati sono parametri in una query preceduti da due punti, ad esempio :parameter_name.

Vedere Marcatori di parametro denominati per la documentazione di riferimento SQL. Vedere Esempi di sintassi dei parametri denominati per esempi di conversione della sintassi dei parametri dall'editor SQL classico a marcatori di parametro denominati.

Tipi di filtro supportati

Nella tabella seguente vengono illustrati i tipi di filtro supportati nel nuovo editor SQL. La seconda colonna indica se il filtro funziona anche nell'editor SQL legacy.

Tipo filtro Supportato nell'editor legacy
È uguale a
Non è uguale a NO
È uno dei
Non è uno di NO
Contiene
Non contiene NO
Inizia con
Non inizia con NO
Termina con NO
Non termina con NO
È nullo NO
Non è "null" NO
Maggiore di NO
Maggiore o uguale a NO
Meno di NO
Minore o uguale a NO
tra le
Prima di NO
Dopo NO
È vero
È falso
Condizioni OR NO

Usare i tasti di scelta rapida

Il nuovo editor SQL include molti tasti di scelta rapida predefiniti che consentono di lavorare rapidamente. La tabella seguente identifica i tasti di scelta rapida di uso comune.

Funzione Scorciatoia macOS Collegamento a Windows
Eseguire una query Cmd + Enter Ctrl + Enter
Eseguire una singola istruzione evidenziata Cmd + Shift + Enter Ctrl + Shift + Enter
Completamento automatico Ctrl + Space Ctrl + Space
Aumentare le dimensioni del carattere Option + + (tasto più) Alt + + (tasto più)
Ridurre le dimensioni del carattere Option + - (tasto meno) Alt + - (tasto meno)
Formattare il codice SQL Cmd + Shift + F Ctrl + Shift + F
Visualizza tutti i tasti di scelta rapida Esc quindi H Esc quindi H

Disabilitare il nuovo editor SQL

Per disabilitare il nuovo editor SQL, seguire questa procedura:

  • Fare clic su Nuovo editor SQL: ON. Viene visualizzato un menu a comparsa Nuovo editor SQL.
  • Impostare l'interruttore nuovo editor SQL di su OFF.
  • Nella finestra di dialogo di conferma scegliere di disabilitare il nuovo editor solo per la query attiva o per tutte le query idonee.
    • L'opzione Disabilita per tutte le query idonee non è selezionata. Mantenere questa impostazione se si vuole disabilitare il nuovo editor solo per la query attiva.
    • Per disabilitare il nuovo editor SQL per tutte le query, selezionare la casella di controllo Disabilita per tutte le query idonee.

Gli amministratori dell'area di lavoro possono disattivare questa funzionalità a livello di area di lavoro visitando il portale di anteprima e cercando l'editor SQL. Vedere Gestire le anteprime di Azure Databricks.