Creare un'origine di conoscenza OneLake indicizzata

Nota

Questa funzionalità agentic di recupero è generalmente disponibile nell'API REST versione 2026-04-01 tramite accesso programmatico. Il portale di Azure e il portale Foundry di Microsoft continueranno a fornire l'accesso in anteprima a tutte le funzionalità di recupero agentico. Per indicazioni sulla migrazione, vedere Eseguire la migrazione del codice di recupero agenti alla versione più recente.

Se si sceglie di usare un'API REST di anteprima, è possibile accedere alle funzionalità non ancora disponibili a livello generale per questa funzionalità. Le funzionalità di anteprima vengono fornite senza un contratto di servizio e non sono consigliate per i carichi di lavoro di produzione. Per ulteriori informazioni, vedere Condizioni supplementari per l'uso delle versioni di anteprima di Microsoft Azure.

Importante

Queste funzionalità e funzionalità fanno parte dell'API REST 2026-05-01-preview. L'anteprima 2026-05-01-preview è concessa in licenza all'utente come parte della sottoscrizione Azure ed è soggetta ai termini applicabili alle "Anteprime" nei Microsoft Product Terms, nel Microsoft Products and Services Data Protection Addendum ("DPA") e nei Supplemental Terms of Use for Microsoft Azure Previews.

La versione 2026-05-01-preview supporta le connessioni ad altri servizi di servizi Microsoft e di terze parti. L'utilizzo di questi servizi è soggetto alle rispettive condizioni e potrebbe comportare l'elaborazione o l'archiviazione dei dati al di fuori del limite di conformità Azure, nonché il flusso dei dati nel limite di conformità Azure.

L'anteprima 2026-05-01-preview non può modificare le autorizzazioni di accesso impostate al di fuori dell'anteprima 2026-05-01-preview. Se si utilizza la versione 2026-05-01-preview con contenuti soggetti a restrizioni di accesso o autorizzazioni, si verificherà un ritardo prima che la versione 2026-05-01-preview riconosca le modifiche apportate a tali restrizioni di accesso o autorizzazioni.

È tua responsabilità gestire l'eventuale trasferimento dei tuoi dati al di fuori dei confini di conformità e geografici della tua organizzazione e le relative implicazioni, nonché garantire che siano predisposte le autorizzazioni, i limiti e le approvazioni appropriati.

L'utente è responsabile di esaminare e testare attentamente le applicazioni compilate nel contesto dei casi d'uso specifici e di prendere tutte le decisioni e le personalizzazioni appropriate. Ciò include l'implementazione di mitigazioni di intelligenza artificiale responsabili, ad esempio metaprompt, filtri di contenuto o altri sistemi di sicurezza, e garantire che le applicazioni soddisfino gli standard di qualità, affidabilità, sicurezza e attendibilità appropriati. Per altre informazioni, vedere la nota sulla trasparenza Azure AI Search.

Un origine della conoscenza OneLake indicizzata acquisisce i file di Microsoft OneLake in una pipeline di recupero agentico in Azure AI Search. Le origini delle informazioni vengono create in modo indipendente, a cui viene fatto riferimento in una Knowledge Base e usate come dati di base quando viene eseguita una query sulla Knowledge Base in fase di esecuzione.

Quando si crea una fonte di conoscenza OneLake indicizzata, si specifica una fonte dati esterna, dei modelli e delle proprietà per generare automaticamente i seguenti oggetti di Azure AI Search:

Un'origine dati che rappresenta un lakehouse.
Insieme di competenze che suddivide e, facoltativamente, vettorizza i contenuti multimodali dal lakehouse.
Indice che archivia il contenuto arricchito e soddisfa i criteri per il recupero agentico.
Indicizzatore che usa gli oggetti precedenti per guidare la pipeline di indicizzazione e arricchimento.

L'indicizzatore generato è conforme all'indicizzatore OneLake, i cui prerequisiti, le attività supportate, i formati di documento supportati, i collegamenti supportati e le limitazioni si applicano anche alle origini conoscenze di OneLake. Per altre informazioni, vedere la documentazione dell'indicizzatore OneLake.

Supporto per l'utilizzo

Portal di Azure	portale Microsoft Foundry	.NET SDK	Python SDK	Java SDK	JavaScript SDK	API REST
✔️	✔️	✔️	✔️	✔️	✔️	✔️

Prerequisiti

Servizio di Ricerca con intelligenza artificiale di Azure disponibile in qualsiasi area che supporta il recupero tramite agenti autonomi.
Completamento dei prerequisiti dell'indicizzatore OneLake.
Completamento della preparazione dei dati dell'indicizzatore OneLake.
Autorizzazioni per la creazione di origini delle informazioni. Configurare l'autenticazione senza chiave con il ruolo Collaboratore servizio di ricerca assegnato all'account utente (scelta consigliata) o usare una chiave API.
Se l'origine dati di conoscenza specifica un modello Azure OpenAI per incorporamenti vettoriali o descrizione delle immagini, il servizio di ricerca deve avere un'identità gestita con autorizzazioni Utente di Servizi cognitivi sulla risorsa Microsoft Foundry.

Pacchetto Azure.Search.Documents obbligatorio:
- Per le funzionalità di anteprima 2026-05-01, il pacchetto di anteprima più recente: dotnet add package Azure.Search.Documents --prerelease
- Per le funzionalità 2026-04-01, il pacchetto stabile più recente: dotnet add package Azure.Search.Documents

Pacchetto azure-search-documents obbligatorio:
- Per le funzionalità di anteprima 2026-05-01, il pacchetto di anteprima più recente: pip install --pre azure-search-documents
- Per le funzionalità 2026-04-01, il pacchetto stabile più recente: pip install azure-search-documents

Versione dell'API REST necessaria:
- Per le funzionalità di anteprima: Servizio di ricerca 2026-05-01-preview
- Per le funzionalità disponibili a livello generale: Servizio di ricerca 2026-04-01

Verificare la presenza di fonti di conoscenza esistenti

Un'origine delle conoscenze è un oggetto riutilizzabile di primo livello. Conoscere le origini conoscenze esistenti è utile per riutilizzare o denominare nuovi oggetti.

Eseguire il codice seguente per elencare le origini delle informazioni in base al nome e al tipo.

// List knowledge sources by name and type
using Azure.Search.Documents.Indexes;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
var knowledgeSources = indexClient.GetKnowledgeSourcesAsync();

Console.WriteLine("Knowledge Sources:");

await foreach (var ks in knowledgeSources)
{
    Console.WriteLine($"  Name: {ks.Name}, Type: {ks.GetType().Name}");
}

Nome	Descrizione	Digitare	Modificabile	Obbligatorio
`Name`	Nome dell'origine di conoscenza, che deve essere univoco all'interno della raccolta delle origini di conoscenza e seguire le linee guida di denominazione per gli oggetti in Azure AI Search.	Stringa	No	Sì
`Description`	Descrizione dell'origine delle informazioni.	Stringa	Sì	No
`EncryptionKey`	Chiave gestita dal cliente per crittografare le informazioni riservate sia nell'origine delle informazioni che negli oggetti generati.	Oggetto	Sì	No
`IndexedOneLakeKnowledgeSourceParameters`	Parametri specifici delle origini delle conoscenze di OneLake: `FabricWorkspaceId`, `LakehouseId`e `TargetPath`.	Oggetto		Sì
`FabricWorkspaceId`	GUID dello spazio di lavoro che contiene la lakehouse.	Stringa	No	Sì
`LakehouseId`	GUID del lakehouse.	Stringa	No	Sì
`TargetPath`	Una cartella o un collegamento all'interno della lakehouse. Se non specificato, l'intera lakehouse viene indicizzata.	Stringa	No	No

Nome	Descrizione	Digitare	Modificabile	Obbligatorio
`Identity`	Identità gestita da usare nell'indicizzatore generato.	Oggetto	Sì	No
`DisableImageVerbalization`	Abilita o disabilita l'uso della verbalizzazione delle immagini. Il valore predefinito è `False`, che abilita la verbalizzazione delle immagini. Impostare `True` su disabilitare la verbalizzazione delle immagini.	Booleano	No	No
`ChatCompletionModel`	Modello di completamento della chat che verbalizza le immagini o estrae il contenuto. I modelli supportati sono `gpt-4o`, `gpt-4o-mini`, `gpt-4.1gpt-4.1-mini`, `gpt-4.1-nano`, `gpt-5`, , `gpt-5-mini`e `gpt-5-nano`. La competenza Prompt GenAI è inclusa nel set di competenze generato. L'impostazione di questo parametro richiede anche che `DisableImageVerbalization` sia impostato su `False`. Quando `ContentExtractionMode` è impostato su `standard`, `ChatCompletionModel.AzureOpenAIParameters.ResourceUri` deve essere uguale a `AiServices.Uri` e entrambi i parametri devono puntare alla stessa risorsa Microsoft Foundry in `services.ai.azure.com`.	Oggetto	Solo `ApiKey` e `DeploymentName` sono modificabili	No
`EmbeddingModel`	Modello di incorporamento di testo che vettorizza il contenuto di testo e immagine durante l'indicizzazione e in fase di query. I modelli supportati sono `text-embedding-ada-002`, `text-embedding-3-small`e `text-embedding-3-large`. La funzionalità di embedding di Azure OpenAI è inclusa nel set di funzionalità generato e il vettorizzatore Azure OpenAI è incluso nell'indice generato.	Oggetto	Solo `ApiKey` e `DeploymentName` sono modificabili	No
`ContentExtractionMode`	Controlla la modalità di estrazione del contenuto dai file. Il valore predefinito è `minimal`, che usa metodi di estrazione del contenuto di base per testo e immagini. Impostare su `standard` per il cracking e la suddivisione avanzata dei documenti utilizzando la funzionalità Azure Content Understanding, che è inclusa nel set di competenze generato. Solo per `standard`, il parametro `AiServices` può essere specificato e `ChatCompletionModel.AzureOpenAIParameters.ResourceUri` deve essere uguale a `AiServices.Uri`. Per altre informazioni, vedere la `ChatCompletionModel` riga .	Stringa	No	No
`AiServices`	Una risorsa di Foundry per accedere ad Azure Content Understanding in Foundry Tools. L'impostazione di questo parametro richiede che `ContentExtractionMode` sia impostato su `standard`. Per altre informazioni, vedere la `ChatCompletionModel` riga .	Oggetto	Solo `ApiKey` modificabile	No
`IngestionSchedule`	Aggiunge informazioni di pianificazione all'indicizzatore generato. È anche possibile aggiungere una pianificazione in un secondo momento per automatizzare l'aggiornamento dei dati.	Oggetto	Sì	No
`IngestionPermissionOptions`	Autorizzazioni a livello di documento per l'inserimento insieme al contenuto. Specificare `UserIds`, `GroupIds` o `RbacScope` per archiviare i metadati delle autorizzazioni nell'indice. È anche possibile specificare `SensitivityLabel` per acquisire i metadati delle etichette di riservatezza di Microsoft Purview per le origini dati di conoscenza blob, OneLake indicizzate e SharePoint indicizzate. Per indicazioni RBAC specifiche dell'origine, vedere Acquisire le autorizzazioni RBAC dall'archiviazione BLOB e Acquisire gli ACL da ADLS Gen2. Per applicare queste autorizzazioni in fase di query, vedere Applicare le autorizzazioni in fase di query.	Array	No	No
`AssetStore`	(solo nell'anteprima 2026-05-01) Contenitore BLOB usato per archiviare in modo permanente le immagini estratte dai documenti di origine. Obbligatorio per abilitare la gestione delle immagini (anteprima) per la Knowledge Base. Se si imposta questo parametro, viene effettuato il provisioning di un repository di conoscenza insieme all'origine della conoscenza per archiviare gli artefatti delle immagini. È possibile esaminare e gestire questo archivio conoscenze come qualsiasi altro. L'account di archiviazione deve rimanere accessibile al servizio di ricerca per la durata della Knowledge Base.	Oggetto	No	No

Creare un'origine di conoscenza OneLake indicizzata

Supporto per l'utilizzo

Prerequisiti

Verificare la presenza di fonti di conoscenza esistenti

Creare una fonte di conoscenza

Proprietà specifiche dell'origine

Proprietà dei parametri di inserimento

Controllare lo stato di inserimento

Esaminare gli oggetti generati

Assegnare a una base di conoscenza

Eseguire una query su una base di conoscenza

Applicare le autorizzazioni a livello di documento

Surface immagini incorporate nei documenti

Eliminare una fonte di conoscenza

Errori noti

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive