Funzionalità di Azure AI Search

Azure AI Search fornisce il recupero delle informazioni e usa l'integrazione facoltativa dell'intelligenza artificiale per estrarre più valore dal contenuto di testo e vettore.

La tabella seguente riepiloga le funzionalità per categoria. Esistono parità di funzionalità in tutti i cloud pubblici, privati e sovrani Azure, ma alcune funzionalità non sono supportate nelle aree specifiche o specific tier.

Nota

Cerchi le funzionalità di anteprima? Vedere l'elenco delle funzionalità di anteprima.

Recupero agentico

Categoria Caratteristiche
Basi di conoscenza Le knowledge base (anteprima) orchestrano la pipeline di recupero agentico, collegandosi all'LLM e gestendo i parametri di query. Una knowledge base fa riferimento a una o più origini di informazioni e definisce il comportamento di recupero.
Origini delle informazioni Le origini delle informazioni (anteprima) specificano il contenuto usato per il recupero agentico. Creare origini conoscenze da indici di ricerca, Archiviazione BLOB di Azure, OneLake, SharePoint (indicizzato), SharePoint (remoto) o web (Bing).
Pianificazione delle query La pianificazione delle query usa un LLM per analizzare il contesto della conversazione e suddividere le domande complesse in sottoquery incentrate. Sono inclusi l'elaborazione della cronologia delle chat, la scomposizione delle query, l'espansione dei sinonimi e la correzione ortografica.
Esecuzione di query parallele Le sottoquery vengono eseguite simultaneamente in tutte le origini delle informazioni. Ogni sottoquery supporta la ricerca per parole chiave, vettori e ibrida con riordinamento semantico automatico.
Sforzo di ragionamento per il recupero Lo sforzo di ragionamento nel recupero (anteprima) regola il livello di elaborazione dell'LLM nella pipeline. Impostare su minimo per la velocità (nessun LLM), bassa per l'elaborazione bilanciata o media per ottimizzare la pertinenza massima.
Sintesi della risposta I risultati vengono combinati in una risposta unificata con tre parti: il contenuto unito per i dati di base, i riferimenti alle origini per le citazioni e i dettagli di esecuzione che mostrano il piano di query.

Indicizzazione ed estrazione dei dati

Categoria Caratteristiche
Origini dati Gli indici di ricerca possono accettare testo da qualsiasi origine, purché venga inviato come documento JSON.

Gli indicizzatori sono una funzionalità che automatizza l'importazione dei dati da origini dati supportate per estrarre contenuto ricercabile negli archivi dati primari. Gli indicizzatori gestiscono automaticamente la serializzazione JSON e supportano la maggior parte delle forme di rilevamento delle modifiche e dell'eliminazione. È possibile connettersi a una varietà di origini dati, come Microsoft OneLake, database SQL di Azure, Azure Cosmos DB o Archiviazione BLOB di Azure.

I connettori di App per la logica (anteprima) consentono di accedere a un'ampia gamma di origini dati, inclusi i dati in altre piattaforme cloud. Questa pipeline di indicizzazione e arricchimento viene creata in Azure AI Search ma gestita in App per la logica di Azure.

Le origini delle informazioni (anteprima) sono una funzionalità del recupero agentico. Vengono usati durante l'indicizzazione e in fase di query per supportare una Knowledge Base.
Strutture di dati gerarchici e annidate Tipi e raccolte complessi consentono di modellare praticamente qualsiasi tipo di struttura JSON all'interno di un indice di ricerca. Le cardinalità uno-a-molti e molti-a-molti possono essere espresse in modo nativo tramite raccolte, tipi complessi e raccolte di tipi complessi.
Analisi linguistica Gli analizzatori sono componenti della ricerca classica usata per l'elaborazione del testo durante l'indicizzazione e le operazioni di ricerca. Per impostazione predefinita, è possibile usare l'analizzatore Lucene Standard per utilizzo generico oppure eseguire l'override dell'impostazione predefinita con un analizzatore del linguaggio, un analizzatore personalizzato configurato o un altro analizzatore predefinito che produce token nel formato necessario.

Analizzatori linguistici da Lucene o Microsoft vengono usati per gestire in modo intelligente le specificità linguistiche delle varie lingue, inclusi i tempi verbali, il genere, i sostantivi plurali irregolari (ad esempio, 'mouse' e 'mice'), il decompounding delle parole, la suddivisione delle parole (per le lingue senza spazi) e molto altro.

Gli analizzatori lessicali personalizzati vengono usati per moduli di query complessi, ad esempio la corrispondenza fonetica e le espressioni regolari.

Integrazione del modello di chat e dell'agente

Categoria Caratteristiche
Modelli di completamento della chat usati durante l'indicizzazione La competenza del prompt GenAI è una competenza che invoca un modello linguistico di grandi dimensioni durante l'indicizzazione e fornisce un prompt che definisce il compito. Si decide qual è l'attività. Può descrivere un'immagine, riepilogare o modificare il contenuto o qualsiasi attività che il modello può eseguire. L'output viene aggiunto come nuovo campo in un indice ricercabile.
Modelli di completamento chat usati in fase di query Il recupero agentico (anteprima) usa un modello linguistico di grandi dimensioni per la pianificazione delle query, la scomposizione e la parafrasazione di query complesse per una migliore copertura delle query sull'indice. Le risposte dal recupero agentico sono progettate per i flussi di lavoro da agente a agente. Puoi passare i risultati della ricerca come un'unica grande stringa, il che semplifica l'uso da parte dell'agente del tuo contenuto proprietario. La risposta include anche citazioni e informazioni sull'esecuzione di query.

La sintesi delle risposte (anteprima) usa LLM per generare risposte supportate dalla citazione dai risultati della ricerca restituiti dal recupero agentico.

I modelli RAG possono essere implementati usando le funzionalità esistenti. La possibilità di ottimizzare la pertinenza e costruire query ibride migliora la qualità del contenuto inviato ai chatbot per la generazione di risposte.

Contenuti arricchiti di intelligenza artificiale e intelligenza artificiale applicati

Categoria Caratteristiche
Elaborazione dell'intelligenza artificiale durante l'indicizzazione L'arricchimento tramite intelligenza artificiale si riferisce all'elaborazione incorporata di immagini e linguaggio naturale in una pipeline di indicizzatore che estrae testo e informazioni dal contenuto che non può altrimenti essere indicizzato per la ricerca full-text. L'elaborazione dell'intelligenza artificiale viene ottenuta aggiungendo e combinando competenze in un set di competenze, che viene quindi collegato a un indicizzatore. L'intelligenza artificiale può essere competenze predefinite da Microsoft, come la traduzione di testi o il riconoscimento ottico dei caratteri (OCR), oppure competenze personalizzate fornite da voi.

La suddivisione integrata dei dati e la vettorializzazione suddivide i passaggi più grandi in blocchi più piccoli che possono essere vettorizzati, con vettori indirizzati a campi dedicati in un indice per la ricerca vettoriale e ibrida.
Elaborazione di intelligenza artificiale durante l'esecuzione di query I vettorizzatori vengono utilizzati per codificare le stringhe di query utente in vettori per la ricerca vettoriale. È possibile usare gli stessi modelli di incorporamento per le query usate per l'indicizzazione.

Archiviazione di contenuti arricchiti per l'analisi e l'utilizzo in scenari non di ricerca L'archivio conoscenze è un archivio permanente di contenuti arricchiti dall'intelligenza artificiale o generati dall'intelligenza artificiale, destinati a scenari non di ricerca, ad esempio carichi di lavoro di knowledge mining e data science. Un archivio conoscenze viene definito in un set di competenze, ma creato in Archiviazione di Azure come oggetti o set di righe tabulari.
Arricchimenti memorizzati nella cache La memorizzazione nella cache di arricchimenti (anteprima) si riferisce agli arricchimenti memorizzati nella cache che possono essere riutilizzati durante l'esecuzione del set di abilità. La memorizzazione nella cache è utile nei set di competenze che includono OCR e analisi delle immagini, che sono costosi da elaborare.

Recupero vettoriale e ibrido

Categoria Caratteristiche
Indicizzazione vettoriale All'interno di un indice di ricerca aggiungere campi vettoriali per supportare scenari di ricerca vettoriale . I campi vettoriali possono coesistere con campi non vettoriali nello stesso documento di interrogazione.
Query vettoriali Formulare interrogazioni vettoriali singole e multiple.
Algoritmi di ricerca vettoriale Usare HNSW (Hierarchical Navigable Small World) o K-Nearest Neighbors (KNN) completo per trovare vettori simili in un indice di ricerca.
Filtri vettoriali Applicare filtri prima o dopo l'esecuzione della query per una maggiore precisione durante il recupero delle informazioni.
Recupero di informazioni ibride Cercare concetti e parole chiave in una singola richiesta di query ibrida.

La ricerca ibrida consolida la ricerca di vettori e testo, con classificazione semantica facoltativa e ottimizzazione della pertinenza per ottenere risultati ottimali.
Suddivisione in blocchi e vettorizzazione dei dati integrati Suddivisione nativa dei dati in blocchi tramite l'abilità Suddivisione Testo. Vettorizzazione nativa tramite vectorizers e capacità di embedding come Azure OpenAI Embedding, Azure Vision multimodale e AML che possono essere usati per connettersi agli endpoint nel catalogo dei modelli Microsoft Foundry.

La vettorizzazione integrata fornisce una pipeline di indicizzazione end-to-end dai file di origine alle query.
Compressione e quantizzazione dei vettori integrati Usare la quantizzazione scalare e binaria predefinita per ridurre le dimensioni dell'indice vettoriale in memoria e su disco. È anche possibile rinunciare all'archiviazione dei vettori non necessari o assegnare tipi di dati limitati ai campi vettoriali per ridurre i requisiti di archiviazione.

Testo completo classico e altri moduli di query

Categoria Caratteristiche
Ricerca di testo in formato libero La ricerca full-text è un caso d'uso principale per la maggior parte delle app basate sulla ricerca. È possibile formulare query usando una sintassi supportata.

La sintassi di query semplice fornisce operatori logici, operatori di ricerca di frasi, operatori di suffisso, operatori di precedenza.

Sintassi completa delle query Lucene include tutte le operazioni nella sintassi semplice, con estensioni per la ricerca fuzzy, la ricerca di prossimità, il potenziamento dei termini e le espressioni regolari.
Rilevanza Simple scoring è un vantaggio fondamentale di Azure AI Search. I profili di punteggio vengono usati per modellare la pertinenza come funzione dei valori nei documenti stessi. Ad esempio, è possibile che i prodotti più recenti o i prodotti scontati vengano visualizzati più in alto nei risultati della ricerca. È anche possibile creare profili di punteggio usando tag per l'assegnazione dei punteggi personalizzata in base alle preferenze di ricerca dei clienti registrate e archiviate separatamente.

Il ranker semantico è una funzionalità premium che classifica i risultati in base alla pertinenza semantica per la query. A seconda del contenuto e dello scenario, può migliorare significativamente la pertinenza della ricerca con una configurazione o un impegno quasi minimo.
Ricerca geospaziale Le funzioni geospaziali filtrano e corrispondono alle coordinate geografiche. È possibile trovare una corrispondenza in base alla distanza o all'inclusione in una forma poligono.
Filtri e sfaccettature La navigazione a faccette è abilitata attraverso un singolo parametro di query. Azure AI Search fornisce una struttura di navigazione basata su faccette che è possibile utilizzare come logica di programmazione di un elenco di categorie, per creare filtri personalizzati (ad esempio, per filtrare gli elementi del catalogo in base all'intervallo di prezzi o al marchio).

I filtri possono essere usati per incorporare l'esplorazione in base a facet nell'interfaccia utente dell'applicazione, migliorare la formulazione delle query e filtrare in base ai criteri specificati dall'utente o dallo sviluppatore. Creare filtri usando la sintassi OData.
Esperienza utente Completamento automatico può essere abilitato per le query con completamento automatico in una barra di ricerca.

I suggerimenti di ricerca funzionano anche con input di testo parziali in una barra di ricerca, ma i risultati sono documenti effettivi nell'indice anziché termini di query.

I sinonimi associano termini equivalenti che espandono in modo implicito l'ambito di una query, senza che l'utente deve fornire i termini alternativi.

Hit highlighting applica la formattazione del testo a una parola chiave corrispondente nei risultati della ricerca. È possibile scegliere quali campi restituiscono frammenti di codice evidenziati.

Ordinamento è offerto per più campi tramite lo schema dell'indice e quindi viene alternato al momento della query con un singolo parametro di ricerca.

Paginazione e la limitazione dei risultati della ricerca sono semplici con il controllo finemente ottimizzato che Azure AI Search offre sui risultati della ricerca.

Funzionalità di sicurezza

Categoria Caratteristiche
Sicurezza di rete Le regole IP per il supporto del firewall in ingresso consentono di configurare intervalli IP su cui il servizio di ricerca accetta le richieste.

Creare un endpoint privato usando collegamento privato di Azure per forzare tutte le richieste attraverso una rete virtuale.

Perimetro di sicurezza della rete consente di aggiungere Azure AI Search a un perimetro di sicurezza di rete che include altre risorse Azure in modo da poter gestire l'accesso alla rete in modo olistico.
Crittografia dei dati Microsoft-managed encryption-at-rest è integrato nel livello di archiviazione interno ed è irrevocabile.

Chiavi di crittografia gestite dacustomer (CMK) create e gestite in Azure Key Vault possono essere usate per la crittografia supplementare di indici e mappe sinonimiche. Per i servizi creati dopo il 1° agosto 2020, la crittografia cmk si estende ai dati nei dischi temporanei, per la doppia crittografia completa del contenuto indicizzato.
Accesso in ingresso Controllo degli accessi in base al ruolo assegna ruoli a utenti e gruppi in Microsoft Entra ID per l'accesso controllato al contenuto e alle operazioni di ricerca. È anche possibile usare l'autenticazione basata su chiave se non si vogliono usare le assegnazioni di ruolo.

Il controllo di accesso a livello di documento (anteprima) filtra i risultati della ricerca che un utente non è autorizzato a visualizzare. Per diverse origini dati, se l'origine dati fornisce un modello di controllo di accesso, è possibile configurare un indice per ereditare i metadati delle autorizzazioni utente.
Sicurezza in uscita (indicizzatori) Connessioni Dati tramite endpoint privati consente a un indicizzatore di connettersi alle risorse Azure protette tramite collegamento privato di Azure.

Connessioni dati tramite identità gestite autenticano le connessioni alle risorse Azure usando un principale di sicurezza Microsoft Entra, che elimina l'archiviazione e il passaggio di chiavi API codificate in modo fisso.

L'accesso ai dati tramite un'identità attendibile significa che le stringhe di connessione alle origini dati esterne possono omettere nomi utente e password. Quando un indicizzatore si connette all'origine dati, la risorsa consente la connessione se il servizio di ricerca è stato registrato in precedenza come servizio attendibile (si applica solo a Archiviazione di Azure).

Funzionalità del portale

Categoria Caratteristiche
Strumenti per la creazione di prototipi e l'ispezione Aggiungi indice è una finestra di progettazione degli indici nel portale di Azure che è possibile usare per creare uno schema di base costituito da campi con attributi e altre impostazioni. Dopo aver salvato l'indice, è possibile popolarlo usando un SDK o l'API REST per fornire i dati.

Importazione dati è una procedura guidata che compila una pipeline di indicizzazione end-to-end, includendo un indice, un indicizzatore, un insieme di competenze e una definizione dell'origine dati, per scenari di ricerca di parole chiave e RAG. Per RAG, gestisce anche la suddivisione in blocchi di dati e la vettorializzazione. Se i dati sono presenti in Azure, questa procedura guidata consente di risparmiare tempo e impegno significativi, soprattutto per l'analisi e l'esplorazione del modello di verifica.

Esplora ricerche viene usato per testare le query e perfezionare i profili di punteggio.

Creare un'app demo viene usata per generare una pagina HTML che può essere usata per testare l'esperienza di ricerca.

Sessioni di debug è un editor visivo che consente di eseguire il debug di un set di competenze in modo interattivo. Mostra le dipendenze, l'output e le trasformazioni.
Monitoraggio e diagnostica Abilita funzionalità di monitoraggio per andare oltre le metriche visibili a colpo d'occhio sempre visibili nel portale di Azure. Le metriche sulle query al secondo, sulla latenza e sulla limitazione vengono acquisite e inserite in report nelle pagine del portale, senza necessità di configurazioni aggiuntive.

Programmabilità

Categoria Caratteristiche
REST L'API REST del servizio è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query, all'arricchimento tramite intelligenza artificiale e al recupero agentico. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

Management REST API è per la creazione e il provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per .NET Azure. Search.Documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

Microsoft.Azure. Management.Search è destinato alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per Java com.azure.search.documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

com.microsoft.azure.management.search è per la creazione e il provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per Python azure-search-documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

azure-mgmt-search è destinato alla creazione e al provisioning del servizio tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per JavaScript/TypeScript azure/search-documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

azure/arm-search è per la creazione e il provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.