Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Ricerca di intelligenza artificiale di Azure è un servizio completamente gestito e ospitato nel cloud che connette i dati all'intelligenza artificiale. Il servizio unifica l'accesso ai contenuti aziendali e web, consentendo ad agenti e LLM di usare il contesto, la cronologia delle chat e i segnali provenienti da più fonti per produrre risposte affidabili e ben fondate.
I casi d'uso comuni includono la ricerca classica e la generazione moderna di recupero aumentata (RAG) tramite il recupero agentico. In questo modo Ricerca di intelligenza artificiale di Azure è adatta sia per gli scenari aziendali che per gli utenti consumer, sia per l'aggiunta di funzionalità di ricerca a un sito Web, un'app, un agente o un chatbot.
Quando si crea un servizio di ricerca, si sbloccano le funzionalità seguenti:
- Due motori: ricerca classica per singole richieste e recupero agentico per la ricerca parallela, iterativa e assistita da LLM.
- Query full-text, vettoriali, ibride e multimodali su contenuto locale (indicizzato) e remoto.
- Arricchimento tramite intelligenza artificiale per suddividere, vettorizzare e altro per rendere ricercabile il contenuto non elaborato.
- Ottimizzazione della pertinenza per migliorare la corrispondenza delle finalità e la qualità dei risultati.
- Scalabilità, sicurezza, monitoraggio e conformità di Azure.
- Integrazioni di Azure con piattaforme dati supportate, Azure OpenAI e Microsoft Foundry.
Perché usare Azure AI Search?
Agenti di base e chatbot in dati proprietari, aziendali o Web per risposte accurate e con riconoscimento del contesto.
Accedere ai dati da Azure Blob Storage, Azure Cosmos DB, Microsoft SharePoint, Microsoft OneLake e altre origini dati supportate. Scegliere l'accesso indicizzato o remoto in base alle esigenze di aggiornamento, latenza e conformità.
Arricchire e strutturare il contenuto in fase di indicizzazione o di query con abilità che eseguono segmentazione, incorporamento e trasformazioni assistite da LLM.
Combinare la ricerca full-text con la ricerca vettoriale (ricerca ibrida) per bilanciare la precisione e il richiamo.
Eseguire una query su contenuti che includono sia testi che immagini in un'unica pipeline multimodale.
Implementare facilmente le funzionalità correlate alla ricerca: ottimizzazione della pertinenza, esplorazione in base a facet, filtri (inclusa la ricerca geospaziale), mapping dei sinonimi e completamento automatico.
Fornire sicurezza aziendale, controllo di accesso e conformità tramite Microsoft Entra, Collegamento privato di Azure, controllo di accesso a livello di documento e accesso basato sui ruoli.
Ridimensionare e operare nell'ambiente di produzione con l'affidabilità, il monitoraggio e la diagnostica di Azure (log, metriche e avvisi) e gli strumenti dell'API REST o dell'SDK per l'automazione.
Per altre informazioni sulle funzionalità specifiche, vedere Funzionalità di Ricerca di intelligenza artificiale di Azure.
Che cos'è la ricerca classica?
La ricerca classica è un modello di recupero index-first per query prevedibili e a bassa latenza. Ogni query è destinata a un singolo indice di ricerca predefinito e restituisce documenti classificati in un ciclo di richiesta-risposta. Durante il recupero non viene eseguita alcuna pianificazione, iterazione o sintesi assistita da LLM.
In questa architettura il servizio di ricerca si trova tra gli archivi dati che contengono il contenuto non elaborato e l'app client. L'app è responsabile dell'invio di richieste di query al servizio di ricerca e della gestione della risposta.
Questa architettura ha due carichi di lavoro principali:
L'indicizzazione carica il contenuto in un indice e lo rende ricercabile. Internamente, il testo in ingresso viene tokenizzato e archiviato in indici invertiti, mentre i vettori in ingresso vengono archiviati in indici vettoriali. Ricerca di intelligenza artificiale di Azure può indicizzare solo documenti JSON. È possibile usare il metodo push per caricare documenti JSON direttamente o il metodo pull (indicizzatore o flusso di lavoro dell'app per la logica) per recuperare e serializzare i dati in JSON.
Durante l'indicizzazione, è possibile usare l'arricchimento tramite intelligenza artificiale per suddividere il testo, generare vettori e applicare altre trasformazioni che creano struttura e contenuto. Ricerca di intelligenza artificiale di Azure serializza quindi l'output arricchito nei documenti JSON e li inserisce nell'indice.
Annotazioni
Questo diagramma separa i motori di indicizzazione e di query per maggiore chiarezza, ma in Ricerca di intelligenza artificiale di Azure è lo stesso componente che opera in modalità di lettura/scrittura e di sola lettura.
Che cos'è il recupero agentico?
Il recupero agentico è una pipeline con più query progettata per flussi di lavoro complessi da agente a agente. Ogni query è destinata a una base di conoscenza che rappresenta un dominio completo di conoscenza. L'agente fa riferimento alla base di conoscenze per capire su cosa basarsi , mentre la base di conoscenze gestisce il come eseguire il grounding.
Una knowledge base è costituita da una o più origini di informazioni, un LLM facoltativo per la pianificazione delle query e la sintesi delle risposte e parametri che regolano il comportamento di recupero. Ogni query viene sottoposta a pianificazione, scomposizione in sottoquery mirate, recupero parallelo da fonti di conoscenza, reranking semantico e unione dei risultati. La triplice risposta è ottimizzata per l'utilizzo da parte degli agenti.
Dietro le quinte, il recupero agentico si basa sull'architettura di ricerca classica, aggiungendo uno strato di contesto (base di conoscenza) che orchestra il recupero multi-origine. Le origini delle informazioni possono essere indicizzate o remote: le origini indicizzate usano gli stessi motori di indicizzazione e query della ricerca classica, mentre le origini remote ignorano l'indicizzazione e vengono sottoposte a query in tempo reale.
Come vengono confrontati
La ricerca classica e il recupero agentico sono modalità complementari di recupero delle informazioni. Entrambi supportano la ricerca full-text, vettoriale, ibrida e multimodale. Tuttavia, differiscono per come il contenuto viene inserito e interrogato. La tabella seguente riepiloga le differenze principali.
| Aspetto | Ricerca classica | Recupero agentic |
|---|---|---|
| Corpus di dati per la ricerca | Indice di ricerca | Fonte delle informazioni |
| Destinazione di ricerca | Un indice definito da uno schema | Una knowledge base che punta a una o più origini di informazioni |
| Piano di query | Nessun piano, solo una richiesta | Piano assistito da LLM o fornito dall'utente |
| Richiesta di query | Cercare documenti in un indice | Recupero dalle fonti di conoscenza |
| Risposta | Risultati della ricerca appianati secondo lo schema | Una risposta formulata da LLM o dati grezzi di origine, registro delle attività, riferimenti. |
| Restrizioni relative all'area geografica | NO | Yes |
| Stato | Generalmente disponibile | Anteprima pubblica |
Attività iniziali
È possibile accedere a Ricerca intelligenza artificiale di Azure tramite il portale di Azure, le API REST e gli SDK di Azure per .NET, Java, JavaScript e Python.
Il portale è utile per l'amministrazione del servizio e la gestione dei contenuti, con strumenti per la creazione di prototipi di knowledge base, origini delle informazioni, indici, indicizzatori, set di competenze e origini dati. Le API REST e gli SDK sono utili per l'automazione di produzione.
Scegliere il percorso
Prima di iniziare, usare questo elenco di controllo per prendere decisioni chiave:
Scegliere un motore di ricerca: Se non si usa un agente o chatbot, la ricerca classica può soddisfare la maggior parte delle esigenze dell'app, con costi e complessità inferiori rispetto all'integrazione LLM. Se desideri i vantaggi di una knowledge base e di più fonti di conoscenza senza un' orchestrazione LLM completa, prendi in considerazione il recupero agentico con il minimo sforzo di ragionamento.
Scegliere un'area: Se si usa il recupero agentico, scegliere un'area supportata. Per la ricerca classica, scegliere un'area che offre le funzionalità e la capacità necessarie.
Scegliere un metodo di inserimento per il contenuto associato all'indice: Se il contenuto si trova in un'origine dati supportata, usare il metodo pull per recuperare e serializzare i dati in JSON. Se non si dispone di un'origine dati supportata o se il contenuto e l'indice devono essere sincronizzati in tempo reale, il metodo push è l'unica opzione.
Sono necessari vettori? Gli LLM e gli agenti non richiedono vettori. Usarli solo se è necessaria una ricerca di somiglianza o se si dispone di contenuto che può essere omogeneizzato in vettori. Ricerca di intelligenza artificiale di Azure offre vettorizzazione integrata per questa attività.
Hai bisogno di un’ereditarietà delle autorizzazioni basata sull’utente? SharePoint remoto è progettato per questo scenario, ma è anche possibile ereditare le autorizzazioni utente associate al contenuto in Archiviazione BLOB di Azure o ADLS Gen2. Per tutti gli altri scenari, è possibile usare la soluzione alternativa del filtro di sicurezza.
Scegliere le risorse di apprendimento
Manteniamo avvii rapidi che riguardano vari scenari di ricerca end-to-end.
- Avvio rapido: recupero agentico (portale o programmatico)
- Avvio rapido: ricerca full-text (portale o programmatica)
- Avvio rapido: ricerca vettoriale (portale o programmatica)
Suggerimento
Per assistenza con soluzioni complesse o personalizzate, contattare un partner con un'esperienza approfondita in Ricerca di intelligenza artificiale di Azure.