Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Per iniziare, sono sufficienti alcuni file audio e le trascrizioni associate. Verificare se la voce personalizzata supporta la lingua e l'area geografica.
Avviare l'ottimizzazione
Per ottimizzare un modello voce professionale nel nuovo portale di Microsoft Foundry, seguire questa procedura:
-
Accedere a Microsoft Foundry. Assicurarsi che l'interruttore New Foundry sia attivato. Questi passaggi fanno riferimento a Foundry (nuovo).These steps refer to Foundry (new).
Nel menu in alto a destra selezionare Compila.
Nel riquadro sinistro selezionare Modelli.
Nella scheda AI Services, seleziona Azure Speech - Sintesi vocale.
In alto a destra nell'area di prova della sintesi vocale, seleziona Ottimizza per aprire il pannello Ottimizza un modello.
Nel riquadro Dettagli di base compilare queste impostazioni:
- Select model: verificare che sia selezionata Azure Speech - Sintesi vocale. Questo valore viene precompilato in base all'area di prova da cui si è acceduto alla procedura guidata.
- Tipo: verificare che sia selezionata l'opzione Voce professionale .
- Genere della voce: Seleziona il genere della voce.
- Lingua dei dati di addestramento: Seleziona la lingua dei dati di addestramento.
- Nome voce: immettere un nome per il modello vocale.
- Descrizione: immettere facoltativamente una descrizione.
Seleziona Avanti.
Mantieni aperto il riquadro Ottimizzare un modello e continua con Aggiungere il consenso del doppiatore per registrare il doppiatore.
Continuare l'ottimizzazione
Passare alla documentazione di Azure Speech in Foundry Tools per informazioni su come continuare a ottimizzare il modello vocale professionale:
- Aggiungere il consenso del talento vocale
- Aggiungere set di dati di training
- Addestra il tuo modello vocale
- Distribuire il modello di voce neurale professionale come endpoint
Visualizzare modelli ottimizzati
Dopo l'ottimizzazione, è possibile accedere ai modelli vocali e alle distribuzioni personalizzati dalla pagina Ottimizzazione .
- Accedere a Microsoft Foundry. Assicurarsi che l'interruttore New Foundry sia attivato. Questi passaggi fanno riferimento a Foundry (nuovo).These steps refer to Foundry (new).
- Nel menu in alto a destra selezionare Compila.
- Nel riquadro sinistro selezionare Ottimizza.
- Selezionare la scheda Servizi di intelligenza artificiale per visualizzare lo stato delle attività di ottimizzazione e dei modelli creati. Selezionare un nome di modello per aprire la pagina dei dettagli del modello, in cui è possibile visualizzare lo stato del training, eseguire i test e gestire le distribuzioni.
Passo successivo
Il contenuto per la voce personalizzata , ad esempio dati, modelli, test ed endpoint, è organizzato in progetti in Speech Studio. Ogni progetto è legato a un paese/area, a una lingua e al genere della voce che si vuole creare. Ad esempio, è possibile creare un progetto per una voce femminile per i chatbot del call center che utilizzano l'inglese negli Stati Uniti.
Per iniziare, sono sufficienti alcuni file audio e le trascrizioni associate. Verificare se la voce personalizzata supporta la lingua e l'area geografica.
Avviare l'ottimizzazione
Per ottimizzare un modello voce professionale, seguire questa procedura:
Accedere a Speech Studio.
Selezionare la sottoscrizione e la risorsa Voce da usare.
Importante
Il training vocale personalizzato è attualmente disponibile solo in alcune aree. Dopo aver eseguito il training del modello vocale in un'area supportata, è possibile copiarlo in una risorsa Voce in un'altra area in base alle esigenze. Per altre informazioni, vedere note a piè di pagina nella tabella delle aree.
Selezionare Voce personalizzata>Creare un progetto.
Selezionare Sintesi vocale neurale Pro>Avanti.
Seguire le istruzioni fornite dalla procedura guidata per creare il progetto.
Selezionare il nuovo progetto in base al nome o selezionare Vai al progetto. Queste voci di menu vengono visualizzate nel pannello sinistro: Configura talento vocale, Prepara dati di training, Esegui il training del modello e Distribuisci modello.
Passaggi successivi
I progetti voce professionale contengono l'istruzione di consenso per i talenti vocali, i set di dati di training, i modelli vocali e gli endpoint.
Ogni progetto è legato a un paese/area, a una lingua e al genere della voce che si vuole creare. Ad esempio, è possibile creare un progetto per una voce femminile per i chatbot del call center che utilizzano l'inglese negli Stati Uniti.
Creare un progetto
Per creare un progetto voce professionale, usare l'operazione Projects_Create dell'API vocale personalizzata. Creare il corpo della richiesta in base alle istruzioni seguenti:
- Impostare la proprietà
kindobbligatoria suProfessionalVoice. Il tipo non può essere modificato in un secondo momento. - Facoltativamente, impostare la proprietà
locale. Il luogo in cui ha sede la società di questo progetto. Il codice locale segue BCP-47. Qui puoi trovare l'elenco delle impostazioni locali di text-to-speech. Se si specificano le impostazioni locali, il progetto è utilizzabile in Speech Studio. - Facoltativamente, impostare la proprietà
descriptionper la descrizione del progetto. La descrizione del progetto può essere modificata in un secondo momento.
Effettuare una richiesta HTTP PUT usando l'URI come illustrato nell'esempio di Projects_Create seguente.
- Sostituire
YourResourceKeycon la chiave della risorsa Voce. - Sostituisci
YourResourceNamecon il nome della risorsa Speech. - Sostituire
ProjectIdcon un ID progetto di propria scelta. L'ID con distinzione tra maiuscole e minuscole deve essere univoco all'interno della risorsa Voce. L'ID verrà usato nell'URI del progetto e non potrà essere modificato in un secondo momento.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Project description",
"kind": "ProfessionalVoice",
"locale": "en-US"
} ' "https://YourResourceName.cognitiveservices.azure.com/customvoice/projects/ProjectId?api-version=2026-01-01"
Si dovrebbe ricevere un corpo della risposta nel formato seguente:
{
"id": "ProjectId",
"description": "Project description",
"kind": "ProfessionalVoice",
"locale": "en-US",
"createdDateTime": "2023-04-01T05:30:00.000Z"
}
Il progetto id viene usato nelle richieste API successive per aggiungere il consenso ai talenti vocali e creare un set di training.