Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этом кратком руководстве вы транскрибируете речь в текст с помощью модели Azure OpenAI Whisper. Модель Whisper может транскрибировать речь человека на многочисленных языках и переводить другие языки на английский.
Совет
Это краткое руководство занимает около 10–15 минут.
Необходимые условия
- Подписка Azure: Создайте бесплатно.
- Ресурс Azure OpenAI с моделью преобразования речи в текст, развернутой в поддерживаемом регионе . Дополнительные сведения см. в разделе Создание ресурса и развертывание модели с помощью Azure OpenAI.
- Убедитесь, что вы назначены по крайней мере роль участника службы Cognitive Services для ресурса Azure OpenAI.
- Пример звукового файла. Вы можете получить пример звука, например wikipediaOcelot.wav, из репозитория пакета SDK Azure Speech in Foundry Tools SDK на GitHub.
Установка
Получение ключа и конечной точки
Чтобы успешно вызвать Azure OpenAI, требуется endpoint и key.
| Имя переменной | Значение |
|---|---|
AZURE_OPENAI_ENDPOINT |
Конечная точка службы находится в разделе https://docs-test-001.openai.azure.com/ |
AZURE_OPENAI_API_KEY |
Это значение можно найти в разделе KEY1, либо KEY2. |
Перейдите к ресурсу на портале Azure.
Конечная точка и ключи можно найти в разделе "Управление ресурсами". Скопируйте конечную точку и ключ доступа, так как требуется для проверки подлинности вызовов API. Вы можете использовать либо KEY1, либо KEY2. Всегда наличие двух ключей позволяет безопасно поворачивать и повторно создавать ключи без нарушения работы службы.
Переменные среды
Создайте и назначьте переменные постоянной среды для ключа и конечной точки.
Важно
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Создание запроса и ответа REST API
В оболочке bash выполните следующую команду. Необходимо заменить YourDeploymentName на имя развертывания, выбранное при развертывании модели Whisper. Имя развертывания не обязательно совпадает с именем модели. При вводе имени модели возникает ошибка, если вы не выбрали имя развертывания, идентичное имени базовой модели.
curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F file="@./wikipediaOcelot.wav"
Первая строка предыдущей команды с примером конечной точки будет выглядеть следующим образом:
curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \
Важно
В производственной среде храните и получайте доступ к своим учетным данным, используя безопасный метод, например, Azure Key Vault. Дополнительные сведения см. в разделе "Безопасность учетных данных".
Проверка выходных данных
Ответ содержит text поле с полным транскрибированием звукового файла. Вы увидите выходные данные, аналогичные приведенному ниже. При возникновении ошибок:
- Убедитесь, что имя вашего развертывания точно совпадает
- Проверьте правильность пути к звуковому файлу
- Убедитесь, что ключ API и конечная точка валидны
Выход
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Необходимые условия
- Подписка Azure. Вы можете создать его бесплатно.
- Ресурс Azure OpenAI с моделью преобразования речи в текст, развернутой в поддерживаемом регионе . Дополнительные сведения см. в разделе Создание ресурса и развертывание модели с помощью Azure OpenAI.
- Python 3.8 или более поздней версии
- Azure CLI.
- Пример звукового файла. Вы можете получить пример звука, например wikipediaOcelot.wav, из репозитория пакета SDK Azure Speech in Foundry Tools SDK на GitHub.
Установка
Получение ключа и конечной точки
Чтобы успешно вызвать Azure OpenAI, требуется endpoint и key.
| Имя переменной | Значение |
|---|---|
AZURE_OPENAI_ENDPOINT |
Конечная точка службы находится в разделе https://docs-test-001.openai.azure.com/ |
AZURE_OPENAI_API_KEY |
Это значение можно найти в разделе KEY1, либо KEY2. |
Перейдите к ресурсу на портале Azure.
Конечная точка и ключи можно найти в разделе "Управление ресурсами". Скопируйте конечную точку и ключ доступа, так как они понадобятся вам для аутентификации вызовов API. Вы можете использовать либо KEY1, либо KEY2. Всегда наличие двух ключей позволяет безопасно поворачивать и повторно создавать ключи без нарушения работы службы.
Переменные среды
Создайте и назначьте переменные постоянной среды для ключа и конечной точки.
Важно
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Важно
Рекомендуется использовать проверку подлинности без пароля
Для проверки подлинности без пароля необходимо выполнить следующие действия.
-
azure-identityИспользуйте пакет (pip install azure-identity). - Назначьте
Cognitive Services Userроль вашей учетной записи пользователя. Это можно сделать на портале Azure в разделе Access control (IAM)>Добавить назначение роли. - Войдите с помощью Azure CLI, например
az login.
Создание среды Python
Создайте каталог для проекта и перейдите к нему из терминала или командной строки.
mkdir whisper-quickstart; cd whisper-quickstart
Создайте и активируйте виртуальную среду для этого проекта.
python -m venv .venv
.venv\Scripts\activate
Установите клиентская библиотека OpenAI Python с помощью:
pip install openai
Создание приложения Python
Создайте файл Python с именем quickstart.py. Затем откройте его в предпочитаемом редакторе или интегрированной среде разработки.
Замените содержимое quickstart.py следующим кодом. Измените код, чтобы добавить имя развертывания:
import os
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-02-01",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
audio_test_file = "./wikipediaOcelot.wav"
result = client.audio.transcriptions.create(
file=open(audio_test_file, "rb"),
model=deployment_id
)
print(result)
Запустите приложение с помощью python команды в файле быстрого запуска:
python quickstart.py
Важно
В производственной среде храните и получайте доступ к своим учетным данным, используя безопасный метод, например, Azure Key Vault. Дополнительные сведения см. в разделе "Безопасность учетных данных".
Проверка выходных данных
Ответ содержит text поле с полным транскрибированием звукового файла. Вы увидите выходные данные, аналогичные приведенному ниже. При возникновении ошибок:
- Убедитесь, что имя вашего развертывания точно совпадает
- Проверьте правильность пути к звуковому файлу
- Убедитесь, что ключ API и конечная точка валидны
Выход
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Необходимые условия
- Подписка Azure. Вы можете создать его бесплатно.
- Ресурс Azure OpenAI с моделью преобразования речи в текст, развернутой в поддерживаемом регионе . Дополнительные сведения см. в разделе Создание ресурса и развертывание модели с помощью Azure OpenAI.
- .NET пакет SDK 8.0
предварительные требования Microsoft Entra ID
Для рекомендуемой проверки подлинности без ключа с помощью Microsoft Entra ID необходимо:
- Установите Azure CLI, который используется для безключевой аутентификации в Microsoft Entra ID.
- Назначьте
Cognitive Services Userроль вашей учетной записи пользователя. Роли можно назначить на портале Azure в разделе Access control (IAM)>Add role assignment.
Установка
Создайте новую папку
whisper-quickstartи перейдите в папку быстрого запуска с помощью следующей команды:mkdir whisper-quickstart && cd whisper-quickstartСоздайте консольное приложение со следующей командой:
dotnet new consoleУстановите клиентскую библиотеку OpenAI .NET с помощью команды dotnet add package:
dotnet add package Azure.AI.OpenAIДля рекомендуемой безключевой аутентификации с Microsoft Entra ID установите пакет Azure.Identity с помощью:
dotnet add package Azure.IdentityДля рекомендуемой безключевой аутентификации с помощью Microsoft Entra ID выполните вход в Azure с помощью следующей команды:
az login
Получение сведений о ресурсе
Чтобы проверить подлинность приложения с помощью ресурса OpenAI Azure, необходимо получить следующие сведения:
| Имя переменной | Значение |
|---|---|
AZURE_OPENAI_ENDPOINT |
Это значение можно найти в разделе Keys и Endpoint при изучении ресурса на портале Azure. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Это значение будет соответствовать пользовательскому названию, которое вы выбрали при развертывании модели. Это значение можно найти в разделе Resource Management>Model Deployments на портале Azure. |
Дополнительные сведения о бессерверной проверке подлинности и настройке переменных среды.
Запустите быстрый старт
Пример кода в этом кратком руководстве использует Microsoft Entra ID для рекомендуемой аутентификации без использования ключей. Если вы предпочитаете использовать ключ API, можно заменить DefaultAzureCredential объект AzureKeyCredential объектом.
AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential());
Примечание
Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.
Чтобы запустить инструкцию по быстрому старту, выполните следующие действия.
Замените содержимое
Program.csследующим кодом и обновите значения заполнителей собственными.using Azure; using Azure.AI.OpenAI; using Azure.Identity; // Required for Passwordless auth string deploymentName = "whisper"; string endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT") ?? "https://<your-resource-name>.openai.azure.com/"; string key = Environment.GetEnvironmentVariable("AZURE_OPENAI_API_KEY") ?? "<your-key>"; // Use the recommended keyless credential instead of the AzureKeyCredential credential. AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); //AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new AzureKeyCredential(key)); var audioFilePath = "<audio file path>" var audioClient = openAIClient.GetAudioClient(deploymentName); var result = await audioClient.TranscribeAudioAsync(audioFilePath); Console.WriteLine("Transcribed text:"); foreach (var item in result.Value.Text) { Console.Write(item); }Запустите приложение с помощью команды
dotnet runили кнопки запуска в верхней части Visual Studio:dotnet run
Проверка выходных данных
Транскрибирование возвращает ответ со свойством Text , содержащим полное транскрибирование звукового файла. Вы увидите выходные данные, аналогичные приведенному ниже. При возникновении ошибок:
- Убедитесь, что имя вашего развертывания точно совпадает
- Проверьте правильность пути к звуковому файлу
- Убедитесь, что ключ API и конечная точка валидны
Выход
Если вы используете пример аудиофайла, в консоли отобразится следующий текст:
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States,
Mexico, and Central and South America. This medium-sized cat is characterized by solid
black spots and streaks on its coat, round ears...
Исходный код | Пакет (npm) | Примеры
Необходимые условия
- Подписка Azure — Создайте бесплатно
- Node.js LTS версии
- Azure CLI используется для проверки подлинности без пароля в локальной среде разработки, создайте необходимый контекст, выполнив вход с помощью Azure CLI.
- Ресурс Azure OpenAI с моделью преобразования речи в текст, развернутой в поддерживаемом регионе . Дополнительные сведения см. в разделе Создание ресурса и развертывание модели с помощью Azure OpenAI.
предварительные требования Microsoft Entra ID
Для рекомендуемой проверки подлинности без ключа с помощью Microsoft Entra ID необходимо:
- Установите Azure CLI, который используется для безключевой аутентификации в Microsoft Entra ID.
- Назначьте
Cognitive Services Userроль вашей учетной записи пользователя. Роли можно назначить на портале Azure в разделе Access control (IAM)>Add role assignment.
Установка
Создайте новую папку
synthesis-quickstartи перейдите в папку быстрого запуска с помощью следующей команды:mkdir synthesis-quickstart && cd synthesis-quickstartСоздайте
package.jsonс помощью следующей команды:npm init -yУстановите клиентскую библиотеку OpenAI для JavaScript с помощью:
npm install openaiДля рекомендуемой проверки подлинности без пароля:
npm install @azure/identity
Получение сведений о ресурсе
Чтобы проверить подлинность приложения с помощью ресурса OpenAI Azure, необходимо получить следующие сведения:
| Имя переменной | Значение |
|---|---|
AZURE_OPENAI_ENDPOINT |
Это значение можно найти в разделе Keys и Endpoint при изучении ресурса на портале Azure. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Это значение будет соответствовать пользовательскому названию, которое вы выбрали при развертывании модели. Это значение можно найти в разделе Resource Management>Model Deployments на портале Azure. |
Дополнительные сведения о бессерверной проверке подлинности и настройке переменных среды.
Осторожно
Чтобы использовать рекомендуемую проверку подлинности без ключа с пакетом SDK, убедитесь, что AZURE_OPENAI_API_KEY переменная среды не задана.
Создание примера приложения
index.jsСоздайте файл со следующим кодом:const { createReadStream } = require("fs"); const { AzureOpenAI } = require("openai"); const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity"); // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint"; // Required Azure OpenAI deployment name and API version const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview"; const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://ai.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient() { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });Войдите в Azure с помощью следующей команды:
az loginЗапустите файл JavaScript.
node index.js
Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.
Выход
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Исходный код | Пакет (npm) | Примеры
Необходимые условия
- Подписка Azure — Создайте бесплатно
- Node.js LTS версии
- Typescript
- Azure CLI используется для проверки подлинности без пароля в локальной среде разработки, создайте необходимый контекст, выполнив вход с помощью Azure CLI.
- Ресурс Azure OpenAI с моделью преобразования речи в текст, развернутой в поддерживаемом регионе . Дополнительные сведения см. в разделе Создание ресурса и развертывание модели с помощью Azure OpenAI.
предварительные требования Microsoft Entra ID
Для рекомендуемой проверки подлинности без ключа с помощью Microsoft Entra ID необходимо:
- Установите Azure CLI, который используется для безключевой аутентификации в Microsoft Entra ID.
- Назначьте
Cognitive Services Userроль вашей учетной записи пользователя. Роли можно назначить на портале Azure в разделе Access control (IAM)>Add role assignment.
Настройка
Создайте новую папку
whisper-quickstartи перейдите в папку быстрого запуска с помощью следующей команды:mkdir whisper-quickstart && cd whisper-quickstartСоздайте
package.jsonс помощью следующей команды:npm init -yОбновите
package.jsonна ECMAScript с помощью следующей команды:npm pkg set type=moduleУстановите клиентскую библиотеку OpenAI для JavaScript с помощью:
npm install openaiДля рекомендуемой проверки подлинности без пароля:
npm install @azure/identity
Получение сведений о ресурсе
Чтобы проверить подлинность приложения с помощью ресурса OpenAI Azure, необходимо получить следующие сведения:
| Имя переменной | Значение |
|---|---|
AZURE_OPENAI_ENDPOINT |
Это значение можно найти в разделе Keys и Endpoint при изучении ресурса на портале Azure. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Это значение будет соответствовать пользовательскому названию, которое вы выбрали при развертывании модели. Это значение можно найти в разделе Resource Management>Model Deployments на портале Azure. |
Дополнительные сведения о бессерверной проверке подлинности и настройке переменных среды.
Осторожно
Чтобы использовать рекомендуемую проверку подлинности без ключа с пакетом SDK, убедитесь, что AZURE_OPENAI_API_KEY переменная среды не задана.
Создание примера приложения
index.tsСоздайте файл со следующим кодом:import { createReadStream } from "fs"; import { AzureOpenAI } from "openai"; import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity"; // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint"; // Required Azure OpenAI deployment name and API version const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview"; const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://ai.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient(): AzureOpenAI { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });tsconfig.jsonСоздайте файл для транспиля кода TypeScript и скопируйте следующий код для ECMAScript.{ "compilerOptions": { "module": "NodeNext", "target": "ES2022", // Supports top-level await "moduleResolution": "NodeNext", "skipLibCheck": true, // Avoid type errors from node_modules "strict": true // Enable strict type-checking options }, "include": ["*.ts"] }Транспилировать из TypeScript в JavaScript.
tscВойдите в Azure с помощью следующей команды:
az loginЗапустите код с помощью следующей команды:
node index.js
Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.
Важно
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
Выход
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Необходимые условия
- Подписка Azure — Создайте бесплатно
- Вы можете использовать либо последнюю версию, PowerShell 7, либо Windows PowerShell 5.1.
- Ресурс Azure OpenAI с моделью преобразования речи в текст, развернутой в поддерживаемом регионе . Дополнительные сведения см. в разделе Создание ресурса и развертывание модели с помощью Azure OpenAI.
Настройка
Получение ключа и конечной точки
Чтобы успешно вызвать Azure OpenAI, требуется endpoint и key.
| Имя переменной | Значение |
|---|---|
AZURE_OPENAI_ENDPOINT |
Конечная точка службы находится в разделе https://docs-test-001.openai.azure.com/ |
AZURE_OPENAI_API_KEY |
Это значение можно найти в разделе KEY1, либо KEY2. |
Перейдите к ресурсу на портале Azure.
Конечная точка и ключи можно найти в разделе "Управление ресурсами". Скопируйте конечную точку и ключ доступа, так как они понадобятся вам для аутентификации вызовов API. Вы можете использовать либо KEY1, либо KEY2. Всегда наличие двух ключей позволяет безопасно поворачивать и повторно создавать ключи без нарушения работы службы.
Переменные среды
Создайте и назначьте переменные постоянной среды для ключа и конечной точки.
Важно
Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.
Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Создание приложения PowerShell
Выполните следующую команду. Необходимо заменить YourDeploymentName на имя развертывания, выбранное при развертывании модели Whisper. Имя развертывания не обязательно совпадает с именем модели. При вводе имени модели возникает ошибка, если вы не выбрали имя развертывания, идентичное имени базовой модели.
# Azure OpenAI metadata variables
$openai = @{
api_key = $Env:AZURE_OPENAI_API_KEY
api_base = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
api_version = '2024-02-01' # this may change in the future
name = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}
# Header for authentication
$headers = [ordered]@{
'api-key' = $openai.api_key
}
$form = @{ file = get-item -path './wikipediaOcelot.wav' }
# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"
$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text
Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.
Важно
Для производственной среды используйте хранение и доступ к учетным данным посредством безопасного метода, например PowerShell Secret Management через Azure Key Vault. Дополнительные сведения см. в разделе "Безопасность учетных данных".
Выход
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.
Примечание
Сведения о других звуковых моделях, которые можно использовать с Azure OpenAI, см. в разделе Audio models.
Совет
Ограничение размера файла для модели Whisper составляет 25 МБ. Если вам нужно транскрибировать файл размером более 25 МБ, вы можете использовать API пакетного транскрибирования в Azure Speech в Foundry Tools.
Устранение неполадок
Ошибки проверки подлинности
Если вы получаете 401 несанкционированных ошибок, проверьте следующее:
- Ключ API правильно задан в переменных среды
- Ресурс OpenAI Azure активен
- У вашей учетной записи есть роль участника в Cognitive Services
Ошибки формата файла
Модель Whisper поддерживает форматы mp3, mp4, mpeg, mpga, m4a, wav и webm. Другие форматы возвращают ошибку.
Ограничение размера файла
Звуковые файлы должны составлять 25 МБ или меньше. Для больших файлов используйте API Azure api пакетной расшифровки речи.
Развертывание не найдено
Убедитесь, что имя развертывания совпадает с тем, что вы создали в Azure OpenAI Studio. Имена развертываний чувствительны к регистру.
Очистка ресурсов
Если вы хотите очистить и удалить ресурс Azure OpenAI, можно удалить его. Перед удалением ресурса необходимо сначала удалить все развернутые модели.
Дальнейшие действия
- Чтобы узнать, как преобразовать звуковые данные в текст в пакетах, см. Создание пакетной транскрипции.
- Дополнительные примеры см. в репозитории Azure OpenAI Samples GitHub.