Быстрый старт: Преобразование речи в текст с помощью модели Azure OpenAI Whisper

В этом кратком руководстве вы транскрибируете речь в текст с помощью модели Azure OpenAI Whisper. Модель Whisper может транскрибировать речь человека на многочисленных языках и переводить другие языки на английский.

Совет

Это краткое руководство занимает около 10–15 минут.

Необходимые условия

Установка

Получение ключа и конечной точки

Чтобы успешно вызвать Azure OpenAI, требуется endpoint и key.

Имя переменной Значение
AZURE_OPENAI_ENDPOINT Конечная точка службы находится в разделе Keys & Endpoint при проверке вашего ресурса на портале Azure. Кроме того, можно найти конечную точку с помощью страницы Deployments на портале Foundry Microsoft. Пример конечной точки: https://docs-test-001.openai.azure.com/
AZURE_OPENAI_API_KEY Это значение можно найти в разделе Ключи и конечные точки, проверяя ваш ресурс на портале Azure. Вы можете использовать либо KEY1, либо KEY2.

Перейдите к ресурсу на портале Azure. Конечная точка и ключи можно найти в разделе "Управление ресурсами". Скопируйте конечную точку и ключ доступа, так как требуется для проверки подлинности вызовов API. Вы можете использовать либо KEY1, либо KEY2. Всегда наличие двух ключей позволяет безопасно поворачивать и повторно создавать ключи без нарушения работы службы.

Скриншот пользовательского интерфейса обзора для ресурса Azure OpenAI на портале Azure с окружением расположения конечной точки и ключей доступа красным цветом.

Переменные среды

Создайте и назначьте переменные постоянной среды для ключа и конечной точки.

Важно

Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.

Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

Создание запроса и ответа REST API

В оболочке bash выполните следующую команду. Необходимо заменить YourDeploymentName на имя развертывания, выбранное при развертывании модели Whisper. Имя развертывания не обязательно совпадает с именем модели. При вводе имени модели возникает ошибка, если вы не выбрали имя развертывания, идентичное имени базовой модели.

curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
 -H "api-key: $AZURE_OPENAI_API_KEY" \
 -H "Content-Type: multipart/form-data" \
 -F file="@./wikipediaOcelot.wav"

Первая строка предыдущей команды с примером конечной точки будет выглядеть следующим образом:

curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \

Важно

В производственной среде храните и получайте доступ к своим учетным данным, используя безопасный метод, например, Azure Key Vault. Дополнительные сведения см. в разделе "Безопасность учетных данных".

Проверка выходных данных

Ответ содержит text поле с полным транскрибированием звукового файла. Вы увидите выходные данные, аналогичные приведенному ниже. При возникновении ошибок:

  • Убедитесь, что имя вашего развертывания точно совпадает
  • Проверьте правильность пути к звуковому файлу
  • Убедитесь, что ключ API и конечная точка валидны

Выход

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Необходимые условия

Установка

Получение ключа и конечной точки

Чтобы успешно вызвать Azure OpenAI, требуется endpoint и key.

Имя переменной Значение
AZURE_OPENAI_ENDPOINT Конечная точка службы находится в разделе Keys & Endpoint при проверке вашего ресурса на портале Azure. Кроме того, можно найти конечную точку с помощью страницы Deployments на портале Foundry Microsoft. Пример конечной точки: https://docs-test-001.openai.azure.com/
AZURE_OPENAI_API_KEY Это значение можно найти в разделе Ключи и конечные точки, проверяя ваш ресурс на портале Azure. Вы можете использовать либо KEY1, либо KEY2.

Перейдите к ресурсу на портале Azure. Конечная точка и ключи можно найти в разделе "Управление ресурсами". Скопируйте конечную точку и ключ доступа, так как они понадобятся вам для аутентификации вызовов API. Вы можете использовать либо KEY1, либо KEY2. Всегда наличие двух ключей позволяет безопасно поворачивать и повторно создавать ключи без нарушения работы службы.

Скриншот пользовательского интерфейса обзора для ресурса Azure OpenAI на портале Azure с окружением расположения конечной точки и ключей доступа красным цветом.

Переменные среды

Создайте и назначьте переменные постоянной среды для ключа и конечной точки.

Важно

Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.

Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"

Важно

Рекомендуется использовать проверку подлинности без пароля

Для проверки подлинности без пароля необходимо выполнить следующие действия.

  1. azure-identity Используйте пакет (pip install azure-identity).
  2. Назначьте Cognitive Services User роль вашей учетной записи пользователя. Это можно сделать на портале Azure в разделе Access control (IAM)>Добавить назначение роли.
  3. Войдите с помощью Azure CLI, например az login.

Создание среды Python

Создайте каталог для проекта и перейдите к нему из терминала или командной строки.

mkdir whisper-quickstart; cd whisper-quickstart

Создайте и активируйте виртуальную среду для этого проекта.

python -m venv .venv
.venv\Scripts\activate

Установите клиентская библиотека OpenAI Python с помощью:

pip install openai

Создание приложения Python

  1. Создайте файл Python с именем quickstart.py. Затем откройте его в предпочитаемом редакторе или интегрированной среде разработки.

  2. Замените содержимое quickstart.py следующим кодом. Измените код, чтобы добавить имя развертывания:

    import os
    from openai import AzureOpenAI
        
    client = AzureOpenAI(
        api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
        api_version="2024-02-01",
        azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
    )
    
    deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
    audio_test_file = "./wikipediaOcelot.wav"
    
    result = client.audio.transcriptions.create(
        file=open(audio_test_file, "rb"),            
        model=deployment_id
    )
    
    print(result)

Запустите приложение с помощью python команды в файле быстрого запуска:

python quickstart.py

Важно

В производственной среде храните и получайте доступ к своим учетным данным, используя безопасный метод, например, Azure Key Vault. Дополнительные сведения см. в разделе "Безопасность учетных данных".

Проверка выходных данных

Ответ содержит text поле с полным транскрибированием звукового файла. Вы увидите выходные данные, аналогичные приведенному ниже. При возникновении ошибок:

  • Убедитесь, что имя вашего развертывания точно совпадает
  • Проверьте правильность пути к звуковому файлу
  • Убедитесь, что ключ API и конечная точка валидны

Выход

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Необходимые условия

предварительные требования Microsoft Entra ID

Для рекомендуемой проверки подлинности без ключа с помощью Microsoft Entra ID необходимо:

  • Установите Azure CLI, который используется для безключевой аутентификации в Microsoft Entra ID.
  • Назначьте Cognitive Services User роль вашей учетной записи пользователя. Роли можно назначить на портале Azure в разделе Access control (IAM)>Add role assignment.

Установка

  1. Создайте новую папку whisper-quickstart и перейдите в папку быстрого запуска с помощью следующей команды:

    mkdir whisper-quickstart && cd whisper-quickstart
    
  2. Создайте консольное приложение со следующей командой:

    dotnet new console
    
  3. Установите клиентскую библиотеку OpenAI .NET с помощью команды dotnet add package:

    dotnet add package Azure.AI.OpenAI
    
  4. Для рекомендуемой безключевой аутентификации с Microsoft Entra ID установите пакет Azure.Identity с помощью:

    dotnet add package Azure.Identity
    
  5. Для рекомендуемой безключевой аутентификации с помощью Microsoft Entra ID выполните вход в Azure с помощью следующей команды:

    az login
    

Получение сведений о ресурсе

Чтобы проверить подлинность приложения с помощью ресурса OpenAI Azure, необходимо получить следующие сведения:

Имя переменной Значение
AZURE_OPENAI_ENDPOINT Это значение можно найти в разделе Keys и Endpoint при изучении ресурса на портале Azure.
AZURE_OPENAI_DEPLOYMENT_NAME Это значение будет соответствовать пользовательскому названию, которое вы выбрали при развертывании модели. Это значение можно найти в разделе Resource Management>Model Deployments на портале Azure.

Дополнительные сведения о бессерверной проверке подлинности и настройке переменных среды.

Запустите быстрый старт

Пример кода в этом кратком руководстве использует Microsoft Entra ID для рекомендуемой аутентификации без использования ключей. Если вы предпочитаете использовать ключ API, можно заменить DefaultAzureCredential объект AzureKeyCredential объектом.

AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); 

Примечание

Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.

Чтобы запустить инструкцию по быстрому старту, выполните следующие действия.

  1. Замените содержимое Program.cs следующим кодом и обновите значения заполнителей собственными.

    using Azure;
    using Azure.AI.OpenAI;
    using Azure.Identity; // Required for Passwordless auth
    
    
    string deploymentName = "whisper";
    
    string endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT") ?? "https://<your-resource-name>.openai.azure.com/";
    string key = Environment.GetEnvironmentVariable("AZURE_OPENAI_API_KEY") ?? "<your-key>";
    
    // Use the recommended keyless credential instead of the AzureKeyCredential credential.
    AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); 
    //AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new AzureKeyCredential(key));
    
    var audioFilePath = "<audio file path>"
    
    var audioClient = openAIClient.GetAudioClient(deploymentName);
    
    var result = await audioClient.TranscribeAudioAsync(audioFilePath);
    
    Console.WriteLine("Transcribed text:");
    foreach (var item in result.Value.Text)
    {
        Console.Write(item);
    }
    
  2. Запустите приложение с помощью команды dotnet run или кнопки запуска в верхней части Visual Studio:

    dotnet run
    

Проверка выходных данных

Транскрибирование возвращает ответ со свойством Text , содержащим полное транскрибирование звукового файла. Вы увидите выходные данные, аналогичные приведенному ниже. При возникновении ошибок:

  • Убедитесь, что имя вашего развертывания точно совпадает
  • Проверьте правильность пути к звуковому файлу
  • Убедитесь, что ключ API и конечная точка валидны

Выход

Если вы используете пример аудиофайла, в консоли отобразится следующий текст:

The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, 
Mexico, and Central and South America. This medium-sized cat is characterized by solid 
black spots and streaks on its coat, round ears...

Исходный код | Пакет (npm) | Примеры

Необходимые условия

предварительные требования Microsoft Entra ID

Для рекомендуемой проверки подлинности без ключа с помощью Microsoft Entra ID необходимо:

  • Установите Azure CLI, который используется для безключевой аутентификации в Microsoft Entra ID.
  • Назначьте Cognitive Services User роль вашей учетной записи пользователя. Роли можно назначить на портале Azure в разделе Access control (IAM)>Add role assignment.

Установка

  1. Создайте новую папку synthesis-quickstart и перейдите в папку быстрого запуска с помощью следующей команды:

    mkdir synthesis-quickstart && cd synthesis-quickstart
    
  2. Создайте package.json с помощью следующей команды:

    npm init -y
    
  3. Установите клиентскую библиотеку OpenAI для JavaScript с помощью:

    npm install openai
    
  4. Для рекомендуемой проверки подлинности без пароля:

    npm install @azure/identity
    

Получение сведений о ресурсе

Чтобы проверить подлинность приложения с помощью ресурса OpenAI Azure, необходимо получить следующие сведения:

Имя переменной Значение
AZURE_OPENAI_ENDPOINT Это значение можно найти в разделе Keys и Endpoint при изучении ресурса на портале Azure.
AZURE_OPENAI_DEPLOYMENT_NAME Это значение будет соответствовать пользовательскому названию, которое вы выбрали при развертывании модели. Это значение можно найти в разделе Resource Management>Model Deployments на портале Azure.

Дополнительные сведения о бессерверной проверке подлинности и настройке переменных среды.

Осторожно

Чтобы использовать рекомендуемую проверку подлинности без ключа с пакетом SDK, убедитесь, что AZURE_OPENAI_API_KEY переменная среды не задана.

Создание примера приложения

  1. index.js Создайте файл со следующим кодом:

    const { createReadStream } = require("fs");
    const { AzureOpenAI } = require("openai");
    const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity");
    
    // You will need to set these environment variables or edit the following values
    const audioFilePath = "<audio file path>";
    const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint";
    
    // Required Azure OpenAI deployment name and API version
    const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview";
    const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper";
    
    // keyless authentication    
    const credential = new DefaultAzureCredential();
    const scope = "https://ai.azure.com/.default";
    const azureADTokenProvider = getBearerTokenProvider(credential, scope);
    
    function getClient() {
      return new AzureOpenAI({
        endpoint,
        azureADTokenProvider,
        apiVersion,
        deployment: deploymentName,
      });
    }
    
    export async function main() {
      console.log("== Transcribe Audio Sample ==");
    
      const client = getClient();
      const result = await client.audio.transcriptions.create({
        model: "",
        file: createReadStream(audioFilePath),
      });
    
      console.log(`Transcription: ${result.text}`);
    }
    
    main().catch((err) => {
      console.error("The sample encountered an error:", err);
    });
    
  2. Войдите в Azure с помощью следующей команды:

    az login
    
  3. Запустите файл JavaScript.

    node index.js
    

Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.

Выход

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Исходный код | Пакет (npm) | Примеры

Необходимые условия

предварительные требования Microsoft Entra ID

Для рекомендуемой проверки подлинности без ключа с помощью Microsoft Entra ID необходимо:

  • Установите Azure CLI, который используется для безключевой аутентификации в Microsoft Entra ID.
  • Назначьте Cognitive Services User роль вашей учетной записи пользователя. Роли можно назначить на портале Azure в разделе Access control (IAM)>Add role assignment.

Настройка

  1. Создайте новую папку whisper-quickstart и перейдите в папку быстрого запуска с помощью следующей команды:

    mkdir whisper-quickstart && cd whisper-quickstart
    
  2. Создайте package.json с помощью следующей команды:

    npm init -y
    
  3. Обновите package.json на ECMAScript с помощью следующей команды:

    npm pkg set type=module
    
  4. Установите клиентскую библиотеку OpenAI для JavaScript с помощью:

    npm install openai
    
  5. Для рекомендуемой проверки подлинности без пароля:

    npm install @azure/identity
    

Получение сведений о ресурсе

Чтобы проверить подлинность приложения с помощью ресурса OpenAI Azure, необходимо получить следующие сведения:

Имя переменной Значение
AZURE_OPENAI_ENDPOINT Это значение можно найти в разделе Keys и Endpoint при изучении ресурса на портале Azure.
AZURE_OPENAI_DEPLOYMENT_NAME Это значение будет соответствовать пользовательскому названию, которое вы выбрали при развертывании модели. Это значение можно найти в разделе Resource Management>Model Deployments на портале Azure.

Дополнительные сведения о бессерверной проверке подлинности и настройке переменных среды.

Осторожно

Чтобы использовать рекомендуемую проверку подлинности без ключа с пакетом SDK, убедитесь, что AZURE_OPENAI_API_KEY переменная среды не задана.

Создание примера приложения

  1. index.ts Создайте файл со следующим кодом:

    import { createReadStream } from "fs";
    import { AzureOpenAI } from "openai";
    import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
    
    // You will need to set these environment variables or edit the following values
    const audioFilePath = "<audio file path>";
    const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint";
    
    // Required Azure OpenAI deployment name and API version
    const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview";
    const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper";
    
    // keyless authentication    
    const credential = new DefaultAzureCredential();
    const scope = "https://ai.azure.com/.default";
    const azureADTokenProvider = getBearerTokenProvider(credential, scope);
    
    function getClient(): AzureOpenAI {
      return new AzureOpenAI({
        endpoint,
        azureADTokenProvider,
        apiVersion,
        deployment: deploymentName,
      });
    }
    
    export async function main() {
      console.log("== Transcribe Audio Sample ==");
    
      const client = getClient();
      const result = await client.audio.transcriptions.create({
        model: "",
        file: createReadStream(audioFilePath),
      });
    
      console.log(`Transcription: ${result.text}`);
    }
    
    main().catch((err) => {
      console.error("The sample encountered an error:", err);
    });
    
  2. tsconfig.json Создайте файл для транспиля кода TypeScript и скопируйте следующий код для ECMAScript.

    {
        "compilerOptions": {
          "module": "NodeNext",
          "target": "ES2022", // Supports top-level await
          "moduleResolution": "NodeNext",
          "skipLibCheck": true, // Avoid type errors from node_modules
          "strict": true // Enable strict type-checking options
        },
        "include": ["*.ts"]
    }
    
  3. Транспилировать из TypeScript в JavaScript.

    tsc
    
  4. Войдите в Azure с помощью следующей команды:

    az login
    
  5. Запустите код с помощью следующей команды:

    node index.js
    

Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.

Важно

Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.

Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.

Выход

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Необходимые условия

Настройка

Получение ключа и конечной точки

Чтобы успешно вызвать Azure OpenAI, требуется endpoint и key.

Имя переменной Значение
AZURE_OPENAI_ENDPOINT Конечная точка службы находится в разделе Keys & Endpoint при проверке вашего ресурса на портале Azure. Кроме того, можно найти конечную точку с помощью страницы Deployments на портале Foundry Microsoft. Пример конечной точки: https://docs-test-001.openai.azure.com/
AZURE_OPENAI_API_KEY Это значение можно найти в разделе Ключи и конечные точки, проверяя ваш ресурс на портале Azure. Вы можете использовать либо KEY1, либо KEY2.

Перейдите к ресурсу на портале Azure. Конечная точка и ключи можно найти в разделе "Управление ресурсами". Скопируйте конечную точку и ключ доступа, так как они понадобятся вам для аутентификации вызовов API. Вы можете использовать либо KEY1, либо KEY2. Всегда наличие двух ключей позволяет безопасно поворачивать и повторно создавать ключи без нарушения работы службы.

Скриншот пользовательского интерфейса обзора для ресурса Azure OpenAI на портале Azure с окружением расположения конечной точки и ключей доступа красным цветом.

Переменные среды

Создайте и назначьте переменные постоянной среды для ключа и конечной точки.

Важно

Используйте ключи API с осторожностью. Не включайте ключ API непосредственно в код и никогда не публикуйте его. Если вы используете ключ API, сохраните его безопасно в Azure Key Vault. Для получения дополнительной информации о безопасном использовании ключей API в ваших приложениях, см. ключи API в Azure Key Vault.

Дополнительные сведения о безопасности служб ИИ см. в разделе Аутентификация запросов к службам Azure AI.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

Создание приложения PowerShell

Выполните следующую команду. Необходимо заменить YourDeploymentName на имя развертывания, выбранное при развертывании модели Whisper. Имя развертывания не обязательно совпадает с именем модели. При вводе имени модели возникает ошибка, если вы не выбрали имя развертывания, идентичное имени базовой модели.

# Azure OpenAI metadata variables
$openai = @{
    api_key     = $Env:AZURE_OPENAI_API_KEY
    api_base    = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
    api_version = '2024-02-01' # this may change in the future
    name        = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}

# Header for authentication
$headers = [ordered]@{
    'api-key' = $openai.api_key
}

$form = @{ file = get-item -path './wikipediaOcelot.wav' }

# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"

$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text

Вы можете получить примеры аудиофайлов, например wikipediaOcelot.wav, из репозитория Foundry Tools SDK для Azure Speech на GitHub.

Важно

Для производственной среды используйте хранение и доступ к учетным данным посредством безопасного метода, например PowerShell Secret Management через Azure Key Vault. Дополнительные сведения см. в разделе "Безопасность учетных данных".

Выход

The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.

Примечание

Сведения о других звуковых моделях, которые можно использовать с Azure OpenAI, см. в разделе Audio models.

Совет

Ограничение размера файла для модели Whisper составляет 25 МБ. Если вам нужно транскрибировать файл размером более 25 МБ, вы можете использовать API пакетного транскрибирования в Azure Speech в Foundry Tools.

Устранение неполадок

Ошибки проверки подлинности

Если вы получаете 401 несанкционированных ошибок, проверьте следующее:

  • Ключ API правильно задан в переменных среды
  • Ресурс OpenAI Azure активен
  • У вашей учетной записи есть роль участника в Cognitive Services

Ошибки формата файла

Модель Whisper поддерживает форматы mp3, mp4, mpeg, mpga, m4a, wav и webm. Другие форматы возвращают ошибку.

Ограничение размера файла

Звуковые файлы должны составлять 25 МБ или меньше. Для больших файлов используйте API Azure api пакетной расшифровки речи.

Развертывание не найдено

Убедитесь, что имя развертывания совпадает с тем, что вы создали в Azure OpenAI Studio. Имена развертываний чувствительны к регистру.

Очистка ресурсов

Если вы хотите очистить и удалить ресурс Azure OpenAI, можно удалить его. Перед удалением ресурса необходимо сначала удалить все развернутые модели.

Дальнейшие действия