Поделиться через


Развертывание пользовательской модели речи

В этой статье вы узнаете, как развернуть конечную точку для пользовательской модели речи. За исключением пакетного транскрибирования, необходимо развернуть пользовательскую конечную точку для использования пользовательской модели речи.

Совет

Размещенная конечная точка развертывания не требуется для использования пользовательской речи с API транскрибирования пакетной службы. Вы можете сохранить ресурсы, если пользовательская модель речи используется только для пакетной транскрибирования. Дополнительные сведения см. в разделе Цены на службы "Речь".

Вы можете развернуть конечную точку для базовой или пользовательской модели, а затем обновить конечную точку позже, чтобы использовать более обученную модель.

Примечание.

Конечные точки, используемые ресурсами службы "Речь" уровня F0, удаляются через семь дней.

Добавление конечной точки развертывания

Чтобы создать пользовательскую конечную точку, сделайте следующее:

  1. Войдите в службу Speech Studio.

  2. Выберите "Настраиваемая речь>" Для развертывания моделей имени >проекта.

    Если это первая конечная точка, обратите внимание, что в таблице нет конечных точек. После создания конечной точки, эту страницу вы используете для мониторинга каждой развернутой конечной точки.

  3. Выберите Развернуть модель, чтобы запустить мастер создания конечной точки.

  4. На странице Новая конечная точка введите имя и описание для пользовательской конечной точки.

  5. Затем выберите настраиваемую модель, которую необходимо связать с конечной точкой.

  6. При необходимости можно установить флажок, чтобы включить ведение журнала диагностики и аудио для трафика конечной точки.

    Снимок экрана: страница новой конечной точки с флажком, включающим ведение журнала.

  7. Нажмите кнопку Добавить, чтобы сохранить и развернуть конечную точку.

На главной странице Развертывание моделей в таблице отображаются сведения о новой конечной точке, например имя, описание, состояние и дата окончания срока действия. Создание экземпляра новой конечной точки с пользовательскими моделями может занять до 30 минут. Если состояние развертывания сменилось на Успешно, конечная точка готова к использованию.

Внимание

Запишите дату окончания срока действия модели. Это последняя дата, когда пользовательскую модель можно использовать для распознавания речи. Дополнительные сведения см. в разделе Жизненный цикл модели и конечной точки.

Выберите ссылку конечной точки, чтобы просмотреть сведения о ней, такие как ключ конечной точки, URL-адрес конечной точки и пример кода.

Чтобы создать конечную точку и развернуть модель, используйте команду spx csr endpoint create. Создайте параметры запроса в соответствии со следующими инструкциями:

  • В качестве значения параметра project укажите идентификатор существующего проекта. Рекомендуется также просматривать конечную точку и управлять ею в Speech Studio. Для получения доступных проектов выполните команду spx csr project list.
  • Задайте обязательный параметр model для идентификатора модели, которую требуется развернуть в конечной точке.
  • Задайте обязательный параметр language. Языковой стандарт конечной точки должен соответствовать языковому стандарту модели. Языковой стандарт нельзя будет изменить позже. Параметр language интерфейса командной строки речевой службы соответствует свойству locale в запросе и ответе JSON.
  • Задайте обязательный параметр name. Это имя, отображаемое в Speech Studio. Параметр name интерфейса командной строки речевой службы соответствует свойству displayName в запросе и ответе JSON.
  • При необходимости можно задать параметр logging. Установите значение enabled, чтобы включить ведение журнала звука и диагностики трафика конечной точки. Значение по умолчанию — false.

Ниже приведен пример команды интерфейса командной строки службы "Речь" для создания конечной точки и развертывания модели:

spx csr endpoint create --api-version v3.2 --project YourProjectId --model YourModelId --name "My Endpoint" --description "My Endpoint Description" --language "en-US"

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
  "links": {
    "logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
    "restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": true
  },
  "lastActionDateTime": "2024-07-15T16:29:36Z",
  "status": "NotStarted",
  "createdDateTime": "2024-07-15T16:29:36Z",
  "locale": "en-US",
  "displayName": "My Endpoint",
  "description": "My Endpoint Description"
}

Свойство верхнего уровня self в теле ответа является универсальным кодом ресурса (URI) конечной точки. Используйте этот универсальный код ресурса, чтобы получить сведения о проекте, модели и журналах конечной точки. Этот универсальный код ресурса (URI) также используется для обновления конечной точки.

Для справки по интерфейсу командной строки службы "Речь" с конечными точками выполните следующую команду:

spx help csr endpoint

Чтобы создать конечную точку и развернуть модель, используйте операцию Endpoints_Create преобразования речи в текстовый REST API. Создайте текст запроса в соответствии со следующими инструкциями:

  • Задайте для свойства project значение URI существующего проекта. Рекомендуется также просматривать конечную точку и управлять ею в Speech Studio. Вы можете сделать запрос Projects_List для получения доступных проектов.
  • Задайте обязательный параметр model для идентификатора модели, которую требуется развернуть в конечной точке.
  • Задайте обязательное свойство locale. Языковой стандарт конечной точки должен соответствовать языковому стандарту модели. Языковой стандарт нельзя будет изменить позже.
  • Задайте обязательное свойство displayName. Это имя, отображаемое в Speech Studio.
  • При необходимости можно задать свойство loggingEnabled внутри properties. Установите значение true, чтобы включить ведение журнала звука и диагностики трафика конечной точки. Значение по умолчанию — false.

Выполните HTTP-запрос POST с помощью URI, как показано в следующем Endpoints_Create примере. Замените YourSubscriptionKey ключом ресурса службы "Речь" и YourServiceRegion регионом ресурса службы "Речь", а также задайте свойства текста запроса, как описано выше.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": true
  },
  "displayName": "My Endpoint",
  "description": "My Endpoint Description",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/ae8d1643-53e4-4554-be4c-221dcfb471c5"
  },
  "locale": "en-US",
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints"

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
  "links": {
    "logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
    "restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": true
  },
  "lastActionDateTime": "2024-07-15T16:29:36Z",
  "status": "NotStarted",
  "createdDateTime": "2024-07-15T16:29:36Z",
  "locale": "en-US",
  "displayName": "My Endpoint",
  "description": "My Endpoint Description"
}

Свойство верхнего уровня self в теле ответа является универсальным кодом ресурса (URI) конечной точки. Используйте этот универсальный код ресурса, чтобы получить сведения о проекте, модели и журналах конечной точки. Этот универсальный код ресурса также используется для обновления или удаления проекта.

Изменение модели и повторное развертывание конечной точки

Конечную точку можно обновить для использования другой модели, созданной тем же ресурсом службы "Речь". Как упоминалось ранее, необходимо обновить модель конечной точки до истечения ее срока действия.

Чтобы использовать новую модель и повторно развернуть пользовательскую конечную точку, сделайте следующее:

  1. Войдите в службу Speech Studio.
  2. Выберите "Настраиваемая речь>" Для развертывания моделей имени >проекта.
  3. Щелкните ссылку на конечную точку по имени, а затем выберите Изменить модель.
  4. Затем выберите новую модель, которую должна использовать конечная точка.
  5. Нажмите кнопку Готово, чтобы сохранить и повторно развернуть конечную точку.

Чтобы повторно развернуть пользовательскую конечную точку с новой моделью, используйте команду spx csr model update. Создайте параметры запроса в соответствии со следующими инструкциями:

  • Задайте обязательный параметр endpoint для идентификатора модели, которую требуется развернуть в конечной точке.
  • Задайте обязательный параметр model для идентификатора модели, которую требуется развернуть в конечной точке.

Ниже приведен пример команды CLI службы "Речь", которая повторно развертывает пользовательскую конечную точку с помощью новой модели:

spx csr endpoint update --api-version v3.2 --endpoint YourEndpointId --model YourModelId

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
  "links": {
    "logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
    "restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": true
  },
  "lastActionDateTime": "2024-07-15T16:30:12Z",
  "status": "Succeeded",
  "createdDateTime": "2024-07-15T16:29:36Z",
  "locale": "en-US",
  "displayName": "My Endpoint",
  "description": "My Endpoint Description"
}

Для справки по интерфейсу командной строки службы "Речь" с конечными точками выполните следующую команду:

spx help csr endpoint

Чтобы повторно развернуть пользовательскую конечную точку с помощью новой модели, используйте Endpoints_Update операцию преобразования речи в текстовый REST API. Создайте текст запроса в соответствии со следующими инструкциями:

  • Задайте параметр model для универсального кода ресурса модели, которую требуется развернуть в конечной точке.

Выполните HTTP-запрос PATCH с использованием URI, как показано в следующем примере. Замените YourSubscriptionKey ключом ресурса службы "Речь", YourServiceRegion — регионом ресурса службы "Речь", а YourEndpointId — идентификатором конечной точки, а также задайте свойства текста запроса, как описано выше.

curl -v -X PATCH -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId"

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
  "links": {
    "logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
    "restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": true
  },
  "lastActionDateTime": "2024-07-15T16:30:12Z",
  "status": "Succeeded",
  "createdDateTime": "2024-07-15T16:29:36Z",
  "locale": "en-US",
  "displayName": "My Endpoint",
  "description": "My Endpoint Description"
}

Повторное развертывание занимает несколько минут. В то же время конечная точка использует предыдущую модель без прерывания работы службы.

Просмотр данных журнала

Данные журнала можно экспортировать, если вы настроили ведение журнала при создании конечной точки.

Чтобы скачать журналы конечных точек, сделайте следующее:

  1. Войдите в службу Speech Studio.
  2. Выберите "Настраиваемая речь>" Для развертывания моделей имени >проекта.
  3. Щелкните ссылку с именем конечной точки.
  4. В разделе Content logging (Ведение журнала содержимого) выберите Скачать журнал.

Чтобы получить журналы для конечной точки, используйте spx csr endpoint list команду. Создайте параметры запроса в соответствии со следующими инструкциями:

  • Задайте обязательный параметр endpoint для идентификатора конечной точки, для которой нужно получить журналы.

Ниже приведен пример команды интерфейса командной строки службы "Речь", которая получает журналы для конечной точки:

spx csr endpoint list --api-version v3.2 --endpoint YourEndpointId

Расположения каждого файла журнала с дополнительными сведениями возвращаются в тексте ответа.

Чтобы получить журналы для конечной точки, начните с Endpoints_Get операции преобразования речи в текстовый REST API.

Выполните HTTP-запрос GET с URI, как показано в следующем примере. В YourEndpointId замените YourSubscriptionKey на ключ ресурса службы "Речь" и замените YourServiceRegion на регион ресурса службы "Речь".

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
  "links": {
    "logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
    "restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": true
  },
  "lastActionDateTime": "2024-07-15T16:30:12Z",
  "status": "Succeeded",
  "createdDateTime": "2024-07-15T16:29:36Z",
  "locale": "en-US",
  "displayName": "My Endpoint",
  "description": "My Endpoint Description"
}

Выполните HTTP-запрос GET, используя универсальный код "журналов" из предыдущего текста ответа. В YourEndpointId замените YourSubscriptionKey на ключ ресурса службы "Речь" и замените YourServiceRegion на регион ресурса службы "Речь".

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId/files/logs" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Расположения каждого файла журнала с дополнительными сведениями возвращаются в тексте ответа.

Данные журнала доступны в хранилище майкрософт в течение 30 дней, а затем удаляются. Если ваша учетная запись хранения связана с подпиской служб ИИ Azure, данные ведения журнала не удаляются автоматически.