Что такое SDK для работы с речью?

SDK для Речи предоставляет множество возможностей службы Речи, позволяя разрабатывать программы с функцией распознавания речи. SDK для работы с речью доступен на многих языках программирования и на разных платформах. Пакет SDK для речи идеально подходит для сценариев как в реальном времени, так и для не в реальном времени с помощью локальных устройств, файлов, Хранилище BLOB-объектов Azure, и используя входные и выходные потоки.

В некоторых случаях Speech SDK нельзя или не рекомендуется использовать. В этих случаях можно использовать REST API для доступа к сервису речевых технологий. Например, используйте REST API преобразования речи в текст для пакетной транскрипции и управления пользовательскими моделями речи. Для специализированных сценариев транскрибирования с возможностями распознавания речи LLM и быстрого транскрибирования используйте пакет SDK для транскрибирования речи.

Поддерживаемые языки

SDK для работы с речью поддерживает следующие языки и платформы:

Язык программирования Справочные материалы Поддержка платформы
C#1 .NET Windows, Linux, macOS, Mono, UWP
C++2 C++ Windows, Linux, macOS
Go Go Linux
Java Java Android, Windows, Linux, macOS
JavaScript JavaScript Браузер, Node.js
Objective-C Objective-C iOS, macOS
Python Python Windows, Linux, macOS
Swift Objective-C3 iOS, macOS

1 Примеры кода C# доступны в документации. Пакет SDK службы "Речь" для C# основан на .NET standard 2.0, поэтому он поддерживает множество платформ и языков программирования. См. поддержка реализации .NET для получения дополнительной информации.
Язык программирования 2 C не поддерживается в Speech SDK.
3 Пакет SDK Речи для Swift предоставляет доступ к клиентским библиотекам и справочной документации с пакетом SDK Речи для Objective-C.

Внимание

Скачивая любой из SDK для Azure Speech в средствах Foundry, вы признаёте условия его лицензии. Дополнительные сведения см. в разделе:

Демонстрация SDK службы "Речь"

В следующем видео показано, как установить пакет SDK Speech для C# и написать консольное приложение .NET для преобразования речи в текст.

Примеры кода

Примеры кода пакета SDK для службы "Речь" доступны в документации и GitHub.

Примеры документации

В верхней части страниц документации, содержащих примеры, можно выбрать C#, C++, Go, Java, JavaScript, Objective-C, Python или Swift.

Снимок экрана: как выбрать язык программирования в документации.

Если пример недоступен на предпочитаемом языке программирования, можно выбрать другой язык программирования, чтобы начать и узнать о понятиях, или просмотреть ссылки и примеры, упомянутые в начале статьи.

примеры GitHub

Подробные примеры доступны в репозитории Azure-Samples/cognitive-services-speech-sdk на GitHub. Примеры для C# (включая UWP), C++, Java, JavaScript (включая браузер и Node.js), Objective-C, Python и Swift. Примеры кода для Go доступны в репозитории Microsoft/cognitive-services-speech-sdk-go в GitHub.

Варианты справки

Форумы Stack Overflow доступны для сообщества разработчиков, чтобы задавать и отвечать на вопросы о Azure Speech и других сервисах. Корпорация Майкрософт отслеживает форумы и отвечает на вопросы, на которые сообщество еще не ответило. Чтобы мы увидели ваш вопрос, пометьте его тегом "azure-speech".

Вы можете предложить идею или сообщить об ошибке, создав проблему на GitHub:

См. также варианты поддержки и справки для Foundry Tools, чтобы получить помощь, оставаться в курсе последних новостей, отправлять отзывы и сообщать об ошибках Foundry Tools.

Следующие шаги