microsoft-cognitiveservices-speech-sdk package
Классы
| ActivityReceivedEventArgs |
Определяет содержимое полученного сообщения или событий. |
| AudioConfig |
Представляет конфигурацию входного звука, используемую для указания типа входных данных (микрофон, файл, поток). |
| AudioInputStream |
Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука. |
| AudioOutputStream |
Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука. |
| AudioStreamFormat |
Представляет формат аудиопотока, используемый для пользовательских конфигураций ввода звука. |
| AutoDetectSourceLanguageConfig |
Настройка автоматического обнаружения языка. |
| AutoDetectSourceLanguageResult |
Формат выходных данных |
| AvatarConfig |
Определяет конфигурацию говорящая аватара. |
| AvatarEventArgs |
Определяет содержимое для разговорных событий аватара. |
| AvatarSynthesizer |
Определяет синтезатор аватара. |
| AvatarVideoFormat |
Определяет формат выходного видео аватара. |
| AvatarWebRTCConnectionResult |
Определяет результат подключения webRTC аватара. |
| BaseAudioPlayer |
Базовый класс аудиопроигрывателя: сейчас воспроизводит только PCM. |
| BotFrameworkConfig |
Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части Bot Framework. |
| CancellationDetails |
Содержит подробные сведения о том, почему результат был отменен. |
| CancellationDetailsBase |
Содержит подробные сведения о том, почему результат был отменен. |
| Connection |
Подключение — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет дополнительные методы, которые пользователи могут явно открывать или закрывать подключение, а также подписываться на изменения состояния подключения. Использование подключения является необязательным и главным образом для сценариев, в которых требуется точное изменение поведения приложения на основе состояния подключения. Пользователи могут при необходимости вызвать Open(), чтобы вручную настроить подключение перед началом распознавания распознавателя, связанного с этим подключением. Если распознаватель должен подключиться к службе или отключить его, он будет настраивать или завершать подключение независимо. В этом случае подключение будет уведомлено путем изменения состояния подключения с помощью событий подключенного или отключенного подключения. Добавлено в версию 1.2.1. |
| ConnectionEventArgs |
Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версию 1.2.0 |
| ConnectionMessage |
ConnectionMessage представляет конкретные сообщения реализации, отправленные и полученные из службы речи. Эти сообщения предоставляются для отладки и не должны использоваться для рабочих вариантов использования с помощью службы "Речь Azure Cognitive Services". Сообщения, отправленные и полученные из службы "Речь", могут изменяться без уведомления. К ним относятся содержимое сообщения, заголовки, полезные данные, упорядочивание и т. д. Добавлено в версию 1.11.0. |
| ConnectionMessageEventArgs | |
| Conversation | |
| ConversationExpirationEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
| ConversationParticipantsChangedEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
| ConversationTranscriber |
Выполняет распознавание речи с разделением микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате. |
| ConversationTranscriptionCanceledEventArgs |
Определяет содержимое объекта RecognitionErrorEvent. |
| ConversationTranscriptionEventArgs |
Определяет содержимое события транскрибирования беседы или транскрибирования. |
| ConversationTranscriptionResult |
Определяет результат транскрибирования беседы. |
| ConversationTranslationCanceledEventArgs | |
| ConversationTranslationEventArgs |
Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец" |
| ConversationTranslationResult |
Результат перевода текста. |
| ConversationTranslator |
Присоединяйтесь, оставьте или подключитесь к беседе. |
| Coordinate |
Определяет координату в 2D-пространстве. |
| CustomCommandsConfig |
Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части CustomCommands. |
| Diagnostics |
Определяет API диагностики для управления выходными данными консоли, добавленными в версии 1.21.0 |
| DialogServiceConfig |
Класс, определяющий базовые конфигурации соединителя службы диалогов |
| DialogServiceConnector |
Соединитель службы диалоговых окон |
| KeywordRecognitionModel |
Представляет модель распознавания ключевых слов для распознавания, когда пользователь говорит ключевое слово, чтобы инициировать дальнейшее распознавание речи. |
| Meeting | |
| MeetingTranscriber | |
| MeetingTranscriptionCanceledEventArgs |
Определяет содержимое собрания MeetingTranscriptionCanceledEvent. |
| MeetingTranscriptionEventArgs |
Определяет содержимое события транскрибированного или транскрибирования собрания. |
| NoMatchDetails |
Содержит подробные сведения о результатах распознавания NoMatch. |
| Participant |
Представляет участника беседы. Добавлено в версию 1.4.0 |
| PhraseListGrammar |
Позволяет добавлять новые фразы для улучшения распознавания речи. Фразы, добавленные в распознаватель, эффективны в начале следующего распознавания, или при следующем подключении SpeechSDK к службе распознавания речи. |
| PronunciationAssessmentConfig |
Конфигурация оценки произношения. |
| PronunciationAssessmentResult |
Результаты оценки произношения. |
| PropertyCollection |
Представляет коллекцию свойств и их значений. |
| PullAudioInputStream |
Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука. |
| PullAudioInputStreamCallback |
Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских потоков ввода звука. |
| PullAudioOutputStream |
Представляет резервный поток вывода звука, поддерживаемый памятью, используемый для пользовательских конфигураций вывода звука. |
| PushAudioInputStream |
Представляет резервный поток передачи звука, используемый для пользовательских конфигураций ввода звука. |
| PushAudioOutputStream |
Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука. |
| PushAudioOutputStreamCallback |
Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода звука. |
| RecognitionEventArgs |
Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец" |
| RecognitionResult |
Определяет результат распознавания речи. |
| Recognizer |
Определяет распознаватель базового класса, который в основном содержит общие обработчики событий. |
| ServiceEventArgs |
Определяет полезные данные для любого события сообщения службы, добавленного в версию 1.9.0. |
| SessionEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
| SourceLanguageConfig |
Конфигурация исходного языка. |
| SpeakerAudioDestination |
Представляет назначение воспроизведения звука динамиков, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа мультимедиа для воспроизведения звука. Формат Mp3 лучше поддерживается в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат mp3 для воспроизведения. |
| SpeechConfig |
Конфигурация речи. |
| SpeechConfigImpl | |
| SpeechRecognitionCanceledEventArgs | |
| SpeechRecognitionEventArgs |
Определяет содержимое события распознавания и распознавания речи. |
| SpeechRecognitionResult |
Определяет результат распознавания речи. |
| SpeechRecognizer |
Выполняет распознавание речи с микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате. |
| SpeechSynthesisBookmarkEventArgs |
Определяет содержимое события закладки синтеза речи. |
| SpeechSynthesisEventArgs |
Определяет содержимое событий синтеза речи. |
| SpeechSynthesisResult |
Определяет результат синтеза речи. |
| SpeechSynthesisVisemeEventArgs |
Определяет содержимое события синтеза речи viseme. |
| SpeechSynthesisWordBoundaryEventArgs |
Определяет содержимое события границы синтеза речи. |
| SpeechSynthesizer |
Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0 |
| SpeechTranslationConfig |
Конфигурация перевода речи. |
| SynthesisResult |
Базовый класс для результатов синтеза |
| SynthesisVoicesResult |
Определяет результат синтеза речи. |
| Synthesizer | |
| TranslationRecognitionCanceledEventArgs |
Определите полезные данные отмененных событий распознавания речи. |
| TranslationRecognitionEventArgs |
Аргументы события результата перевода текста. |
| TranslationRecognitionResult |
Результат перевода текста. |
| TranslationRecognizer |
Распознаватель перевода |
| TranslationSynthesisEventArgs |
Аргументы события синтеза перевода |
| TranslationSynthesisResult |
Определяет результат синтеза перевода, т. е. выходные данные голоса переведенного текста на целевом языке. |
| Translations |
Представляет коллекцию параметров и их значений. |
| TurnStatusReceivedEventArgs |
Определяет содержимое полученного сообщения или событий. |
| User | |
| VoiceInfo |
Сведения о голосе синтеза речи, добавленном в версию 1.20.0. |
Интерфейсы
| CancellationEventArgs | |
| ConversationInfo | |
| IParticipant |
Представляет участника беседы. Добавлено в версию 1.4.0 |
| IPlayer |
Представляет интерфейс аудиопроигрыватель для управления воспроизведением звука, например приостановкой, возобновлением и т. д. |
| IVoiceJson | |
| MeetingInfo | |
| VoiceSignature | |
Перечисления
| AudioFormatTag | |
| CancellationErrorCode |
Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0. |
| CancellationReason |
Определяет возможные причины отмены результата распознавания. |
| LanguageIdMode |
Режим идентификации языка |
| LogLevel | |
| NoMatchReason |
Определяет возможные причины, по которым результат распознавания не распознается. |
| OutputFormat |
Определение форматов выходных данных распознавателя речи. |
| ParticipantChangedReason | |
| ProfanityOption |
Параметр ненормативной лексики. Добавлено в версию 1.7.0. |
| PronunciationAssessmentGradingSystem |
Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.15.0 |
| PronunciationAssessmentGranularity |
Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.15.0 |
| PropertyId |
Определяет идентификаторы свойства речи. |
| ResultReason |
Определяет возможные причины, по которым может быть создан результат распознавания. |
| ServicePropertyChannel |
Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.7.0. |
| SpeechSynthesisBoundaryType |
Определяет тип границы события границ синтеза речи. |
| SpeechSynthesisOutputFormat |
Определение форматов выходных данных синтеза речи. SpeechSynthesisOutputFormat обновлен в версии 1.17.0 |
| SynthesisVoiceGender |
Определяет род голосов синтеза. Добавлено в версию 1.20.0. |
| SynthesisVoiceType | |