Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Распознавание намерений в Azure Speech в инструменте Foundry Tools было прекращено 30 сентября 2025 года. Приложения больше не могут использовать распознавание намерений через технологию речи. Однако вы по-прежнему можете выполнять распознавание намерений с помощью языка Azure в службе средств Foundry или Azure OpenAI.
Это изменение не влияет на другие возможности обработки речи, такие как речь в текст (включая отсутствие изменений в диаризации говорящего), текст в речь и перевод речи.
Речь ранее представляла семейство объектов IntentRecognizer в SDK для работы с речью. Эти API зависят от приложения интеллектуальной службы распознавания речи (LUIS) или простых конструкций сопоставления шаблонов. С выходом на пенсию:
-
IntentRecognizer, сопоставления шаблонов намерений или сущностей и связанных параметров больше не доступны. - Существующие приложения должны удалить прямую логику намерения пакета SDK службы "Речь" и применить двухэтапный подход (речь к тексту, а затем классификация намерений) или единый подход на основе запроса.
Выбор альтернативы
| Требование | Рекомендуемая служба | Почему |
|---|---|---|
| Структурированное намерение и извлечение сущностей с помеченными данными обучения | Распознавание разговорного языка в языковых сервисах (CLU) | Специально разработан для классификации с несколькими намерениями и извлечения сущностей; поддерживает версии, тестирование и аналитику. |
| Распознавание динамических намерений Few-shot или zero-shot | Azure OpenAI | Используйте модели GPT с примерами запросов. Быстро адаптируйтесь без изменений схемы. |
| Объединение транскрипции с генеративным мышлением (сводки и намерения) | Azure OpenAI + Speech | Транскрибировать аудио, а затем обогатить с помощью результатов GPT для сложного рассуждения. |
| Многоязычные речевые входные данные, поступающие в согласованную схему намерений | Речь (STT) + CLU | Обработка речи осуществляет транскрипцию; CLU проводит нормализацию и классификацию. |
Шаги миграции
- Замените любое использование Speech SDK
IntentRecognizerнаSpeechRecognizerилиConversationTranscriberдля извлечения текста. - Для структурированных потребностей намерения или сущности создайте проект CLU и разверните модель. Отправьте транскрибированные речевые фрагменты в API прогнозирования CLU.
- Для гибких или быстрых сценариев создайте запрос на модель Azure OpenAI, включая представительные высказывания пользователей и ожидаемые выходные данные намерения JSON.
- Удалите зависимости от
LanguageUnderstandingModel, а также любые идентификаторы приложений LUIS или конечные точки из конфигурации. - Устраните код сопоставления шаблонов, который ссылается на типы
PatternMatchingIntentилиPatternMatchingEntity. - Проверьте точность, сравнивая исторические
IntentRecognizerрезультаты с результатами классификации CLU или завершения OpenAI, корректируя обучающие данные или подсказки по мере необходимости. - Обновление мониторинга: перенесите все существующие панели мониторинга задержек и точности намерений на новые источники (журналы оценки CLU или отслеживание результатов подсказок OpenAI).
Пример архитектуры
- Речь к тексту транскрибирует звук в текст с помощью режима реального времени или пакетного режима.
- Текст отправляется в CLU или Azure OpenAI в зависимости от стратегии намерения.
- Ответ нормализуется в общую форму JSON (например:
{ "intent": "BookFlight", "entities": { "Destination": "Seattle" } }). - Бизнес-логика направляет нормализованные выходные данные в подчиненные службы (резервирование, база знаний, обработчик рабочих процессов).
Рекомендации по формату результатов
| Аспект | CLU | Azure OpenAI |
|---|---|---|
| Стабильность схемы | Высокая (четко определенные намерения/сущности) | Гибкая (определяемая запросом) |
| Управление версиями | Встроенные версии модели | Ручное управление версиями подсказок |
| Учебные усилия | Требуется помеченный набор данных | Примеры с несколькими выстрелами в командной строке |
| Пограничные случаи | Требуется больше размеченных данных | Добавление примеров или инструкций |
| Задержка | Вызов API прогнозирования | Вызов API Completion (аналогичный) |
Часто задаваемые вопросы
Нужно ли пересматривать метки данных? Если вы использовали LUIS, необходимо экспортировать и переимпортировать данные в CLU, а затем перенастроить систему. Часто сопоставление выполняется непосредственно (интенты, сущности). Для сопоставления шаблонов может потребоваться ручное преобразование в примеры.
Можно ли объединить CLU и Azure OpenAI? Да. Используйте CLU для детерминированной классификации и OpenAI для суммирования или резервной классификации при низкой достоверности.
Влияет ли процесс диаризации на говорящего? Нет. Функции диаризации сохраняются; вы просто обрабатываете каждый сегмент говорящего через CLU или OpenAI после расшифровки.