Переход с устаревшего распознавания намерений

Распознавание намерений в Azure Speech в инструменте Foundry Tools было прекращено 30 сентября 2025 года. Приложения больше не могут использовать распознавание намерений через технологию речи. Однако вы по-прежнему можете выполнять распознавание намерений с помощью языка Azure в службе средств Foundry или Azure OpenAI.

Это изменение не влияет на другие возможности обработки речи, такие как речь в текст (включая отсутствие изменений в диаризации говорящего), текст в речь и перевод речи.

Речь ранее представляла семейство объектов IntentRecognizer в SDK для работы с речью. Эти API зависят от приложения интеллектуальной службы распознавания речи (LUIS) или простых конструкций сопоставления шаблонов. С выходом на пенсию:

  • IntentRecognizer, сопоставления шаблонов намерений или сущностей и связанных параметров больше не доступны.
  • Существующие приложения должны удалить прямую логику намерения пакета SDK службы "Речь" и применить двухэтапный подход (речь к тексту, а затем классификация намерений) или единый подход на основе запроса.

Выбор альтернативы

Требование Рекомендуемая служба Почему
Структурированное намерение и извлечение сущностей с помеченными данными обучения Распознавание разговорного языка в языковых сервисах (CLU) Специально разработан для классификации с несколькими намерениями и извлечения сущностей; поддерживает версии, тестирование и аналитику.
Распознавание динамических намерений Few-shot или zero-shot Azure OpenAI Используйте модели GPT с примерами запросов. Быстро адаптируйтесь без изменений схемы.
Объединение транскрипции с генеративным мышлением (сводки и намерения) Azure OpenAI + Speech Транскрибировать аудио, а затем обогатить с помощью результатов GPT для сложного рассуждения.
Многоязычные речевые входные данные, поступающие в согласованную схему намерений Речь (STT) + CLU Обработка речи осуществляет транскрипцию; CLU проводит нормализацию и классификацию.

Шаги миграции

  1. Замените любое использование Speech SDK IntentRecognizer на SpeechRecognizer или ConversationTranscriber для извлечения текста.
  2. Для структурированных потребностей намерения или сущности создайте проект CLU и разверните модель. Отправьте транскрибированные речевые фрагменты в API прогнозирования CLU.
  3. Для гибких или быстрых сценариев создайте запрос на модель Azure OpenAI, включая представительные высказывания пользователей и ожидаемые выходные данные намерения JSON.
  4. Удалите зависимости от LanguageUnderstandingModel, а также любые идентификаторы приложений LUIS или конечные точки из конфигурации.
  5. Устраните код сопоставления шаблонов, который ссылается на типы PatternMatchingIntent или PatternMatchingEntity.
  6. Проверьте точность, сравнивая исторические IntentRecognizer результаты с результатами классификации CLU или завершения OpenAI, корректируя обучающие данные или подсказки по мере необходимости.
  7. Обновление мониторинга: перенесите все существующие панели мониторинга задержек и точности намерений на новые источники (журналы оценки CLU или отслеживание результатов подсказок OpenAI).

Пример архитектуры

  1. Речь к тексту транскрибирует звук в текст с помощью режима реального времени или пакетного режима.
  2. Текст отправляется в CLU или Azure OpenAI в зависимости от стратегии намерения.
  3. Ответ нормализуется в общую форму JSON (например: { "intent": "BookFlight", "entities": { "Destination": "Seattle" } }).
  4. Бизнес-логика направляет нормализованные выходные данные в подчиненные службы (резервирование, база знаний, обработчик рабочих процессов).

Рекомендации по формату результатов

Аспект CLU Azure OpenAI
Стабильность схемы Высокая (четко определенные намерения/сущности) Гибкая (определяемая запросом)
Управление версиями Встроенные версии модели Ручное управление версиями подсказок
Учебные усилия Требуется помеченный набор данных Примеры с несколькими выстрелами в командной строке
Пограничные случаи Требуется больше размеченных данных Добавление примеров или инструкций
Задержка Вызов API прогнозирования Вызов API Completion (аналогичный)

Часто задаваемые вопросы

Нужно ли пересматривать метки данных? Если вы использовали LUIS, необходимо экспортировать и переимпортировать данные в CLU, а затем перенастроить систему. Часто сопоставление выполняется непосредственно (интенты, сущности). Для сопоставления шаблонов может потребоваться ручное преобразование в примеры.

Можно ли объединить CLU и Azure OpenAI? Да. Используйте CLU для детерминированной классификации и OpenAI для суммирования или резервной классификации при низкой достоверности.

Влияет ли процесс диаризации на говорящего? Нет. Функции диаризации сохраняются; вы просто обрабатываете каждый сегмент говорящего через CLU или OpenAI после расшифровки.