Что такое язык Azure в средствах Foundry?

Язык Azure — это облачная служба, которая предоставляет функции обработки естественного языка (NLP) для понимания и анализа текста. Эта служба помогает создавать интеллектуальные приложения с помощью веб-библиотек Microsoft Foundry, REST API и клиентских библиотек. Для разработки агента ИИ возможности службы также доступны в качестве инструментов на сервере MCP языка Azure, который доступен как удаленный сервер в каталоге инструментов Microsoft Foundry , так и в качестве локального сервера для локальных сред.

Основные возможности

Рекомендуется для новой разработки

Основные возможности — это основные, активно развивающиеся функции языка Azure. Эти функции получают текущие инвестиционные и функциональные обновления и рекомендуются для новых разработок и долгосрочного планирования. Если вы запускаете новый проект или разрабатываете будущую архитектуру, используйте основные возможности в качестве основы для рабочих процессов обработки естественного языка.

Tip

Не уверены, какую функцию следует использовать? Узнайте , какую основную функцию языка Azure следует использовать , чтобы помочь вам решить.

Microsoft Foundry позволяет использовать большинство следующих функций службы без необходимости писать код.

Обнаружение персонально идентифицируемой информации (PII)

Это важно

Функция анонимизации PII (замена синтетическим текстом) в инструменте Foundry Tools на платформе Azure в настоящее время доступна и лицензирована для вас в preview рамках подписки Azure. Использование этой функции распространяется на условия, применимые к предварительным версиям , как описано в дополнительных условиях использования для предварительных версий Microsoft Azure и надстройке защиты данных (DPA) продуктов и служб Майкрософт.

Обнаружение персонально идентифицируемой информации (PII) определяет сущности в тексте и беседах (в чате или расшифровках), связанных с отдельными лицами.

Личные данные беседы

Снимок экрана лично идентифицируемой информации в Foundry.

Персональные идентифицирующие данные

Скриншот личной идентификационной информации в Foundry.

Распознавание языка

Обнаружение языка оценивает текст и выявляет широкий спектр языков и диалектов с вариациями.

Снимок экрана: обнаружение языка в Foundry.

Пользовательский NER

Распознавание пользовательских именованных сущностей (CNER) позволяет создавать пользовательские модели ИИ для извлечения категорий пользовательских сущностей (меток слов или фраз), используя предоставленный неструктурированный текст.

Снимок экрана: пример пользовательского NER.

Встроенная функциональность NER

Предварительно созданное распознавание именованных сущностей (NER) определяет различные записи в тексте и классифицирует их в предопределенные типы.

Снимок экрана: распознавание именованных сущностей в Foundry.

Анализ текста для сферы здравоохранения

Анализ текста в области здравоохранения извлекает и маркирует соответствующую информацию о здоровье из неструктурированного текста.

Снимок экрана анализа текста для здоровья в Foundry.

Устаревшие возможности

Поддерживается для существующих реализаций

Устаревшие возможности — это установленные функции, обеспечивающие стабильную, поддерживаемую базу для существующих рабочих нагрузок и сценариев. Эти функции поддерживаются для существующих реализаций и установленных вариантов использования.

Распознавание устной речи

Распознавание устной речи (CLU) позволяет пользователям создавать настраиваемые модели распознавания естественного языка для прогнозирования общего намерения входящего речевого фрагмента и извлечения из него важных сведений.

Снимок экрана: пример распознавания устной речи.

Пользовательская классификация текстов

Настраиваемая классификация текста позволяет создавать пользовательские модели искусственного интеллекта для классификации неструктурированных текстовых документов в определяемые пользовательские классы. Создание проекта пользовательской классификации текста обычно включает несколько различных шагов:

Снимок экрана: пример пользовательской классификации текстов.

Связывание сущностей

Связывание сущностей — это предварительно настроенная функция, которая устраняет неоднозначность идентичности сущностей (слов или фраз), найденных в неструктурированном тексте, и возвращает ссылки на Википедию.

Снимок экрана: пример связывания сущностей.

Извлечение ключевых фраз

Извлечение ключевых фраз — это предварительно настроенная функция, которая оценивает и возвращает основные понятия в неструктурированном тексте и возвращает их в виде списка.

Снимок экрана: извлечение ключевых фраз в Foundry.

Рабочий процесс оркестрации

Рабочий процесс оркестрации — это настраиваемая функция, которая позволяет подключать приложения для понимания разговорного языка (CLU) и специального создания ответов на вопросы (CQA).

Снимок экрана: пример рабочего процесса оркестрации.

Ответы на вопросы

Ответ на вопросы — это пользовательская функция, которая определяет наиболее подходящий ответ для входных данных пользователей. Эта функция обычно используется для разработки разговорных клиентских приложений, включая платформы социальных сетей, чат-боты и настольные приложения с поддержкой речи.

Снимок экрана: пример ответов на вопросы.

Анализ настроений и извлечение мнений

Предварительно настроенные функции анализа тональности и анализа мнений, которые помогают понять общественное восприятие вашего бренда или темы. Эти функции анализируют текст для выявления положительной или отрицательной тональности и могут связывать их с определенными элементами.

Скриншот с анализом тональности в Foundry.

Summarization

Суммирование сокращает информацию для текста и разговоров (чат и транскрипты).

Резюмирование разговора

Резюме беседы резюмирует и сегментирует длинные собрания на главы с отметкой времени.

Снимок экрана: сводка бесед в Foundry.

Сводка центра вызовов

Сводка по колл-центру содержит информацию о проблемах клиентов и их решениях.

Снимок экрана: сводка центра вызовов в Foundry.

Суммаризация текста

Резюмирование текста создает краткое изложение, поддерживая два подхода:

  • Извлечение сводных данных создает сводку, выбрав ключевые предложения из документа и сохранив исходные позиции.

  • Абстрактная сводка создает сводку, создавая новые, краткие и последовательные предложения или фразы, которые не копируются непосредственно из исходного документа.

    Снимок экрана: сводка текста в Foundry.

Доступные средства

Язык Azure предоставляет специализированные средства, обеспечивающие непрерывную интеграцию агентов ИИ и служб обработки языка с помощью стандартных протоколов.

Сервер MCP языка Azure

Сервер MCP (протокол контекста модели) создает стандартизованный мост, который подключает агенты ИИ непосредственно к службам языка Azure через отраслевые стандартные протоколы. Эта интеграция позволяет разработчикам создавать сложные диалоговые приложения с надежными возможностями обработки естественного языка, обеспечивая соответствие корпоративным уровням, защиту данных и точность обработки в рабочих процессах ИИ.

Язык Azure предоставляет как удаленные, так и локальные параметры сервера MCP:

  • Удаленный сервер: доступен в каталоге средств Foundry для развертываний, размещенных в облаке.
  • Локальный сервер: доступен для разработчиков, которые предпочитают размещать сервер в собственной среде.

Дополнительные сведения см. всервере языка MCP Azure.

Агенты языка Azure

Язык Azure предлагает предварительно созданные агенты, которые обрабатывают определенные сценарии ИИ бесед с встроенным управлением, логикой маршрутизации и механизмами контроля качества.

Агент маршрутизации намерений языка Azure

Агент маршрутизации намерений интеллектуально управляет потоками бесед, понимая намерения пользователей и предоставляя точные ответы в приложениях ИИ для общения. Этот агент использует предсказуемые процессы принятия решений в сочетании с управляемой генерацией ответов, чтобы обеспечить согласованное, надежное взаимодействие, которому организации могут доверять и которое они могут отслеживать.

Дополнительные сведения см. в разделе"Агент маршрутизации намерений языка Azure".

Агент точного ответа на вопросы в языковой платформе Azure

Агент точного ответа на вопросы предоставляет надежные ответы на самые важные бизнес-вопросы. Этот агент автоматизирует часто задаваемые вопросы с одновременным поддержанием человеческого контроля и контроля качества для обеспечения точности и соответствия требованиям.

Дополнительные сведения см. в агенте Azure Languageдля точных ответов на вопросы.

Какую основную функцию языка следует использовать?

В этом разделе показано, какой основной компонент языка следует использовать для приложения:

Что вы хотите сделать? Формат документа Лучшее решение Настраивается ли это решение?*
Обнаружение и/или редактирование конфиденциальной информации, такой как PII и PHI. Неструктурированный текст,
транскрибированные беседы
Обнаружение личной идентифицируемой информации
Извлеките категории сведений без создания пользовательской модели. Неструктурированный текст Предварительно настроенная функция NER
Извлеките категории сведений с помощью модели, конкретной для ваших данных. Неструктурированный текст Пользовательский NER
Извлеките медицинскую информацию из клинических или медицинских документов, не создавая модель. Неструктурированный текст Анализ текста для сферы здравоохранения

* Если функция настраивается, вы можете обучить модель ИИ с помощью наших инструментов, чтобы точно соответствовать вашим данным. В противном случае функция предварительно настроена, т. е. модели ИИ, которые он использует, не могут быть изменены. Вы просто отправляете свои данные и используете выходные данные компонента в своих приложениях.

Какую устаревшую языковую функцию следует использовать?

В этом разделе показано, какие устаревшие языковые функции следует использовать для приложения:

Что вы хотите сделать? Формат документа Лучшее решение Настраивается ли это решение?*
Извлеките основные темы и важные фразы. Неструктурированный текст Извлечение ключевых фраз
Определите тональность и мнения, выраженные в тексте. Неструктурированный текст Анализ тональности и анализ мнений
Суммирование длинных фрагментов текста или бесед. Неструктурированный текст,
транскрибированные беседы.
Summarization
Разрешить неоднозначности сущностей и получить ссылки на Википедию. Неструктурированный текст Связывание сущностей
Классифицируйте документы в одну или несколько категорий. Неструктурированный текст Настраиваемая классификация текста
Определите язык, на который был написан текст. Неструктурированный текст Распознавание языка
Прогнозирование намерения входных данных пользователей и извлечение информации из них. Неструктурированные входные данные пользователей Распознавание речи в беседах
Подключите приложения, использующие понимание разговорного языка и пользовательскую систему ответов на вопросы. Неструктурированные входные данные пользователей Рабочий процесс оркестрации
Создайте беседное приложение, которое отвечает на входные данные пользователей. Неструктурированные входные данные пользователей Ответы на вопросы

* Если функция настраивается, вы можете обучить модель ИИ с помощью наших инструментов, чтобы точно соответствовать вашим данным. В противном случае функция предварительно настроена, т. е. модели ИИ, которые он использует, не могут быть изменены. Вы просто отправляете свои данные и используете выходные данные компонента в своих приложениях.

Tutorials

После того как вы начнете с работы с инструкциями по быстрому старту Azure Language, попробуйте наши учебные пособия, которые показывают, как решать различные задачи.

Примеры кода

Дополнительные примеры кода можно найти на GitHub для следующих языков:

Развертывание в локальной среде с помощью контейнеров Docker

Используйте языковые контейнеры для развертывания функций API в локальной среде. Эти контейнеры Docker позволяют разместить службу ближе к данным для обеспечения безопасности, соответствия требованиям и других эксплуатационных преимуществ. Язык предлагает следующие контейнеры:

Ответственное применение ИИ

Система ИИ включает не только технологию, но и людей, которые используют ее, людей, пострадавших от нее, и среды развертывания. Ознакомьтесь с приведенными ниже статьями, чтобы узнать больше об ответственном использовании и развертывании искусственного интеллекта в своих системах.