Поделиться через


Определение приземленности

API обнаружения привязанности определяет, основаны ли текстовые ответы больших языковых моделей (LLM) на исходных материалах, предоставляемых пользователями. Необоснованность относится к случаям, когда МРЯ создают информацию, которая не является фактической или является неточной по сравнению с тем, что было в исходных материалах.

Ключевые термины

  • Дополненная генерация с извлечением (RAG): RAG — это метод расширения знаний LLM другими данными. ММЯ могут рассуждать на разнообразные темы, но их знания ограничены общедоступными данными, которые были доступны на момент их обучения. Если вы хотите создать приложения ИИ, которые могут рассуждать о частных данных или данных, появившихся после даты отсечения модели, необходимо предоставить модели эту конкретную информацию. Процесс добавления соответствующих сведений и вставки его в запрос модели называется получением дополненного поколения (RAG). Дополнительные сведения см. в разделе "Генерация с увеличением извлечения" (RAG).
  • Заземленность и незапланированность в LLMs: это относится к степени, в которой выходные данные модели основаны на предоставленной информации или отражают надежные источники точно. Ответ, основанный на фактах, точно соответствует данной информации, избегая спекуляций и вымыслов. В измерениях обоснованности исходная информация имеет решающее значение и служит источником обоснования.

Параметры обнаружения заземления

Доступны следующие параметры для обнаружения надежности в обеспечении безопасности контента в Azure AI:

  • Выбор домена. Пользователи могут выбрать установленный домен, чтобы обеспечить более специальное обнаружение, которое соответствует конкретным потребностям своего поля. Текущие доступные домены: MEDICAL и GENERIC.
  • Спецификация задачи. Эта функция позволяет выбрать выполняемую задачу, например QnA (вопросы и ответы) и суммирование с настраиваемыми параметрами в соответствии с типом задачи.
  • Скорость против интерпретируемости: существует два режима, которые обмениваются скоростью с интерпретируемостью результатов.
    • Режим без логического анализа: обеспечивает возможность быстрого обнаружения; легко внедрить в онлайн-приложения.
    • Режим логического анализа: предлагает подробные пояснения для обнаруженных необоснованных сегментов; лучше для понимания и устранения.

Случаи использования

Обнаружение приземления поддерживает текстовое обобщение и задачи QnA, чтобы гарантировать, что созданные сводки или ответы являются точными и надежными. Ниже приведены некоторые примеры каждого варианта использования.

Задачи суммирования:

  • Медицинская сводка: Обнаружение обоснованности в контексте статей медицинских новостей может использоваться для обеспечения того, чтобы сводка не содержала сфабрикованных или вводящих в заблуждение сведений, гарантируя, что читатели получают точную и надежную медицинскую информацию.
  • Обобщение академических документов: когда модель создает сводки академических статей или научных статей, функция может помочь убедиться, что обобщенное содержимое точно представляет ключевые выводы и вклады, не вводя ложных утверждений.

Задачи QnA:

  • Чат-боты поддержки клиентов: в поддержке клиентов функция может использоваться для проверки ответов, предоставляемых чат-ботами ИИ, что гарантирует, что клиенты получают точную и надежную информацию, когда они задают вопросы о продуктах или службах.
  • Медицинская QnA: Для медицинской QnA функция помогает проверить точность медицинских ответов и консультаций, предоставляемых системами ИИ для медицинских специалистов и пациентов, что снижает риск медицинских ошибок.
  • Образовательный QnA: в образовательных средах функция может применяться к задачам QnA, чтобы убедиться, что ответы на академические вопросы или запросы для подготовки к тестам фактически правильны, поддерживая процесс обучения.

Исправление заземления

API обнаружения обоснованности включает функцию исправления, которая автоматически исправляет любую обнаруженную необоснованность в тексте на основе предоставленных источников обоснования. Если функция исправления включена, ответ включает corrected Text поле, представляющее исправленный текст, выровненный с основными источниками.

Случаи использования

Ниже приведено несколько распространенных сценариев, демонстрирующих, как и когда применять эти функции для достижения наилучших результатов.

Сводка в медицинских контекстах

Вы суммируете медицинские документы, и важно, чтобы имена пациентов в сводках были точными и согласованы с предоставленными исходными источниками.

Пример запроса API:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Ожидаемый результат:

Функция исправления обнаруживает, что Kevin незаземлен, так как конфликтует с источником Jane заземления. API возвращает исправленный текст: "The patient name is Jane."

Задача "Вопрос и ответ" (QnA) с данными службы поддержки клиентов

Вы реализуете систему QnA для чат-бота поддержки клиентов. Важно, чтобы ответы, предоставляемые ИИ, соответствовали последней и точной информации.

Пример запроса API:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Ожидаемый результат:

API обнаруживает, что 5% не заземлен, поскольку он не соответствует предоставленному источнику заземления 4.5%. Ответ содержит текст исправления: "The interest rate is 4.5%."

Создание содержимого с историческими данными

Вы создаете содержимое, включающее исторические данные или события, где точность важна для поддержания доверия и предотвращения неверной информации.

Пример запроса API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Ожидаемый результат:

API обнаруживает необоснованную дату 1065 и исправляет ее на 1066 на основе источника основания. Ответ содержит исправленный текст: "The Battle of Hastings occurred in 1066."

Сводка внутренней документации

Вы суммируете внутренние документы, в которых имена продуктов, номера версий или другие определенные точки данных должны оставаться согласованными.

Пример запроса API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Ожидаемый результат:

Функция исправления определяет SuperWidget v2.1 как необоснованную и обновляет ее на SuperWidget v2.2 в ответе. Ответ возвращает исправленный текст: "Our latest product is SuperWidget v2.2."

Лучшие практики

Придерживайтесь следующих рекомендаций при настройке систем RAG, чтобы получить лучшую производительность из API обнаружения приземления:

  • При работе с именами продуктов или номерами версий используйте основные источники непосредственно из внутренних релизных заметок или официальной документации по продуктам, чтобы обеспечить точность.
  • Для исторического содержимого перекрестно проверяйте ваши опорные источники с доверенными академическими или историческими базами данных, чтобы гарантировать наивысший уровень точности.
  • В динамичной среде, такой как финансы, всегда используйте самые последние и надежные источники данных, чтобы ваша система ИИ предоставляла точную и своевременную информацию.
  • Всегда убедитесь, что ваши основные источники являются точными и актуальными, особенно в чувствительных областях, таких как здравоохранение. Это сводит к минимуму риск ошибок в процессе суммирования.

Ограничения

Доступность языка

В настоящее время API обнаружения заземления поддерживает содержимое английского языка. Хотя наш API не ограничивает отправку содержимого, отличного от английского языка, мы не можем гарантировать тот же уровень качества и точности в анализе другого языкового содержимого. Мы рекомендуем пользователям отправлять содержимое на английском языке, чтобы обеспечить наиболее надежные и точные результаты api.

Ограничения длины текста

Смотри требования к входным данным для ограничения максимальной длины текста.

Доступность по регионам

Чтобы использовать этот API, необходимо создать ресурс безопасности содержимого Искусственного интеллекта Azure в поддерживаемых регионах. См. доступность региона.

Ограничения скорости

См. сведения о тарифах запросов.

Если вам нужна более высокая ставка, обратитесь к нам, чтобы запросить его.

Следующие шаги

Следуйте краткому руководству, чтобы начать использовать безопасность контента Azure AI для обнаружения обоснованности.