Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описаны рекомендации по настройке агента данных для предоставления точных, релевантных и полезных ответов на вопросы пользователей. Задав четкие инструкции по уровню агента и источнику данных, вы можете руководствоваться тем, как агент интерпретирует запросы, выбирает источники данных и создает ответы. Вы узнаете, как определить цель агента, определить приоритеты источников данных, включить ключевую терминологию и предоставить логику запросов для распространенных сценариев. Эти советы по настройке помогают обеспечить надежное выполнение агента в различных средах данных и потребностях пользователей.
Сведения о различных типах конфигураций агента данных см. в разделе конфигураций агента данных.
1. Подготовьте данные для искусственного интеллекта
Чтобы агент данных смог создать точные запросы, важно, чтобы источники данных, таблицы и столбцы использовали четкие и описательные имена. Избегайте расплывчатых или универсальных меток, таких как Table1
, col1
или flag
, что может затруднить агент интерпретировать намерение пользователя.
❌ Менее эффективны:
- Имена таблиц:
Table1
,Table2
- Имена столбцов:
col1
,status
flag
✅ Лучший:
- Имена таблиц:
CustomerOrders
, ,SalesTransactions
ProductCatalog
OrderItems
- Имена столбцов:
customer_email_address
,order_submission_date
product_unit_price
Описательное именование помогает агенту понять структуру данных и повысить качество созданных запросов.
2. Создание специализированных агентов для определенных доменов
Для повышения точности и релевантности разрабатывайте агентов данных, ориентированных на конкретный домен или вариант использования, вместо того, чтобы пытаться справиться с широким спектром вопросов. Специализированные агенты можно оптимизировать с помощью целевых инструкций, соответствующих источников данных и терминологии конкретного домена, что делает их более надежными и эффективными.
❌ Менее эффективен: Агент данных общего назначения, который отвечает на различные вопросы, связанные с клиентом, для различных пользовательских персонажей
✅ Лучший: Агент данных, предназначенный для поддержки команды руководства, сочетая аналитические сведения из нескольких источников данных для подготовки к собранию
Сужая фокус агента, вы улучшаете его способность создавать точные ответы и уменьшать неоднозначность в интерпретации запросов.
3. Свести к минимуму область источника данных
Включите только источники данных, необходимые для ответа на ожидаемые вопросы пользователя. В каждом источнике данных выберите только определенные таблицы и столбцы, относящиеся к вашему варианту использования. Более ориентированная конфигурация повышает способность агента создавать точные и эффективные запросы.
❌ Менее эффективны: Подключение всей модели Lakehouse или модели со всеми таблицами и столбцами
✅ Лучший: Выбор только основных таблиц и столбцов, необходимых для распространенных запросов
Подсказка
Для оптимального результата ограничьте число таблиц до 25 или меньше для заданного источника данных.
4. Будьте конкретны о том, что делать, а не только о том, что не делать
Вместо того, чтобы указать, что агент должен избегать, предоставьте четкое руководство по правильному подходу. Это помогает агенту реагировать более эффективно и избегает неоднозначности в обработке пограничных случаев.
❌
Менее эффективны: Не предоставляйте устаревшие сведения о оплате или предполагайте отсутствие данных.
✅
Лучший: Всегда предоставляйте самые последние сведения о оплате, доступные в официальной системе заработной платы. Если оплата отсутствует или не полная, сообщите сотруднику, что вы не можете найти текущие записи, и порекомендуйте ему обратиться в отдел кадров для получения дополнительной помощи.
5. Определение бизнес-терминов, аббревиаций и синонимов
Чтобы агент данных правильно интерпретировал вопросы, определите все термины, которые могут быть неоднозначными, определенными организацией или конкретными доменами. Эти определения помогают агенту применять согласованную логику и создавать точные ответы, особенно если вопросы пользователя ссылаются на внутреннюю терминологию или аналогичные понятия.
Примеры определения
- Аналогичные понятия:
"calendar year"
vs."fiscal year"
- Распространенные бизнес-термины:
"quarter"
,"sales"
,"SKU"
"shoes"
- Аббревиатуры или акронимы:
"NPS"
(Net Promoter Score),"MAU"
(Ежемесячные Активные Пользователи)
Место размещения определений
- Инструкции на уровне агента. Используйте это для определений, которые применяются ко всем источникам данных и запросам (например, что представляет "квартал").
- Инструкции по источнику данных: используйте это для определений, относящихся к тому, как термин используется в определенном наборе данных (например, "продажи", определенные по-разному в разных системах).
6. Используйте направляющие слова для формирования запросов
В инструкции по источнику данных можно включить указания или фрагменты синтаксиса SQL/DAX/KQL, чтобы управлять моделью создания запросов в определенном формате. Эти "ведущие слова" помогают агенту определить правильную логику при переводе естественного языка в код.
❌
Менее эффективны:
Найдите все продукты с названиями, в которых есть "байк".
✅
Лучший:
Найдите все товары с именами, содержащими "велосипед"
LIKE '%bike%'
Включение фрагментов синтаксиса, таких как LIKE '%...%'
помогает модели распознать, что в запросе ожидается предложение сопоставления шаблонов. Этот метод повышает точность созданного SQL, особенно при обработке частичных совпадений, фильтров или соединений.
7. Написание четких, ориентированных инструкций; избегайте ненужных сведений
Инструкции должны быть краткими и целеустремленными. Включите только сведения, необходимые для создания точных ответов агентом. Избегайте расплывчатого, устаревшего или чрезмерно широкого содержания, которое вызывает путаницу или рассеивает внимание агента.
❌ Менее эффективны:
You are an HR data agent who should try to help employees with all kinds of questions about work. You have access to many systems, like the HRIS platform, old payroll databases from previous vendors, archived employee files, scanned PDF policy documents, and maybe even some spreadsheets that HR used in the past. If someone asks about their pay, you might want to look in one of the old systems if needed. Also, sometimes data isn't updated immediately, so just do your best. Remember that the company reorganized in 2017, so department names might be different before then. Try to be friendly, but also make sure you don’t seem robotic. Sometimes HR policies change, so answers might not always be the same depending on the date. Just explain if something seems complicated.
Почему это менее эффективно?
- Область слишком широка ("все виды вопросов о работе")
- Ссылается на устаревшие или ненадежные источники (например, "старые базы данных заработной платы")
- Не хватает приоритета источников данных
- Вводит ненужный исторический контекст
- Создает неоднозначность с фразами, такими как "просто сделать все возможное"
- Не хватает четкого руководства по обработке отсутствующих или сложных данных
✅ Лучший:
You are an HR Assistant Agent responsible for answering employee questions about employment status, job details, pay history, and leave balances.
Use the official HR data warehouse to retrieve current and accurate records.
If data is missing or unclear, inform the user and recommend they contact HR for further support.
Keep responses concise, professional, and easy for employees to understand.
Почему это лучше?
- Уточнение области полномочий и обязанностей агента
- Ссылается на правильный источник данных без перегрузки технических сведений
- Обеспечивает четкое резервное поведение
- Устанавливает тон и стиль общения
- Оставляет подробности на уровне таблицы в инструкции к источнику данных
8. Написать подробные инструкции для управления данными
Инструкции агента определяют, как агент интерпретирует вопросы пользователя, выбирает источники данных и форматирует ответы. Используйте этот раздел, чтобы четко описать роль агента, ожидаемое поведение, тон и способ обработки различных типов запросов. Включите конкретные сведения о предполагаемых вариантах использования, предпочитаемых источниках данных и резервном поведении при отсутствии информации.
Подсказка
При написании инструкций агента спросите себя: кто-то не знакомый с этими источниками данных сможет понять, какие источники использовать и как использовать их на основе инструкций? Если нет, перезапустите инструкции, чтобы включить отсутствующий контекст.
❌ Менее эффективны:
You are an agent that helps with HR topics.
Find answers if possible.
Try not to give wrong information.
If you cannot find something, you can tell the user to check elsewhere.
Answer employee questions about work, pay, and other topics using available systems.
Keep responses professional.
✅ Лучший:
## Tone and style
Use clear, simple, and professional language.
Sound friendly and helpful, like an internal HR support agent.
Avoid technical jargon unless it's part of the business terminology used in the data.
## General knowledge
You are an HR Assistant Agent designed to help employees access accurate information about their employment, benefits, and pay.
Only answer questions using the official HR data sources provided.
If multiple records exist, prioritize the most recent and most official source.
Do not guess or assume answers—if information is missing or unclear, advise the employee to contact HR directly.
## Data source descriptions
- **Employee Data Warehouse**: Contains employment records including status, role, start date, and department.
- **Payroll System**: Contains pay history, compensation details, and tax withholding information.
- **Benefits Enrollment Database**: Includes information about health insurance, retirement plans, and other employee benefits.
- **HR Policy Lakehouse**: Stores official company policies, including holidays, leave policies, and onboarding documents.
## When asked about
- **Employment status (e.g., active, on leave, terminated)**: Use the *Employee Data Warehouse*
- **Pay history or compensation**: Use the *Payroll System*
- **Benefits and enrollment details**: Use the *Benefits Enrollment Database*
- **Company holidays and leave of absence policies**: Use the *HR Policy Lakehouse*
9. Укажите подробные инструкции по источнику данных
Инструкции по источнику данных должны быть конкретными, структурированными и описательными. Они управляют агентом в формировании точных запросов, определяя порядок упорядочения данных, соответствующих таблиц и столбцов, а также способ обработки связей между таблицами.
Используйте этот раздел, чтобы описать следующее:
- Назначение источника данных
- Какие типы вопросов он предназначен для ответа
- Обязательные столбцы для включения в ответы
- Логика соединения таблиц
- Типичные форматы данных (например, сокращения или полные названия)
Подсказка
Представьте себе нового члена команды, использующего этот набор данных в первый раз, может ли он писать правильный запрос, следуя этим инструкциям?
Если нет, добавьте отсутствующий контекст, проясните предположения или включите примеры запросов для их руководства.
Подсказка
Агент данных не может видеть отдельные значения строк перед выполнением запроса.
Чтобы управлять логикой фильтрации, включите примеры типичных значений и форматов — например, укажите, использует ли столбец State
сокращения, такие как "CA"
, или полные имена, как "California"
.
❌ Менее эффективны:
## General instructions
Use the EmployeeData warehouse to find answers about employees.
Try to get useful employee details when needed.
### Employment status
You can use the EmployeeStatusFact table.
Join to EmployeeDim if necessary.
✅ Лучший:
## General instructions
Use the EmployeeData data warehouse to answer questions related to employee details, employment status, pay history, and organizational structure.
When generating queries:
• Use EmployeeDim as the primary table for employee details.
• Always include the following columns in the response (if available):
- EmployeeID
- EmployeeName
- EmploymentStatus
- JobTitle
- DepartmentName
• Join other tables to EmployeeDim using EmployeeID unless otherwise specified.
• Filter for the most recent records when applicable.
Example values:
- EmploymentStatus: "Active", "On Leave", "Terminated"
- DepartmentName: "Finance", "HR", "Engineering"
- State: Use U.S. state abbreviations like "CA", "NY", "TX"
## When asked about
When asked about **employee status**, use the `EmployeeStatusFact` table.
Join it to `EmployeeDim` on `EmployeeID`.
Filter by the most recent `StatusEffectiveDate` and return the following columns: `EmploymentStatus`, `StatusEffectiveDate`, `EmployeeName`, and `DepartmentName`.
When asked about **current job title or department**, use the `EmployeeDim` table.
Return `JobTitle` and `DepartmentName`.
If multiple records exist, filter for the record where `IsCurrent = True`.
10. Использование примеров запросов для выражения сложной логики запросов
Используйте примеры запросов, чтобы помочь агенту данных понять, как создавать точные запросы, особенно если логика сложна или имеет нюансы. Эти примеры действуют как шаблоны, которые агент может обобщать, даже если вопрос пользователя не соответствует точному совпадению.
- Включите примеры запросов для распространенных или репрезентативных типов вопросов.
- Сосредоточьтесь на примерах, в которых логика запроса включает фильтрацию, присоединение, агрегирование или обработку дат.
- Оставьте структуру четкой и хорошо форматируемой, используя правильный синтаксис для источника данных (SQL, DAX или KQL).
- Вам не нужно воспроизводить вопросы пользователей дословно; примеры должны показывать намерение и структуру.
Подсказка
Предоставление хорошо сформированного запроса часто является более понятным и более эффективным, чем попытка объяснить сложную логику только по тексту.
Использование примеров запросов
Для каждого вопроса пользователя агент данных выполняет поиск сходства векторов , чтобы получить первые 3 наиболее подходящих примеров запросов. Затем они включаются в дополненную подсказку агента, чтобы направлять генерацию запросов.
Дальнейшие шаги
- концепция агента данных
- сценарий агента данных
- Общие сведения о конфигурациях агента данных
- Адаптация итеративного процесса к разработке агентов данных