Проекты служб Data Quality Services (DQS)
Проект служб Службы Data Quality Services (DQS) предназначен для использования базы знаний для повышения качества источника данных путем выполнения операций очистки данных и сопоставления данных с последующим экспортом результирующих данных в базу данных SQL Server или файл .csv. Вы можете создать проект служб DQS как проект очистки или проект сопоставления для выполнения соответствующих операций. Проекты очистки и сопоставления вы можете выполнять с использованием одной базы знаний, так как знания для очистки и сопоставления данных могут быть встроены в ту же базу знаний.
Проект служб DQS имеет следующие преимущества.
Позволяет выполнять очистку данных в источнике данных, используя знания в базе знаний DQS.
Позволяет выполнять сопоставление данных в источнике данных, используя политику сопоставления в базе знаний.
Предоставляет мастер, помогающий выполнить операции очистки и сопоставления данных, и экспорт данных в базу данных SQL Server или файл CSV по выбору пользователя. Администратор данных использует проект служб DQS для запуска автоматических и интерактивных шагов очистки и сопоставления данных и для управления ими.
В этом разделе
Проект служб DQS: операция очистки
Проект служб DQS: операция сопоставления
Профилирование данных и уведомления
Проект служб DQS: операция очистки
Проект очистки данных позволяет очистить исходные данные на основе базы знаний. Операция очистки данных в службах DQS представляет собой двухэтапный процесс.
Автоматический процесс очистки данных, который анализирует исходные данные, сравнивая их со знаниями в базе знаний, и предлагает изменения. Обработанные данные разбиваются службами DQS на категории (предложенные, новые, недопустимые, исправленные и правильные) и выдаются пользователю для дальнейшей обработки.
В интерактивном процессе очистки диспетчер данных может одобрить, отвергнуть или изменить данные, предложенные автоматическим процессом очистки данных.
Дополнительные сведения об очистке данных в проекте служб DQS см. в разделе Очистка данных.
[Top]
Проект служб DQS: операция сопоставления
Проект сопоставления данных позволяет выполнить операцию сопоставления на основе политики сопоставления в базе знаний с целью предотвратить дублирование данных путем определения точных и приблизительных совпадений. Таким образом, пользователь может удалить дублированные данные. Рекомендуется очистить данные перед их сопоставлением. Для этого:
Создайте проект служб DQS, выберите операцию Очистка, выполните операцию очистки исходных данных, а затем экспортируйте их в таблицу в базе данных SQL Server.
Создайте другой проект служб DQS с использованием базы знаний, содержащей политику сопоставления, выберите операцию Сопоставление, а затем на странице Сопоставить выберите базу данных и таблицу, в которую экспортированы данные, очищенные на шаге 1.
Выполните операцию сопоставления над очищенными данными.
Подробные сведения об операции сопоставления в проекте служб DQS см. в разделе Сопоставление данных.
[Top]
Профилирование данных и уведомления
Во время операций очистки и сопоставления данных в проекте качества данных вы можете получать статистику и информацию о данных, обрабатываемых службами DQS, в реальном времени. Профилирование данных поможет оценить эффективность процессов очистки и сопоставления и определить, насколько очистка и сопоставление помогли улучшить качество данных. Профилирование служб DQS предоставляет два измерения качества данных: полнота (степень, в которой представлены данные) и точность (степень, в которой данные могут использоваться по намеченному назначению). Кроме того, на основе профилирования данных пользователю выдаются уведомления о действиях, которые можно предпринять для улучшения операций очистки и сопоставления данных. Дополнительные сведения о профилировании данных и уведомлениях см. в разделе Профилирование данных и уведомления в DQS.
[Top]
Связанные задачи
Описание задачи |
Раздел |
---|---|
Описывает создание проекта служб DQS. |
|
Описывает, как управлять (открывать, разблокировать, переименовывать и удалять) проектом служб DQS. |
Управление проектом служб DQS (открытие, разблокировка, переименование и удаление) |
Описывает, как открыть проект служб Integration Services в Клиент Data Quality. |