Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Чтобы настроить Dynamics 365 Customer Insights - Data, сначала доведите исходные данные для обработки. Customer Insights - Data предоставляет несколько типов соединителей данных для подключения и приема данных из широкого набора источников.
В этой статье описаны параметры, которые могут повлиять на производительность приема данных.
Формат дельта
Формат данных Delta — это собственный формат обработки, используемый Customer Insights - Data. Если вы можете предоставить исходные данные в формате Delta, это имеет множество преимуществ.
- Лучшая эффективность с Customer Insights - Data: Customer Insights - Data использует разностный формат.
- Более быстрый прием данных: формат Delta обеспечивает превосходное сжатие для более быстрой передачи данных.
- Более быстрое объединение: благодаря функции перемещения во времени Delta Customer Insights - Data объединяет только те данные, которые были изменены. Весь набор данных не обрабатывается повторно. Для инкрементной унификации все входные данные для унификации должны быть в формате Delta.
- Меньше проблем с повреждением данных: формат Delta уменьшает количество поврежденных разделов и распространенных проблем с повреждением данных, вызванных старыми форматами, такими как формат с разделителями-запятыми (CSV).
- Более надежная конструкция управления данными: формат Delta не требует ручного обновления файлов манифестов, схем и разделов.
- Более высокая достоверность данных: формат Delta обеспечивает атомарность, согласованность, изоляцию, надежность (ACID) транзакций и уровни изоляции в Spark.
Формат Delta можно использовать в следующих соединителях:
Delta — это термин, введенный с Delta Lake, основой для хранения данных и таблиц на платформе Databricks Lakehouse. Delta Lake — это слой хранения с открытым исходным кодом, который обеспечивает транзакции ACID (атомарность, согласованность, изоляция и надежность) для рабочих нагрузок больших данных. Дополнительные сведения см. на странице документации по Delta Lake.
Вложение или импорт источника данных
Ключевым моментом при выборе способа приема данных является то, присоединяется ли соединитель к данным или создает их копии. При использовании Customer Insights - Data рекомендуется использовать соединитель, который подключается к данным. В этом случае доступ к данным осуществляется напрямую, когда приходит время их обработки. При использовании соединителя, который копирует данные, при обновлении данных могут возникать задержки.
Следующие соединители данных подключаются к вашим данным:
- Azure Data Lake Storage Delta-таблицы
- таблицы Общей модели данных Azure Data Lake Storage
- Microsoft Dataverse
- Azure Synapse Analytics (предварительная версия)
Если вы не можете использовать соединитель, который подключается к данным, скопируйте данные с помощью одного из соединителей Power Query. Power Query предоставляет полезный способ преобразования данных.
Профилирование данных
При приеме данных Customer Insights — Data выполняет базовое профилирование данных. Например, он профилирует частоту повторяющихся значений в столбце. Вы можете использовать данные профиля, чтобы понять свои данные и решить проблемы. Например, если вы сопоставляете столбец FullName, профиль данных может помочь вам обнаружить, что значение по умолчанию Введите свое имя появляется в 10 000 строк. Таким образом, если вы соответствуете этому значению, совпадают 10 000 строк, которые не должны соответствовать. При добавлении озера данных Azure, таблиц Delta или источников данных Azure Synapse вы можете включить профилирование данных для большего количества столбцов.
После приема данных просмотрите результаты профилирования данных.
Перейдите к Данные>Таблицы, и выберите таблицу. Затем в строке для поля (например)
DateOfBirthв столбце Сводка выберите значок Сводка.
Проверьте сведения на наличие ошибок или пропущенных значений.
Замечание
Профилирование данных создается в рамках задачи подготовки данных и выполняется отдельно для каждого источника данных. Если задача подготовки данных не завершена успешно, столбец сводки недоступен для затронутого источника данных. Результаты профилирования данных могут быть недоступны для всех столбцов. Задача подготовки данных имеет максимальное время выполнения в три часа. Чтобы запросить увеличение этого ограничения, обратитесь в службу поддержки Майкрософт.
Страница «Источники данных»
На странице Источники данных перечисляются источники данных в двух разделах:
- Управляются мной: потоки данных Microsoft Power Platform, созданные и управляемые мной. Другие пользователи могут только просматривать эти потоки данных. Они не могут редактировать, обновлять или удалять их.
- Управляемые другими: Microsoft Power Platform Dataflows, созданные другими администраторами. Вы можете только просматривать эти потоки данных. В этом разделе указан владелец каждого потока данных, чтобы вы могли связаться с ним в случае необходимости.
Замечание
Другие пользователи могут просматривать и использовать все таблицы. Хотя каждый источник данных принадлежит пользователю, создавшему его, каждый пользователь Customer Insights - Data может использовать все таблицы, полученные в результате приема данных.