Поделиться через


Качество данных для зеркальных баз данных Microsoft Fabric

Как решение репликации данных, зеркальное отображение в Fabric — это недорогое решение с низкой задержкой для объединения данных из различных систем в единую платформу аналитики. Вы можете непрерывно реплицировать существующее пространство данных непосредственно в OneLake структуры, включая данные из базы данных Azure SQL, Azure Cosmos DB и Snowflake.

Зеркальное отображение в Fabric позволяет пользователям пользоваться комплексным продуктом, предназначенным для упрощения аналитических потребностей. Созданное для открытости и совместной работы между корпорацией Майкрософт и технологическими решениями, которые могут читать формат разностной таблицы озера с открытым кодом, зеркальное отображение — это недорогое решение с низкой задержкой, которое позволяет создать реплика данных в OneLake, который можно использовать для всех ваших аналитических потребностей. Дополнительные сведения о зеркальных отображениях структуры см. в документации по Fabric.

Настройка качества данных для зеркальной базы данных Fabric

  1. Включите зеркальное отображение в клиенте Fabric. Администраторы Power BI могут включить или отключить зеркальное отображение для всей организации или для определенных групп безопасности с помощью параметра на портале администрирования Power BI. Зеркальное отображение включается путем создания безопасного подключения к рабочему источнику данных. Вы выбираете, следует ли реплицировать всю базу данных или отдельные таблицы, а зеркальное отображение будет автоматически поддерживать синхронизацию данных. После настройки данные будут непрерывно реплицироваться в OneLake для использования аналитики.

  2. После включения зеркального отображения и инициированной репликации убедитесь, что репликация зеркального отображения успешно завершена.

  3. Откройте конечную точку аналитики SQL.

    Снимок экрана: переход по конечной точке SQL.

  4. На этой странице перейдите на вкладку Отчеты и выберите Автоматическое обновление семантической модели.

    Автоматическое обновление семантической модели.

  5. Перейдите на страницу Схема данных Microsoft Purview и проверьте источник данных. Используйте проверку подлинности субъекта-службы.

    Используйте субъект-службу для сканирования карты данных.

  6. После завершения сканирования свяжите новые ресурсы данных с продуктом данных для проверки и оценки качества данных.

  7. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Важно!

  • Используйте субъекты-службы для сканирования карт данных и управляемое удостоверение для проверки качества данных.
  • Если зеркальные таблицы базы данных недоступны в Fabric Lakehouse, обратитесь в службу поддержки Fabric.
  • Проверка качества данных поддерживается только для разностных таблиц Lakehouse и файлов Parquet.
  • Сбор метаданных в Purview для субартифактов Fabric Lakehouse является улучшением, основанным на сборе метаданных для Fabric, который был выпущен в декабре 2023 г. Эта функция находится на этапе закрытой предварительной версии .
  • Команда Fabric зависит от того, чтобы отличать ярлыки от собственных элементов в пакете SDK OneLake для Подартифактов Lakehouse. В настоящее время все ярлыки (таблицы и файлы) будут рассматриваться в качестве собственных элементов при проверке. Чтобы включить оценку DQ данных fabric lakehouse, необходимо разрешить список клиентов.