Поделиться через


Настройка качества данных для зеркальных баз данных Fabric

Как решение репликации данных, зеркальное отображение в Fabric — это недорогое решение с низкой задержкой для объединения данных из различных систем в единую платформу аналитики. Вы можете непрерывно реплицировать существующее пространство данных непосредственно в OneLake структуры, включая данные из базы данных Azure SQL, Azure Cosmos DB и Snowflake.

Зеркальное отображение в Fabric позволяет пользователям пользоваться комплексным продуктом, предназначенным для упрощения аналитических потребностей. Зеркальное отображение — это недорогое решение с низкой задержкой, которое позволяет создать реплика данных в OneLake, что делает их доступными для всех аналитических потребностей. Дополнительные сведения о зеркальных отображениях структуры см. в документации по Fabric.

Настройка качества данных для зеркальной базы данных Fabric

  1. Включите зеркальное отображение в клиенте Fabric. Администраторы Power BI могут включить или отключить зеркальное отображение для всей организации или для определенных групп безопасности с помощью параметра на портале администрирования Power BI. Зеркальное отображение включается путем создания безопасного подключения к рабочему источнику данных. Вы выбираете, следует ли реплицировать всю базу данных или отдельные таблицы, а зеркальное отображение будет автоматически поддерживать синхронизацию данных. После настройки данные будут непрерывно реплицироваться в OneLake для использования аналитики.

  2. После включения зеркального отображения и инициированной репликации убедитесь, что репликация зеркального отображения успешно завершена.

  3. Откройте конечную точку аналитики SQL.

    Снимок экрана: переход по конечной точке SQL.

  4. На вкладке Отчеты выберите Автоматическое обновление семантической модели.

    Автоматическое обновление семантической модели.

  5. Создайте Lakehouse в рабочей области Fabric, если она не создана.

  6. Создайте ярлык Fabric из этой зеркальной базы данных в lakehouse.

  7. Перейдите к Схема данных Microsoft Purview и выполните сканирование карты данных в этом озерном доме; игнорируйте зеркальную базу данных. Используйте проверку подлинности субъекта-службы.

    Используйте субъект-службу для сканирования карты данных.

  8. После завершения проверки свяжите новые ресурсы данных (таблицы Lakehouse) с продуктом данных. Обязательно выберите таблицы Lakehouse для связывания с продуктом данных.

  9. Связав зеркальные таблицы как таблицы Lakehouse с продуктом данных, вы можете профилировать и измерять качество данных всех зеркальных таблиц в виде таблиц Lakehouse в Microsoft Purview.

  10. В области Качество данныхуправления Heath в Единый каталог выполните проверку качества данных или профилируйте данные в обычном режиме.

Важно!

  • Используйте субъект-службу для сканирования карт данных и управляемое удостоверение для проверки качества данных.
  • Выберите зеркальную базу данных вместо отдельных таблиц.
  • Обновление семантической модели при каждом добавлении новой таблицы в зеркальную базу данных.
  • Если зеркальные таблицы базы данных недоступны в Fabric Lakehouse, обратитесь в службу поддержки Fabric.
  • Проверка качества данных поддерживается только для файлов Delta Lakehouse, Iceberg и Parquet.