Поделиться через


Качество данных для сочетания баз данных Microsoft Fabric

Ярлыки — это объекты в OneLake, указывающие на другие расположения хранилища. Расположение может быть внутренним или внешним для OneLake. Расположение, на которое указывает ярлык, называется целевым путем ярлыка. Расположение, в котором отображается ярлык, называется путь к ярлыку. Ярлыки отображаются в виде папок в OneLake, и все рабочие нагрузки или службы, имеющие доступ к OneLake, могут использовать их.

Сочетания клавиш в Microsoft OneLake позволяют объединить данные между доменами, облаками и учетными записями, создав единое виртуальное озеро данных для всего предприятия. Все возможности и аналитические механизмы Microsoft Fabric могут напрямую подключаться к существующим источникам данных, таким как Azure, Amazon Web Services (AWS) и OneLake, через единое пространство имен. OneLake управляет всеми разрешениями и учетными данными, поэтому вам не нужно отдельно настраивать каждую рабочую нагрузку Fabric для подключения к каждому источнику данных.

Дополнительные сведения о сочетаниях клавиш Microsoft Fabric см. в документации по Fabric.

Настройка качества данных для сочетания баз данных Fabric

Войдите в рабочую область Microsoft Fabric. Нажмите кнопку с многоточием в разделе Таблицы и выберите Создать ярлык. Здесь можно создать:

Снимок экрана: рабочая область Fabric с выделенной кнопкой создания ярлыка.

Ярлык Azure Data Lake 2-го поколения

  1. Выберите ярлык Azure Data Lake Storage 2-го поколения на странице Создание ярлыка рабочей области Fabric.

    Снимок экрана: страница создания ярлыка Fabric с выделенным элементом ADLS 2-го поколения.

  2. Выберите ADLS 2-го поколения проверка подлинности SAS.

    Снимок экрана: новое окно ярлыка с выбранной проверкой подлинности на основе маркера SAS.

  3. Создайте SAS и строка подключения для ресурса ADLS 2-го поколения в портал Azure.

  4. Скопируйте конечную точку озера данных.

    Снимок экрана: копирование конечной точки озера данных в портал Azure.

  5. Добавьте сведения о хранилище для сочетания клавиш.

    Снимок экрана: добавление сведений о хранилище в ярлык Fabric в новом окне ярлыка.

  6. Перейдите к и выберите правильную разностную папку.

    Снимок экрана: выбор правильной разностной папки в новом окне ярлыка.

  7. Предварительный просмотр разностной таблицы сочетаний в рабочей области Fabric.

    Снимок экрана: предварительный просмотр разностной таблицы OneLake.

  8. Запустите проверку ресурса Azure Data Lake 2-го поколения в Схема данных Microsoft Purview с помощью проверки подлинности субъекта-службы.

    Снимок экрана: проверка карты данных для ADLS 2-го поколения.

  9. После завершения сканирования ресурс данных должен отображаться в каталоге данных в виде таблицы lakehouse.

  10. Свяжите ресурс с продуктом данных для проверки и оценки качества данных.

    Снимок экрана: ресурс быстрого доступа к данным в каталоге.

  11. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Ярлык Amazon S3

  1. Выберите Создать ярлык в рабочей области Microsoft Fabric.

  2. Выберите AWS S3 и добавьте URL-адрес, идентификатор ключа доступа и ярлык ключа доступа.

    Снимок экрана: страница нового ярлыка Amazon S3 с добавленными сведениями.

  3. Добавьте URL-адрес подключения и сведения о хранилище.

    Снимок экрана: страница нового ярлыка Amazon S3 с добавленным URL-адресом подключения и сведениями о хранилище.

  4. Просмотрите ярлык в рабочей области Fabric.

  5. Запустите проверку ресурса Amazon S3 в Схема данных Microsoft Purview с помощью проверки подлинности субъекта-службы.

  6. После завершения сканирования ресурс данных должен появиться в каталоге данных.

  7. Свяжите ресурс с продуктом данных для проверки и оценки качества данных.

  8. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Ярлык Google Cloud Storage (GCS)

  1. Выберите Создать ярлык в рабочей области Microsoft Fabric.

  2. Выберите Google Cloud Storage и добавьте URL-адрес, идентификатор ключа доступа и ярлык ключа доступа.

    Снимок экрана: клавиша HMAC для сочетания клавиш GCS.

  3. Добавьте URL-адрес подключения и сведения о хранилище.

    Снимок экрана: URL-адрес подключения GCS.

  4. Просмотрите ярлык в рабочей области Fabric.

  5. Запустите проверку ресурса Amazon S3 в Схема данных Microsoft Purview с помощью проверки подлинности субъекта-службы.

  6. После завершения сканирования ресурс данных должен появиться в каталоге данных.

  7. Свяжите ресурс с продуктом данных для проверки и оценки качества данных.

  8. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Важно!

  • Используйте субъект-службу для сканирования карт данных и управляемое удостоверение для проверки качества данных.
  • Все данные, поданные с помощью ярлыка, будут обрабатываться в том же регионе.
  • Сбор метаданных в Purview для субартифактов Fabric Lakehouse является улучшением, основанным на сборе метаданных для Fabric, который был выпущен в декабре 2023 г. Эта функция находится на этапе закрытой предварительной версии .
  • Команда Fabric зависит от того, чтобы отличать ярлыки от собственных элементов в пакете SDK OneLake для Подартифактов Lakehouse. В настоящее время все ярлыки (таблицы и файлы) будут рассматриваться в качестве собственных элементов при проверке. Чтобы включить оценку DQ данных fabric lakehouse, необходимо разрешить список клиентов.