Поделиться через


Руководство по Microsoft Fabric для пользователей Power BI

В этом руководстве вы узнаете, как использовать Microsoft Fabric для подготовки, загрузки и моделирования данных для отчетов Power BI. Вы будете использовать потоки данных 2-го поколения для приема и преобразования данных в Lakehouse, оркестрации обновлений данных с помощью конвейеров и создания трехмерной модели с помощью режима Direct Lake. Наконец, вы автоматически создадите отчет для визуализации последних данных о продажах.

Изучив это руководство, вы сможете выполнить следующие действия:

  • Подготовка и загрузка данных в lakehouse
  • Организация процесса обработки данных для обновления данных и отправки сообщения электронной почты в случае сбоя.
  • Создание семантической модели в Lakehouse
  • Автоматическое создание отчета с помощью быстрого создания

Необходимые компоненты

Перед началом работы убедитесь, что имеется следующее:

Создание lakehouse для хранения данных

Начните с создания lakehouse для хранения данных. Вы будете использовать Dataflows Gen2 для подготовки и преобразования данных и поток данных для оркестрации запланированных обновлений и уведомлений по электронной почте.

  1. В рабочей области выберите новый элемент в верхней части страницы.

    Снимок экрана: выбор нового элемента в рабочей области.

  2. На экране создания нового элемента найдите или выберите Lakehouse.

    Снимок экрана страницы создания Lakehouse.

  3. Введите SalesLakehouse в качестве имени (имена могут содержать буквы, цифры и символы подчеркивания, но не специальные символы или пробелы), а затем нажмите кнопку "Создать".

    Снимок экрана: поле ввода имени Lakehouse.

  4. В редакторе Lakehouse выберите новый поток данных 2-го поколения на ленте.

    Примечание.

    Кроме того, выберите " Получить данные " на ленте, а затем выберите "Создать поток данных 2-го поколения".

    Снимок экрана, на котором показан раскрывающийся список

  5. Присвойте потоку данных OnlineSalesDataflow (используйте только буквы, цифры и подчеркивания), а затем нажмите кнопку "Создать".

Подготовка и загрузка данных в lakehouse с помощью потоков данных 2-го поколения

  1. В редакторе Power Query Online для потоков данных 2-го поколения выберите импорт из шаблона Power Query и выберите файл шаблона ContosoSales.pqt , скачанный в предварительных требованиях.

    Снимок экрана: импорт шаблона Power Query.

  2. Выберите запрос DimDate в группе загрузки данных . Если появится запрос, выберите "Настроить подключение", установите для проверки подлинности анонимную проверку подлинности и нажмите кнопку "Подключить".

  3. Выбрав DimDate , в предварительном просмотре данных найдите столбец DateKey . Выберите значок типа данных в заголовке столбца и выберите дату и время в раскрывающемся списке.

    Снимок экрана: изменение типов данных в редакторе Power Query.

  4. В окне "Изменить тип столбца" выберите "Заменить текущий".

Настройка назначений данных

  1. Выбрав DimDate , просмотрите параметры назначения данных в правом нижнем углу. Наведите указатель мыши на настроенный Lakehouse, чтобы просмотреть его свойства.

    Созданный вами Lakehouse является местом назначения для всех таблиц. Метод обновления по умолчанию — Replace, который перезаписывает предыдущие данные во время каждого обновления.

    Снимок экрана: раздел назначения данных и параметры конфигурации.

  2. Выберите таблицу FactOnlineSales и просмотрите параметры назначения данных.

    Так как источник FactOnlineSales часто изменяется, оптимизируйте обновления путем добавления новых данных. Уберите текущее назначение данных, выбрав иконку X. Не удаляйте пункты назначения для других таблиц.

    Снимок экрана раздела изменения назначения данных и значка настроек.

  3. Пока FactOnlineSales все еще выбран, выберите значок +, чтобы добавить назначение данных, а затем выберите Lakehouse.

    Если появится запрос, установите проверку подлинности на учетную запись организации и выберите Далее.

    Снимок экрана: раздел изменения назначения данных и значок параметров.

  4. В навигаторе выберите рабочую область и разверните ее, чтобы просмотреть все элементы Lakehouse . Выберите SalesLakehouse и убедитесь, что выбрана новая таблица , а затем нажмите кнопку "Далее".

    Снимок экрана: окно целевого навигатора назначения.

  5. На панели параметров назначения данных снимите флажок "Использовать автоматические параметры", задайте для метода update значение "Добавить" и выберите "Сохранить параметры".

    Примечание.

    Метод Append добавляет новые строки в таблицу во время каждого обновления, сохраняя существующие данные.

    Снимок экрана: выбор меню параметров назначения.

  6. На вкладке "Главная" нажмите кнопку "Сохранить и запустить".

    Снимок экрана: кнопка сохранения и запуска в Power Query Online.

  7. Чтобы выйти из редактора Power Query Online, выберите иконку X на элементе OnlineSalesDataflow в левой боковой панели.

    Примечание.

    При выборе X редактор закрывается, но не удаляется поток данных.

    Снимок экрана: кнопка закрытия в Power Query Online.

Оркестрация конвейера данных

Автоматизация обновления потока данных и обработка ошибок путем отправки настраиваемой электронной почты Outlook с ключевыми сведениями.

  1. В рабочей области выберите новый элемент.

    Снимок экрана: выбор нового элемента в рабочей области.

  2. На экране создания нового элемента найдите или выберите конвейер данных.

    Снимок экрана: выбор конвейера данных в качестве нового элемента.

  3. Назовите конвейер SalesPipeline и нажмите кнопку "Создать".

    Снимок экрана поля ввода имени конвейера.

  4. В редакторе конвейера выберите действие конвейера, а затем выберите поток данных.

    Примечание.

    Вы также можете выбрать поток данных на ленте.

    Снимок экрана добавления активности Dataflow в конвейер.

  5. Выберите действие потока данных в редакторе конвейера. В разделе Общие установите Имя как OnlineSalesActivity.

    Снимок экрана: присвоение имени активности потока данных.

  6. Выбрав действие потока данных, перейдите в раздел "Параметры " и выберите OnlineSalesDataflow из списка потоков данных. При необходимости выберите значок "Обновить" , чтобы обновить список.

    Снимок экрана: выбор потока данных в параметрах действия.

  7. Перейдите на вкладку "Действия" , а затем добавьте действие Office365 Outlook .

    Примечание.

    Если появится запрос на предоставление согласия , нажмите кнопку "ОК", войдите с учетной записью организации и разрешите доступ.

    Снимок экрана: добавление действия Office365 Outlook.

  8. Выберите действие Office365 Outlook в редакторе конвейера. В разделе "Общие" задайте Имя на "Почта при сбое".

    Снимок экрана: процесс именования действия в Outlook в Office365.

  9. Выбрав действие Office365 Outlook, перейдите в раздел "Параметры". Введите адрес электронной почты в поле To и задайте Тему как Ошибка конвейера. Для основного текста почты выберите Просмотр в конструкторе выражений.

    Примечание.

    Дополнительные параметры электронной почты, такие как From (Send as), Cc, Bcc и Метка конфиденциальности, доступны в разделе "Дополнительные свойства".

    Снимок экрана: параметры действий Office365 Outlook.

  10. В построителе выражений конвейера вставьте следующее выражение в текстовый блок в верхней части страницы:

    @concat(
        'Pipeline: '
        , pipeline().PipelineId
        , '<br>'
        , 'Workspace: '
        , pipeline().WorkspaceId
        , '<br>'
        , 'Time: '
        , utcnow()
    )
    

    Это выражение динамически вставляет идентификатор конвейера, идентификатор рабочей области и текущее время UTC в текст электронной почты.

  11. В редакторе конвейера выберите OnlineSalesActivity. Перетащите из ручки "X" (При сбое) и опустите его на Отправка почты при сбое действие. Это гарантирует отправку сообщения электронной почты, если активность потока данных завершается ошибкой.

    Снимок экрана настройки пути при сбое.

  12. На вкладке "Главная" выберите "Расписание". Настройте расписание следующим образом, а затем нажмите кнопку "Применить".

    Имя. Значение
    Запланированное выполнение Включено
    Повторить Ежедневно
    Время 00:00:00
  13. На вкладке "Главная" выберите "Выполнить". Если появится запрос, нажмите кнопку "Сохранить и запустить ", чтобы продолжить.

    Чтобы отслеживать состояние конвейера, просмотрите таблицу выходных данных , которая отображает ход выполнения действия. Таблица обновляется автоматически или вы можете выбрать значок обновления, чтобы обновить его вручную.

    Снимок экрана: прогресс активности конвейера.

  14. Когда состояние отображается успешно, вернитесь в рабочую область, чтобы продолжить работу с руководством.

    Снимок экрана: возвращение в рабочую область.

Создание семантической модели в Lakehouse

Загруженные данные почти готовы для создания отчетов. Затем используйте таблицы в lakehouse для создания семантической модели — слоя метаданных, который упорядочивает и преобразует физические данные в логические объекты. Семантическая модель предназначена для отражения бизнес-структуры и упрощения анализа данных.

  1. В представлении рабочей области выберите элемент SalesLakehouse .

    Снимок экрана: элемент Lakehouse в рабочем пространстве.

  2. В "Проводнике" на вкладке Главная выберите Новую семантическую модель.

  3. В окне новой семантической модели назовите модель SalesModel. Затем разверните схему dbo и группу таблиц . Выберите следующие таблицы и нажмите кнопку "Подтвердить".

    Имя таблицы
    DimCustomer
    DimDate
    DimEmployee
    DimProduct
    ДимСтор
    FactOnlineSales

    Снимок экрана, показывающий элемент Lakehouse в рабочей области.

Создание отношений

Эта модель использует звёздную схему, распространённую в хранилищах данных. Центр звезды — это таблица фактов, окруженная таблицами измерений, связанными с таблицей Фактов.

  1. Создайте связь путем перетаскивания столбца CustomerKey из таблицы FactOnlineSales в столбец CustomerKey таблицы DimCustomer .

  2. В окне "Создать связь " убедитесь в следующих параметрах, а затем нажмите кнопку "Подтвердить".

    Активировать связь Из: таблица 1 (столбец) К: Таблица 2 (столбец) Кратность Направление перекрестной фильтрации
    FactOnlineSales (КлючКлиента) DimCustomer (CustomerKey - ключ клиента) Многие к одному (*:1) Одна
  3. Повторите эти действия для каждой из следующих связей:

    Активировать связь Из: таблица 1 (столбец) К: Таблица 2 (столбец) Кратность Направление перекрестной фильтрации
    FactOnlineSales (КлючПродукта) DimProduct (ProductKey) Многие к одному (*:1) Одна
    FactOnlineSales (StoreKey) DimStore (StoreKey) Многие к одному (*:1) Одна
    FactOnlineSales (DateKey) DimDate (КлючДата) Многие к одному (*:1) Одна
    DimStore (StoreKey) DimEmployee (StoreKey) Многие к одному (*:1) Оба

    На следующем рисунке показано готовое представление семантической модели со всеми связями.

    Снимок экрана: связи таблиц в области представления модели.

Запись меры в DAX

Создайте базовую меру, чтобы вычислить общую сумму продаж.

  1. Выберите таблицу FactOnlineSales и на вкладке "Главная " выберите "Создать меру".

  2. В редакторе формул введите следующую меру DAX, а затем выберите флажок для подтверждения:

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Снимок экрана: выбор флажка для фиксации меры DAX.

Автоматическое создание отчета

Теперь, когда вы смоделировали данные, вы можете быстро визуализировать и изучить их с помощью функции быстрого создания.

  1. Вернитесь в рабочую область, выбрав ее на панели слева. Наведите указатель мыши на элемент SalesModel , выберите многоточие (...) и выберите автоматический отчет.

    Снимок экрана: параметр

    Отчет автоматически создается и обновляется динамически на основе выбранных столбцов на панели данных .

    Снимок экрана: готовый отчет об автоматическом создании.

  2. Нажмите кнопку "Сохранить " на ленте, чтобы сохранить копию в текущей рабочей области.

    Примечание.

    Чтобы запустить полнофункциональный визуальный редактор, выберите Изменить на ленте.

Узнать больше о быстром создании.

Поздравляем с завершением работы с руководством! Если вы создали выделенную рабочую область для этого руководства, вы можете удалить ее или удалить отдельные элементы, созданные во время процесса.

В этом руководстве показано, как пользователи Power BI могут легко выявлять аналитические сведения в любом масштабе с помощью Microsoft Fabric.