Поделиться через


Анализ данных в Azure Data Lake Storage 2-го поколения с помощью Power BI

В этой статье вы узнаете, как использовать Power BI Desktop для анализа и визуализации данных, хранящихся в учетной записи хранения с иерархическим пространством имен (Azure Data Lake Storage 2-го поколения).

Предпосылки

Перед началом работы с этим руководством необходимо иметь следующие предварительные требования:

  • Подписка Azure. Перейдите к получению бесплатной пробной версии Azure.
  • Учетная запись хранения с иерархическим пространством имен. Следуйте инструкциям по созданию учетной записи хранения . В этой статье предполагается, что вы создали учетную запись хранения с именем contosoadlscdm.
  • Убедитесь, что для учетной записи хранения предоставлена одна из следующих ролей: Чтение данных BLOB-объектов, Вкладчик данных BLOB-объектов или Владелец данных BLOB-объектов.
  • Пример файла данных с именем Drivers.txt , расположенного в учетной записи хранения. Этот пример можно скачать из репозитория Azure Data Lake Git, а затем отправить этот файл в учетную запись хранения.
  • Power BI Desktop. Это приложение можно скачать из Центра загрузки Майкрософт.

Создание отчета в Power BI Desktop

  1. Запустите Power BI Desktop на компьютере.

  2. Чтобы подключиться к пробным данным, следуйте инструкциям из статьи соединителя Azure Data Lake Storage Gen2.

  3. В Навигаторе Power Query выберите "Загрузить".

    Снимок экрана: навигатор с данными из отображаемого файла Drivers.txt.

  4. После успешной загрузки данных в Power BI на панели "Поля " отображаются следующие поля.

    Снимок экрана: панель

    Однако для визуализации и анализа данных может потребоваться, чтобы данные были доступны с помощью следующих полей.

    Снимок экрана: таблица данных с именами и адресами из столбца Content в исходной таблице, отображаемой в строках.

    В следующих шагах необходимо обновить запрос, чтобы преобразовать импортированные данные в нужный формат.

  5. На вкладке "Главная " на ленте выберите "Преобразовать данные". Затем откроется редактор Power Query, отображающий содержимое файла.

    Снимок экрана редактора Power Query с запросом, созданным из исходного Drivers.txt файла.

  6. В редакторе Power Query в столбце "Содержимое" выберите "Двоичный". Файл автоматически обнаруживается как CSV-файл и содержит следующие выходные данные. Теперь данные доступны в формате, который можно использовать для создания визуализаций.

    Снимок экрана редактора Power Query, показывающий данные из двоичного поля, развернутого в таблицу с именами и адресами, с импортированным CSV-файлом и измененным типом, добавленным на панель

  7. На вкладке "Главная " на ленте нажмите кнопку "Закрыть" и "Применить".

    Снимок экрана редактора Power Query с параметром

  8. После обновления запроса на вкладке "Поля " отображаются новые поля, доступные для визуализации.

    Снимок экрана области

  9. Теперь можно создать круговую диаграмму для представления драйверов в каждом городе для определенной страны или региона. Для этого сделайте следующие выборы.

    На вкладке "Визуализации" выберите символ круговой диаграммы.

    Снимок экрана: область

    В этом примере столбцы, которые вы будете использовать, — "Столбец 4" (имя города) и "Столбец 7" (имя страны или региона). Перетащите эти столбцы из вкладки Поля на вкладку Визуализации.

    Снимок экрана с перетаскиванием и отпусканием столбца 4 в разделе

    Круговая диаграмма должна выглядеть так, как на следующем рисунке.

    Снимок экрана: круговая диаграмма, показывающая проценты каждого сегмента, с цветовым кодированием каждого из мест, и столбец, содержащий все места и их цветовой код справа.

  10. Если выбрать определенную страну или регион из фильтров уровня страницы, отображается количество водителей в каждом городе выбранной страны или региона. Например, на вкладке "Визуализации" в разделе "Фильтры уровня страницы" выберите Бразилию.

    Снимок экрана: фильтры на этой панели страницы с бразилией, выбранной в качестве страны или региона для отображения.

  11. Круговая диаграмма автоматически обновляется для отображения драйверов в городах Бразилии.

    Снимок экрана: круговая диаграмма с процентной долей каждого сегмента для локаций в Бразилии, а также список всех локаций в Бразилии и их цветовые коды в столбце справа.

  12. В меню "Файл" выберите "Сохранить ", чтобы сохранить визуализацию в виде файла Power BI Desktop.

Публикация отчета в службе Power BI

После создания визуализаций в Power BI Desktop вы можете поделиться ими с другими пользователями, публикуя их в службе Power BI. Инструкции по этой настройке см. в статье "Публикация из Power BI Desktop".