Поделиться через


Анализ данных в Azure Data Lake Storage 2-го поколения с помощью Power BI

В этой статье вы узнаете, как использовать Power BI Desktop для анализа и визуализации данных, хранящихся в учетной записи хранения с иерархическим пространством имен (Azure Data Lake Storage 2-го поколения).

Необходимые компоненты

Для работы с этим учебником необходимо следующее:

  • Подписка Azure. Перейдите на сайт бесплатной пробной версии Azure.
  • Учетная запись хранения с иерархическим пространством имен. Следуйте инструкциям по созданию учетной записи хранения. В этой статье предполагается, что вы создали учетную запись хранения с именем contosoadlscdm.
  • Убедитесь, что для учетной записи хранения предоставлена одна из следующих ролей: средство чтения данных BLOB-объектов, участник данных BLOB-объектов или владелец данных BLOB-объектов.
  • Пример файла данных с именем Drivers.txt , расположенного в учетной записи хранения. Этот пример можно скачать из репозитория Azure Data Lake Git, а затем отправить этот файл в учетную запись хранения.
  • Power BI Desktop. Это приложение можно скачать из Центра загрузки Майкрософт.

Создание отчета в Power BI Desktop

  1. Запустите Power BI Desktop на своем компьютере.

  2. Следуйте инструкциям из статьи соединителя Azure Data Lake Storage 2-го поколения, чтобы подключиться к примеру данных.

  3. В Навигаторе Power Query выберите "Загрузить".

    Снимок экрана: навигатор с данными из файла Drivers.txt.

  4. После успешной загрузки данных в Power BI на панели "Поля " отображаются следующие поля.

    Снимок экрана: панель

    Однако для визуализации и анализа данных может потребоваться, чтобы данные были доступны с помощью следующих полей.

    Снимок экрана: таблица данных с именами и адресами из столбца Content в исходной таблице, отображаемой в строках.

    В следующих шагах вы обновите запрос, чтобы преобразовать импортированные данные в нужный формат.

  5. На вкладке "Главная " на ленте выберите "Преобразовать данные". Затем откроется редактор Power Query, отображающий содержимое файла.

    Снимок экрана редактора Power Query с запросом, созданным из исходного Drivers.txt файла.

  6. В редакторе Power Query в столбце "Содержимое" выберите "Двоичный". Файл будет автоматически обнаружен как CSV-файл и будет содержать выходные данные, как показано ниже. Данные теперь имеют формат, который можно использовать для создания визуализаций.

    Снимок экрана редактора Power Query, показывающий данные из двоичного поля, развернутого в таблицу с именами и адресами, с импортированным CSV-файлом и измененным типом, добавленным на панель

  7. На вкладке "Главная " на ленте нажмите кнопку "Закрыть" и " Применить".

    Снимок экрана: снимок экрана редактора Power Query с параметром

  8. После обновления запроса на вкладке "Поля " отображаются новые поля, доступные для визуализации.

    Снимок экрана: область

  9. Теперь можно создать круговую диаграмму для представления драйверов в каждом городе для определенной страны или региона. Для этого выполним указанные ниже действия.

    На вкладке "Визуализации" выберите символ круговой диаграммы .

    Снимок экрана: область

    В этом примере столбцы, которые вы будете использовать, — "Столбец 4" (имя города) и "Столбец 7" (имя страны или региона). Перетащите эти столбцы на вкладку "Поля " на вкладку "Визуализации" , как показано ниже.

    Снимок экрана с перетаскиванием и удалением столбца в столбце

    Круговая диаграмма должна выглядеть примерно так, как показано ниже.

    Снимок экрана: круговая диаграмма, показывающая проценты каждого среза круговой диаграммы, а также цветовое кодирование каждого расположения, а также столбец, содержащий все расположения и их цветной код справа.

  10. Если выбрать определенную страну или регион из фильтров уровня страницы, отобразится количество драйверов в каждом городе выбранной страны или региона. Например, на вкладке Визуализации в списке Фильтры уровня страницы выберите Бразилия.

    Снимок экрана: фильтры на этой панели страницы с бразилией, выбранной в качестве страны или региона для отображения.

  11. Круговая диаграмма автоматически обновится, и вы увидите количество водителей в городах Бразилии.

    Снимок экрана: круговая диаграмма с процентами каждого среза круговой диаграммы для расположений в Бразилии, а также список всех расположений в Бразилии и их цветной код в столбце справа.

  12. В меню "Файл" выберите "Сохранить", чтобы сохранить визуализацию в виде файла Power BI Desktop.

Публикация отчета в службе Power BI

После создания визуализаций в Power BI Desktop вы можете поделиться ими с другими пользователями, публикуя их в служба Power BI. Инструкции по этой настройке см. в статье "Публикация из Power BI Desktop".

См. также