Анализ данных в Azure Data Lake Storage 2-го поколения с помощью Power BI
В этой статье вы узнаете, как использовать Power BI Desktop для анализа и визуализации данных, хранящихся в учетной записи хранения с иерархическим пространством имен (Azure Data Lake Storage 2-го поколения).
Необходимые компоненты
Для работы с этим учебником необходимо следующее:
- Подписка Azure. Перейдите на сайт бесплатной пробной версии Azure.
- Учетная запись хранения с иерархическим пространством имен. Следуйте инструкциям по созданию учетной записи хранения. В этой статье предполагается, что вы создали учетную запись хранения с именем
contosoadlscdm
. - Убедитесь, что для учетной записи хранения предоставлена одна из следующих ролей: средство чтения данных BLOB-объектов, участник данных BLOB-объектов или владелец данных BLOB-объектов.
- Пример файла данных с именем
Drivers.txt
, расположенного в учетной записи хранения. Этот пример можно скачать из репозитория Azure Data Lake Git, а затем отправить этот файл в учетную запись хранения. - Power BI Desktop. Это приложение можно скачать из Центра загрузки Майкрософт.
Создание отчета в Power BI Desktop
Запустите Power BI Desktop на своем компьютере.
Следуйте инструкциям из статьи соединителя Azure Data Lake Storage 2-го поколения, чтобы подключиться к примеру данных.
В Навигаторе Power Query выберите "Загрузить".
После успешной загрузки данных в Power BI на панели "Поля " отображаются следующие поля.
Однако для визуализации и анализа данных может потребоваться, чтобы данные были доступны с помощью следующих полей.
В следующих шагах вы обновите запрос, чтобы преобразовать импортированные данные в нужный формат.
На вкладке "Главная " на ленте выберите "Преобразовать данные". Затем откроется редактор Power Query, отображающий содержимое файла.
В редакторе Power Query в столбце "Содержимое" выберите "Двоичный". Файл будет автоматически обнаружен как CSV-файл и будет содержать выходные данные, как показано ниже. Данные теперь имеют формат, который можно использовать для создания визуализаций.
На вкладке "Главная " на ленте нажмите кнопку "Закрыть" и " Применить".
После обновления запроса на вкладке "Поля " отображаются новые поля, доступные для визуализации.
Теперь можно создать круговую диаграмму для представления драйверов в каждом городе для определенной страны или региона. Для этого выполним указанные ниже действия.
На вкладке "Визуализации" выберите символ круговой диаграммы .
В этом примере столбцы, которые вы будете использовать, — "Столбец 4" (имя города) и "Столбец 7" (имя страны или региона). Перетащите эти столбцы на вкладку "Поля " на вкладку "Визуализации" , как показано ниже.
Круговая диаграмма должна выглядеть примерно так, как показано ниже.
Если выбрать определенную страну или регион из фильтров уровня страницы, отобразится количество драйверов в каждом городе выбранной страны или региона. Например, на вкладке Визуализации в списке Фильтры уровня страницы выберите Бразилия.
Круговая диаграмма автоматически обновится, и вы увидите количество водителей в городах Бразилии.
В меню "Файл" выберите "Сохранить", чтобы сохранить визуализацию в виде файла Power BI Desktop.
Публикация отчета в службе Power BI
После создания визуализаций в Power BI Desktop вы можете поделиться ими с другими пользователями, публикуя их в служба Power BI. Инструкции по этой настройке см. в статье "Публикация из Power BI Desktop".