Поделиться через


Azure Data Lake Storage 2-го поколения

Сводка

Товар Описание
Статус релиза Общая доступность
Продукция Power BI (семантические модели)
Power BI (потоки данных)
Fabric (Dataflow 2-го поколения)
Power Apps (потоки данных)
Dynamics 365 Customer Insights
Службы анализа
Поддерживаемые типы проверки подлинности Учетная запись организации
Ключ учетной записи
Ключ общей подписи доступа (SAS)
Принципал службы
Справочная документация по функциям AzureStorage.DataLake
AzureStorage.DataLakeContents

Замечание

Некоторые возможности могут присутствовать в одном продукте, но не другие из-за расписаний развертывания и возможностей для конкретного узла.

Предпосылки

  • Подписка Azure. Перейдите к получению бесплатной пробной версии Azure.

  • Учетная запись хранения с иерархическим пространством имен. Следуйте инструкциям по созданию учетной записи хранения . В этой статье предполагается, что вы создали учетную запись хранения с именем myadlsg2.

  • Убедитесь, что вам предоставлена одна из следующих ролей для учетной записи хранения: читатель данных BLOB, сотрудник данных BLOB или владелец данных BLOB.

  • Пример файла данных с именем Drivers.txt , расположенного в учетной записи хранения. Этот пример можно скачать из репозитория Azure Data Lake Git, а затем отправить этот файл в учетную запись хранения.

Поддерживаемые возможности

  • Импорт
  • Представление файловой системы
  • Представление папки CDM

Подключение к Azure Data Lake Storage 2-го поколения из Power Query Desktop

  1. Выберите Azure Data Lake Storage 2-го поколения в интерфейсе получения данных. Взаимодействие с данными в Power Query Desktop зависит от приложений. Дополнительные сведения о Power Query Desktop для вашего приложения см. в разделе Где получить данные.

  2. В диалоговом окне Azure Data Lake Storage 2-го поколения укажите URL-адрес учетной записи Azure Data Lake Storage 2-го поколения, контейнера или вложенной папки с использованием формата конечной точки контейнера. URL-адреса для Data Lake Storage 2-го поколения имеют следующий шаблон:

    <https://accountname>.dfs.core.windows.net/<container>/<subfolder>

    Вы также можете выбрать, следует ли использовать представление файловой системы или представление папки Common Data Model.

    Для продолжения выберите ОК.

    Снимок экрана: диалоговое окно Azure Data Lake Storage 2-го поколения с введенным URL-адресом.

  3. Если это первый раз, когда вы используете этот URL-адрес, вам будет предложено выбрать метод проверки подлинности.

    Если выбрать метод учетной записи организации, нажмите кнопку "Войти" , чтобы войти в учетную запись хранения. Вы будете перенаправлены на страницу входа вашей организации. Следуйте инструкциям по входу в учетную запись. После успешного входа нажмите кнопку "Подключить".

    Если выбрать метод ключа учетной записи, введите ключ учетной записи и нажмите кнопку "Подключить".

    Снимок экрана: диалоговое окно входа в Azure Data Lake Storage 2-го поколения с выбранной учетной записью организации и готовой к входу.

  4. В диалоговом окне "Навигатор" отображаются все файлы в указанном URL-адресе. Проверьте сведения и выберите преобразование данных для преобразования данных в Power Query или Load для загрузки данных.

    Снимок экрана: открытие навигатора и хранение данных из файла Drivers.text.

Подключение к Azure Data Lake Storage Gen2 из Power Query Online

  1. Выберите параметр Azure Data Lake Storage 2-го поколения в интерфейсе получения данных. Различные приложения имеют различные способы получения данных в Power Query Online. Дополнительные сведения о том, как воспользоваться функцией получения данных в Power Query Online из вашего приложения, см. в разделе Где получить данные.

    Снимок экрана окна получения данных с выделением Azure Data Lake Storage Gen2.

  2. В разделе "Подключение к источнику данных" введите URL-адрес учетной записи Azure Data Lake Storage 2-го поколения. Ознакомьтесь с ограничениями , чтобы определить используемый URL-адрес.

    Снимок экрана: страница

  3. Выберите, следует ли использовать представление файловой системы или представление папки Common Data Model.

  4. При необходимости выберите локальный шлюз данных в шлюзе данных.

  5. Выберите вход, чтобы войти в учетную запись Azure Data Lake Storage 2-го поколения. Вы будете перенаправлены на страницу входа вашей организации. Следуйте инструкциям по входу в учетную запись.

  6. После успешного входа нажмите кнопку "Далее".

  7. На странице "Выбор данных " отображаются все файлы в url-адресе, который вы указали. Проверьте сведения и выберите "Преобразовать данные ", чтобы преобразовать данные в Power Query.

    Снимок экрана: страница выбора данных, содержащая данные из файла Drivers.text.

Ограничения

Подпапки или файлы не поддерживаются в Power Query Online и Power BI Desktop

В настоящее время в Power Query Online и Power BI Desktop соединитель Azure Data Lake Storage 2-го поколения поддерживает только пути к контейнерам, а не вложенным папкам или файлам. Например, работает https://<accountname>.dfs.core.windows.net/<container>, а https://<accountname>.dfs.core.windows.net/<container>/<filename> или https://<accountname>.dfs.core.windows.net/<container>/<subfolder> может завершиться ошибкой.

Обновление проверки подлинности

Корпорация Майкрософт не поддерживает обновление потока данных или семантической модели с помощью проверки подлинности OAuth2, если учетная запись Azure Data Lake Storage 2-го поколения (ADLS) находится в другом клиенте. Это ограничение применяется только к ADLS, если метод проверки подлинности — OAuth2, то есть при попытке подключиться к межтенантным ADLS с помощью учетной записи идентификатора Microsoft Entra. В этом случае рекомендуется использовать другой метод проверки подлинности, который не является идентификатором OAuth2/Microsoft Entra, например методом проверки подлинности ключа.

Требования к прокси-серверу и брандмауэру

При создании потока данных с помощью шлюза может потребоваться изменить некоторые параметры прокси-сервера или порты брандмауэра для успешного подключения к озеру данных Azure. Если поток данных завершается сбоем при обновлении, привязанном к шлюзу, это может быть вызвано проблемой брандмауэра или прокси-сервера шлюза к конечным точкам хранилища Azure.

Если вы используете прокси-сервер с шлюзом, может потребоваться настроить файл Microsoft.Mashup.Container.NetFX45.exe.config в локальном шлюзе данных. Дополнительные сведения: настройка параметров прокси-сервера для локального шлюза данных.

Чтобы включить подключение из сети к озеру данных Azure, может потребоваться включить список определенных IP-адресов на компьютере шлюза. Например, если в вашей сети есть правила брандмауэра, которые могут блокировать эти попытки, необходимо разблокировать исходящие сетевые подключения для озера данных Azure. Чтобы включить список необходимых исходящих адресов, используйте тег службы AzureDataLake . Дополнительные сведения: теги службы виртуальной сети

Потоки данных также поддерживают возможность создания собственного озера данных, что подразумевает управление вашими разрешениями и явное подключение его к вашему потоку данных. В этом случае при подключении к среде разработки или производственной среде с помощью организационной учетной записи необходимо включить одну из следующих ролей для учетной записи хранения: Blob Data Reader, Blob Data Contributor или Blob Data Owner.

Power Query Online и служба хранилища Azure находятся в одном регионе

Прямой доступ к учетной записи хранения Azure с включенным брандмауэром и в том же регионе, что и Power Query Online, не поддерживается. Это ограничение возникает, так как службы Power Query при развертывании в том же регионе, что и учетная запись хранения Azure, используют частные IP-адреса Azure для связи. Дополнительные сведения см. в документации Azure по безопасности сети хранилища.

Чтобы обойти это ограничение и включить доступ к службе хранилища Azure из Power Query Online в одном регионе, используйте один из следующих методов:

См. также