Что такое структура хранилища для аналитических потоков данных?
Аналитические потоки данных хранят как данные, так и метаданные в Azure Data Lake служба хранилища. Потоки данных используют стандартную структуру для хранения и описания данных, созданных в озере, которая называется папками Common Data Model. В этой статье вы узнаете больше о стандарте хранилища, который потоки данных используются за кулисами.
служба хранилища требуется структура для аналитического потока данных
Если поток данных является стандартным, данные хранятся в Dataverse. Dataverse похожа на систему базы данных; Он имеет концепцию таблиц, представлений и т. д. Dataverse — это структурированное хранилище данных, используемое стандартными потоками данных.
Однако, если поток данных является аналитическим, данные хранятся в Azure Data Lake служба хранилища. Данные и метаданные потока данных хранятся в папке Common Data Model. Так как у учетной записи хранения может быть несколько потоков данных, в ней представлена иерархия папок и вложенных папок, помогающих упорядочить данные. В зависимости от продукта, в который был создан поток данных, папки и вложенные папки могут представлять рабочие области (или среды), а затем папку Common Data Model потока данных. В папке Common Data Model хранятся как схема, так и данные таблиц потоков данных. Эта структура соответствует стандартам, определенным для общей модели данных.
Что такое структура хранилища common Data Model?
Общая модель данных — это структура метаданных, определенная для обеспечения соответствия и согласованности для использования данных на нескольких платформах. Общая модель данных не является хранилищем данных, это способ хранения и определения данных.
Общие папки модели данных определяют способ хранения схемы таблицы и ее данных. В Azure Data Lake служба хранилища данные организованы в папках. Папки могут представлять рабочую область или среду. В этих папках создаются вложенные папки для каждого потока данных.
Что такое папка потока данных?
Каждая папка потока данных содержит вложенную папку для каждой таблицы и файла метаданных с именем model.json
.
Файл метаданных: model.json
Файл model.json
— это определение метаданных потока данных. Это один файл, содержащий все метаданные потока данных. Он содержит список таблиц, столбцов и их типов данных в каждой таблице, связь между таблицами и т. д. Этот файл можно экспортировать из потока данных легко, даже если у вас нет доступа к структуре папки Common Data Model.
Этот JSON-файл можно использовать для переноса (или импорта) потока данных в другую рабочую область или среду.
Чтобы узнать, что содержит файл метаданных model.json, перейдите в файл метаданных (model.json) для common Data Model.
Файлы данных
Помимо файла метаданных папка потока данных включает другие вложенные папки. Поток данных хранит данные для каждой таблицы в подпапке с именем таблицы. Данные для таблицы могут быть разделены на несколько секций данных, хранящихся в формате CSV.
Как просмотреть или получить доступ к папкам Common Data Model
Если вы используете потоки данных, использующие хранилище, предоставленное продуктом, в который они были созданы, у вас нет доступа к этим папкам напрямую. В таких случаях для получения данных из потоков данных требуется использовать соединитель потока данных Microsoft Power Platform, доступный в интерфейсе получения данных в продуктах служба Power BI, Power Apps и Dynamics 35 Customer Аналитика или в Power BI Desktop.
Чтобы узнать, как работают потоки данных и внутренняя среда Data Lake служба хранилища интеграции, перейдите к потокам данных и интеграции Azure Data Lake (предварительная версия).
Если ваша организация включила потоки данных для использования своей учетной записи Data Lake служба хранилища и была выбрана в качестве целевой цели загрузки для потоков данных, вы по-прежнему можете получить данные из потока данных с помощью соединителя потока данных Power Platform, как упоминание выше. Но вы также можете получить доступ к папке Common Data Model потока данных непосредственно через озеро, даже за пределами инструментов и служб Power Platform. Доступ к озеру возможен через портал Azure, служба хранилища Microsoft Azure Обозреватель или любую другую службу или интерфейс, поддерживающий Azure Data Lake служба хранилища. Дополнительная информация: подключите Azure Data Lake Storage 2 поколения для хранения потоков данных
Следующие шаги
Использование общей модели данных для оптимизации Azure Data Lake Storage 2-го поколения
Добавление папки CDM в Power BI в качестве потока данных (предварительная версия)
Подключение Azure Data Lake Storage 2-го поколения для хранения потока данных
Потоки данных и интеграция Azure Data Lake (предварительная версия)
Configure workspace dataflow settings (Preview) (Настройка параметров потока данных рабочей области (предварительная версия))