Поделиться через


Что такое Microsoft Fabric?

Microsoft Fabric — это платформа аналитики, которая поддерживает комплексные рабочие процессы данных, включая прием данных, преобразование, обработку потоков в режиме реального времени, аналитику и отчеты. Она предоставляет интегрированные возможности, такие как проектирование данных, фабрика данных, обработка и анализ данных, аналитика в режиме реального времени, хранилище данных и базы данных, которые работают над общей моделью вычислений и хранилища.

Fabric предоставляется как платформа SaaS и использует OneLake в качестве централизованного логического озера данных для хранения и доступа к данным для всех рабочих нагрузок. В тандеме с OneLake каталог OneLake предоставляет централизованный интерфейс для обнаружения, изучения и управления артефактами аналитики и данных в клиенте. Возможности искусственного интеллекта встроены на платформу для поддержки подготовки, анализа и разработки данных, снижения необходимости интеграции служб вручную и обеспечения эффективного анализа крупномасштабных данных.

Замечание

  • Мастер-класс "Аналитик Fabric за один день" (FAIAD) — это бесплатное, практическое обучение для аналитиков, работающих с Power BI и Fabric. Получите практический опыт анализа данных и создания отчетов с помощью Fabric. В семинаре рассматриваются основные понятия, такие как работа с lakehouses, создание отчетов и анализ данных в среде Fabric.
  • Присоединитесь к новой пользовательской панели Fabric, чтобы оставлять отзывы и вносить свой вклад в развитие Fabric и Power BI. Участвуйте в опросах и сессиях 1:1 с продуктовой командой. Дополнительные сведения и регистрация на панели пользователей Fabric.

Возможности Ткань

Microsoft Fabric предоставляет несколько интегрированных возможностей:

  • Рабочие нагрузки для конкретных ролей: Fabric предлагает различные рабочие нагрузки для инженеров данных, специалистов по обработке и анализу данных, бизнес-аналитиков и администраторов баз данных. Каждая рабочая нагрузка предоставляет средства, API и пользовательские интерфейсы, оптимизированные для распространенных задач, таких как прием данных, преобразование, моделирование, запросы и отчеты. Они также могут объединяться в одном решении для поддержки комплексных сценариев.

  • OneLake (хранилище): Все рабочие нагрузки Fabric работают над OneLake, унифицированным логическим озером данных, созданным в Azure Data Lake Storage. OneLake обеспечивает общий доступ к данным между рабочими нагрузками, не требуя перемещения или дублирования данных.

  • Поддержка Copilot: Fabric включает функции Copilot, которые помогают с такими задачами, как создание запросов, конвейеров и кода, создание сводок и аналитических сведений, а также ускорение распространенных рабочих процессов разработки и анализа.

  • Интеграция Microsoft 365: Fabric интегрируется с приложениями Microsoft 365, что позволяет анализировать и использовать данные в таких средствах, как Excel и совместно использовать их с помощью инструментов для совместной работы, таких как Microsoft Teams.

  • Интеграция Microsoft Foundry: Fabric интегрируется с Microsoft Foundry, чтобы использовать предварительно созданные модели и средства для сценариев машинного обучения и искусственного интеллекта, включая разработку моделей, развертывание и вывод.

  • Единое управление данными и управление: Fabric предоставляет централизованные возможности обнаружения данных, управления доступом и управления, помогая организациям управлять доступом к данным, совместному использованию и соответствию требованиям в рабочих нагрузках.

Архитектура Microsoft Fabric

На следующей схеме показано, как Microsoft Fabric основана на платформе saaS, которая объединяет несколько возможностей аналитики в одной среде.

диаграмма фундамента программного обеспечения как услуги под разными сценариями использования Fabric.

В верхней части схемы находятся основные рабочие нагрузки Fabric, такие как фабрика данных, аналитика, базы данных, аналитика в реальном времени, IQ и Power BI. Каждая рабочая нагрузка предоставляет специализированные возможности, адаптированные к различным задачам аналитики, но все рабочие нагрузки работают в одной среде Fabric и могут совместно использовать данные и артефакты без дублирования.

Под этими рабочими нагрузками находится уровень платформы Fabric, предоставляющий общие службы, которые используются согласованно в различных интерфейсах:

  • OneLake — это централизованное, логическое озеро данных для Fabric. Все рабочие процессы хранят и получают доступ к данным через OneLake, что позволяет использовать паттерны доступа без копирования и сохранять данные в исходном расположении при повторном использовании в различных интерфейсах.

  • Copilot предоставляет помощь ИИ, внедренную непосредственно в рабочие нагрузки Fabric, чтобы помочь в разработке, изучении и выполнении стандартных задач разработки, при соблюдении границ клиента, данных и разрешений.

  • Управление представляет централизованное администрирование и управление данными, включая разрешения, метки конфиденциальности и аудит. Эти элементы управления применяются автоматически и наследуются между элементами Fabric. Управление осуществляется с помощью Purview, встроенного в Fabric. Microsoft Fabric центрирует возможности управления и обнаружения в каталоге OneLake, который служит единым центром для поиска, анализа, защиты и использования необходимых элементов Fabric и управления данными, которыми вы владеете. Вы можете оценить состояние управления, получить рекомендуемые действия и повысить доверие к данным и соответствие требованиям в рабочих областях и доменах. Дополнительные сведения см. в разделе "Что такое каталог OneLake?".

Эта основа SaaS позволяет выполнять комплексные сценарии аналитики, такие как прием данных с помощью фабрики данных, обработка их с помощью рабочих нагрузок в режиме разработки или в режиме реального времени, а также визуализация их в Power BI без ручной интеграции отдельных служб или управления базовой инфраструктурой. Fabric централизует обнаружение, администрирование и управление данными с встроенным Microsoft Purview для реализации согласованной безопасности и соответствия требованиям на платформе.

Компоненты Microsoft Fabric

Microsoft Fabric предлагает следующие рабочие нагрузки, настроенные для определенной роли и задачи:

  • Power BI — Power BI позволяет подключаться к источникам данных, создавать интерактивные диаграммы и панели мониторинга, а также обмениваться аналитическими сведениями в организации. Это позволяет владельцам бизнеса получать доступ ко всем данным в Fabric быстро и эффективно, что позволяет лучше принимать решения, ориентированные на данные. Дополнительные сведения см. в разделе Что такое Power BI?

  • Базы данных — базы данных в Fabric — это удобная для разработчика транзакционная база данных, например База данных SQL Azure, которая позволяет легко создавать операционную базу данных в Fabric. С помощью возможности зеркального отображения можно объединить данные из различных систем в OneLake. Вы можете непрерывно реплицировать существующую инфраструктуру данных непосредственно в OneLake от Fabric, включая данные из таких источников, как база данных SQL Azure, Azure Cosmos DB, Azure Databricks, Snowflake и база данных SQL Fabric. Дополнительные сведения см. в базе данных SQL в Microsoft Fabric и Что такое зеркальное отображение в Fabric?

  • Фабрика данных. Фабрика данных предоставляет современный опыт интеграции данных для приема, подготовки и преобразования информации из широкого набора источников данных. Он включает простоту Power Query, и вы можете использовать более 200 собственных соединителей для подключения к источникам данных в локальной среде и в облаке. Дополнительные сведения см. в статье Что такое фабрика данных в Microsoft Fabric?

  • Отраслевые решения — Fabric предоставляет решения для обработки данных, относящиеся к отрасли, которые решают уникальные отраслевые потребности и проблемы, а также включают управление данными, аналитику и принятие решений. Дополнительные сведения см. в разделе Отраслевые решения в Microsoft Fabric.

  • Аналитика в реальном времени анализирует данные по мере их поступления, такие как показания датчиков Интернета вещей, журналы приложений или кликстримы веб-сайтов. Это позволяет извлекать аналитические сведения, визуализацию и действие для данных в движении, обрабатывая прием данных, преобразование, хранение, моделирование, аналитику, визуализацию, отслеживание, ИИ и действия в режиме реального времени. Центр Real-Time в области Real-Time аналитики предоставляет широкий спектр соединителей без кода, сводящихся в каталог организационных данных, которые защищены, управляются и интегрированы в Fabric. Для получения дополнительной информации см. раздел Что такое аналитика в реальном времени в Fabric?.

  • Инженерия данных — Структура данных Fabric предоставляет Apache Spark для обработки больших наборов данных с записными книжками и инструментами для записи и планирования заданий преобразования данных. Она позволяет создавать, управлять и оптимизировать инфраструктуру для сбора, хранения, обработки и анализа больших объемов данных. Интеграция Fabric Spark с Фабрикой данных позволяет планировать и оркестрировать записные книжки и задания Spark. Дополнительные сведения см. в статье Что такое проектирование данных в Microsoft Fabric?

  • Анализ данных Fabric — Анализ данных Fabric позволяет создавать, развертывать и использовать модели машинного обучения в среде Fabric. Она интегрируется с Машинным обучением Azure для обеспечения встроенного отслеживания экспериментов и реестра моделей. Специалисты по обработке и анализу данных могут расширить организационные данные с помощью прогнозов и бизнес-аналитиков, которые могут интегрировать эти прогнозы в свои отчеты бизнес-аналитики, что позволяет перейти от описательных к прогнозной аналитике. Дополнительные сведения см. в статье Что такое обработка и анализ данных в Microsoft Fabric?

  • Хранилище данных Fabric — хранилище данных Fabric обеспечивает лидирующую в отрасли производительность и масштабируемость SQL. Он отделяет вычислительные ресурсы от хранилища, обеспечивая независимое масштабирование обоих компонентов. Кроме того, он изначально сохраняет данные в открытом формате Delta Lake. Дополнительные сведения см. в статье Что такое хранение данных в Microsoft Fabric?

  • IQ (предварительная версия) — IQ (предварительная версия) — это новая рабочая нагрузка для объединения бизнес-семантики между данными, моделями и системами. В нем представлен новый элемент ontology для организации основных бизнес-концепций и правил в единый семантический слой. Эта онтология подключается к данным OneLake и существующим семантическим моделям, чтобы создать динамическую, структурированную, подключенную модель работы вашего бизнеса и предлагает граф управляемых свойств с метками, готовый к использованию ИИ. IQ обеспечивает согласованные решения, многократно используемые метрики и автоматизацию с учетом контекста на платформе Fabric. Дополнительные сведения см. в разделе "Что такое IQ (предварительная версия)"?

Fabric помогает организациям и отдельным лицам анализировать свои данные и создавать отчеты, панели мониторинга и модели машинного обучения. Она реализует архитектуру сетки данных. Дополнительные сведения см. в разделе Что такое сетка данных?

OneLake: объединение лейкхаусов

Платформа Microsoft Fabric объединяет архитектуру OneLake и lakehouse на предприятии.

OneLake

Озеро данных является основой для всех рабочих нагрузок Fabric. В Fabric это озеро называется OneLake. OneLake встроен в платформу и служит одним хранилищем для всех данных организации.

OneLake основан на ADLS (Azure Data Lake Storage) 2-го поколения. Он предоставляет единый интерфейс SaaS и хранилище на уровне клиента для данных, которые служат как профессиональным, так и гражданским разработчикам. Это упрощает взаимодействие с пользователем, удалив сведения о сложной инфраструктуре, такие как группы ресурсов, RBAC, Azure Resource Manager, избыточность или регионы. Для использования Fabric не требуется учетная запись Azure.

OneLake предотвращает использование силосов данных, предлагая единую систему хранения, которая упрощает обнаружение данных, совместное использование и согласованное применение политик. Дополнительные сведения см. в разделе Что такое OneLake?

Иерархия данных OneLake и Lakehouse

Иерархическая структура OneLake упрощает управление на уровне организации. Fabric по умолчанию включает в себя OneLake, поэтому предварительное развертывание не требуется. Каждый клиент получает один унифицированный OneLake с одним пространством имен файловой системы, которое охватывает пользователей, регионы и облака. OneLake упорядочивает данные в контейнеры для простой обработки. Клиент сопоставляется с корнем OneLake и находится на верхнем уровне иерархии. В клиенте можно создать несколько рабочих областей (например, папок).

На следующем рисунке показано, как Структура хранит данные в OneLake. Для каждого арендатора может быть несколько рабочих пространств, и в каждом из них — несколько озерных домов. Lakehouse — это коллекция файлов, папок и таблиц, которая выступает в качестве базы данных в озере данных. Чтобы узнать больше, см. Что такое lakehouse?.

диаграмма иерархии таких элементов, как lakehouses и семантические модели в рабочей области у клиента.

Каждый разработчик и бизнес-подразделение в арендаторе создают собственные рабочие области в OneLake. Они загружают данные в озерохранилища и начинают обрабатывать, анализировать и работать вместе с данными как с помощью OneDrive в Microsoft Office.

Real-Time концентратор: объединение потоков данных

Центр Real-Time — это основное место для потоковых данных. Он предоставляет единый интерфейс SaaS и логическое место для потоковой передачи данных на уровне клиента. Он перечисляет данные из каждого источника, позволяя пользователям обнаруживать, получать, управлять и реагировать на них. Он содержит как потоки, так и таблицы базы данных KQL . Потоки включают потоки данных, источники Microsoft (такие как Центр событий Azure, Центр Интернета вещей Azure, Azure SQL Database CDC (сбор измененных данных), Azure Cosmos DB CDC, Azure Data Explorer и PostgreSQL DB CDC), события Fabric (события элементов рабочей области, события OneLake, и события задания), а также события Azure, включая события хранилища Blob-объектов Azure и внешние события из Microsoft 365 или других облачных служб.

Центр Real-Time упрощает обнаружение, прием, управление и использование данных из различных источников для совместной работы и разработки приложений потоковой передачи в одном месте. Дополнительные сведения см. в разделе Что такое центр Real-Time?

Вычислительные движки Fabric

Все вычислительные возможности Microsoft Fabric предварительно настроены с помощью OneLake, например приложения Office автоматически используют организацию OneDrive. Такие возможности, как проектирование данных, хранилище данных, фабрика данных, Power BI и Real-Time intelligence, используют OneLake в качестве собственного хранилища без дополнительной настройки.

Диаграмма различных возможностей Fabric, которые все используют одно хранилище данных OneLake.

OneLake позволяет мгновенно подключить существующие аккаунты PaaS-хранилищ с помощью функции Ссылка. Вам не нужно переносить существующие данные. Сочетания клавиш обеспечивают прямой доступ к данным в Azure Data Lake Storage. Они также позволяют легко обмениваться данными между пользователями и приложениями без дублирования файлов. Кроме того, можно создать ярлыки для других систем хранения, что позволяет анализировать кросс-облачные данные с помощью интеллектуального кэширования, что снижает затраты на исходящий трафик и приближает данные к вычислительным ресурсам.

Решения Fabric для независимых поставщиков программного обеспечения

Если вы являетесь независимым поставщиком программного обеспечения (ISV) и хотите интегрировать свои решения с Microsoft Fabric, вы можете использовать один из следующих путей на основе требуемого уровня интеграции:

  • Интегрируйте ваше решение с OneLake Foundation и создайте основные подключения и взаимодействие с Fabric.
  • Разработка на платформе Fabric — Создайте своё решение на базе платформы Fabric или без проблем интегрируйте функции Fabric в существующие приложения. С помощью этого параметра можно легко использовать возможности Fabric.
  • Создание рабочей нагрузки Fabric — создание настраиваемых рабочих нагрузок и возможностей в Fabric, адаптация предложений для максимально эффективной работы в экосистеме Fabric.

Для получения дополнительной информации см. экосистему партнеров Fabric ISV .