Что такое семантическая связь?

Семантическая связь — это функция, которая позволяет установить соединение между semantic models и Synapse Data Science в Microsoft Fabric. Использование семантической ссылки поддерживается только в Microsoft Fabric.

  • Для среды выполнения Fabric 1.2 (Spark 3.4) и более поздних версий семантическая ссылка доступна в среде выполнения по умолчанию и не требуется устанавливать ее.

  • Чтобы обновить последнюю версию семантической ссылки, выполните следующую команду:

    %pip install -U semantic-link
    

Основными целями семантической связи являются:

  • Упрощение подключения к данным.
  • Включите распространение семантической информации.
  • Простая интеграция с установленными средствами обработки и анализа данных, например записными книжками.

Семантическая связь помогает сохранять знания о семантике данных в стандартизированном режиме, который может ускорить анализ данных и уменьшить ошибки.

Поток данных семантической связи начинается с семантических моделей, содержащих данные и семантические сведения. Семантическая связь мостит разрыв между Power BI и интерфейсом Обработки и анализа данных Synapse.

Диаграмма, показывающая поток данных из Power BI в блокноты Synapse Data Science и обратно в Power BI.

Семантическая связь позволяет использовать семантические модели из Power BI в интерфейсе Обработки и анализа данных Synapse для выполнения таких задач, как подробный статистический анализ и прогнозное моделирование с помощью методов машинного обучения. Выходные данные обработки и анализа данных можно хранить в OneLake с помощью Apache Spark и получать сохраненные выходные данные в Power BI с помощью Direct Lake.

подключение Power BI

Семантическая модель служит одной табулярной объектной моделью которая предоставляет надежные источники для семантических определений, таких как меры Power BI. Семантическая связь подключается к семантической модели в следующих экосистемах, что упрощает работу специалистов по обработке и анализу данных в системе, с которыми они наиболее знакомы.

  • Экосистема Python pandas, с помощью библиотеки SemPy Python.
  • Экосистема Apache Spark с использованием родного соединителя Spark. Эта реализация поддерживает различные языки, включая PySpark, Spark SQL, R и Scala.

Приложения семантической информации

Семантическая информация в данных включает в себя категории Power BI data такие как адрес и почтовый индекс, связи между таблицами и иерархическими сведениями.

Эти категории данных содержат метаданные, которые распространяют семантические связи в среде Synapse Data Science, что позволяет создавать новые возможности и поддерживать происхождение данных.

Ниже приведены примеры приложений семантической связи:

Семантическая связь — это мощный инструмент, позволяющий бизнес-аналитикам эффективно использовать данные в комплексной среде обработки и анализа данных.

Семантическая связь упрощает совместную работу между специалистами по обработке и анализу данных, устраняя необходимость повторного выполнения бизнес-логики, внедренной в меры Power BI. Этот подход гарантирует, что обе стороны могут эффективно и продуктивно работать, максимизируя потенциал их аналитических сведений на основе данных.

Структура данных FabricDataFrame

FabricDataFrame — это основная структура данных, которая использует семантику для распространения семантической информации из семантических моделей в среду Обработки и анализа данных Synapse.

Схема, показывающая поток данных из соединителей в семантические модели в FabricDataFrame в семантические функции.

Класс FabricDataFrame:

  • Поддерживает все операции pandas.
  • Подкласс pandas DataFrame и добавляет метаданные, такие как семантическая информация и происхождение данных.
  • Предоставляет семантические функции и метод add-measure, который позволяет использовать меры Power BI в работе по анализу данных.