Поделиться через


Использование GraphFrames в Azure Databricks

В этой статье приведены примеры записных книжек, которые помогут вам приступить к работе с GraphFrames в Azure Databricks. GraphFrames — это пакет для Apache Spark, предоставляющий графы на основе DataFrame. Он предоставляет высокоуровневые API для Java, Python и Scala, Она предназначена для предоставления функциональных возможностей GraphX и расширенных функциональных возможностей, используя возможности DataFrames Spark для этого. Эти расширенные возможности включают поиск «Motif», сериализацию на основе DataFrame и высоко выразительные запросы графов.

В этой статье содержится три примера записных книжек: вводная записная книжка, доступная в Python и в Scala, а также руководство пользователя Python. Для дополнительных примеров использования GraphFrames с Scala см. руководство пользователя GraphFrames — Scala.

Рекомендация по среде выполнения Databricks для GraphFrames

Databricks рекомендует использовать кластер со средой Databricks Runtime для Машинного обучения, так как он включает оптимизированную установку GraphFrames.

Если вы не используете кластер под управлением Databricks Runtime ML, скачайте JAR-файл из библиотеки GraphFrames, загрузите его в том и установите его в кластер.

Начало работы с GraphFrames

В следующих записных книжках показано, как использовать ГрафФреймы для выполнения анализа графов.

Анализ графов с помощью GraphFrames (Python)

Получите ноутбук

Анализ графов с помощью GraphFrames (Scala)

Получите ноутбук

Руководство пользователя GraphFrames (Python)

В следующей записной книжке приведены примеры кода Python по использованию GraphFrames.

Записная книжка GraphFrames на Python

Получите ноутбук