Руководство: запрос и визуализация данных из записной книжки

В этом руководстве описано, как использовать записную книжку Azure Databricks для запроса примеров данных, хранящихся в каталоге Unity, с помощью SQL, Python, Scala и R, а затем визуализировать результаты запроса в записной книжке.

Требования

Чтобы выполнить задачи в этой статье, необходимо выполнить следующие требования:

Рабочая область должна включать каталог Unity. Сведения о начале работы с каталогом Unity см. в статье "Начало работы с каталогом Unity".
Необходимо иметь разрешение на использование существующего вычислительного ресурса или создать новый вычислительный ресурс. См. руководства по началу работы с Azure Databricks или обратитесь к вашему администратору Databricks.

Шаг 1. Создание записной книжки

Чтобы создать записную книжку в рабочей области, нажмите кнопку "Создать" на боковой панели и нажмите кнопку "Записная книжка". Пустая записная книжка открывается в рабочей области.

Дополнительные сведения о создании записных книжек и управлении ими см. в статье Управление записными книжками.

Шаг 2. Запрос таблицы

Запросите таблицу samples.nyctaxi.trips в каталоге Unity с помощью выбранного языка.

Скопируйте и вставьте следующий код в новую пустую ячейку записной книжки. Этот код отображает результаты запроса samples.nyctaxi.trips таблицы в каталоге Unity.

SQL
```
SELECT * FROM samples.nyctaxi.trips
```
Питон
```
display(spark.read.table("samples.nyctaxi.trips"))
```
язык программирования Scala
```
display(spark.read.table("samples.nyctaxi.trips"))
```
Р
```
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
```
Нажмите Shift+Enter , чтобы запустить ячейку, а затем перейдите к следующей ячейке.

Результаты запроса отображаются в записной книжке.

Шаг 3. Отображение данных

Отображение средней суммы тарифа по расстоянию поездки, сгруппированную по zip-коду пикапа.

Рядом с вкладкой "Таблица " щелкните + и щелкните " Визуализация".

Откроется редактор визуализации.
В раскрывающемся списке " Тип визуализации" убедитесь, что выбрана панель .
Выберите fare_amount для столбца X.
Выберите trip_distance столбец Y.
Выберите Average в качестве типа агрегирования.
Выберите pickup_zip в качестве группы по столбцу.
Нажмите кнопку Сохранить.

Следующие шаги

Сведения о добавлении данных из CSV-файла в каталог Unity и визуализации данных см. в руководстве по импорту и визуализации данных CSV из записной книжки.
Сведения о загрузке данных в Databricks с помощью Apache Spark см. в руководстве по загрузке и преобразованию данных с помощью кадров данных Apache Spark.
Дополнительные сведения о приеме данных в Databricks см. в статье "Стандартные соединители" в Lakeflow Connect.
Дополнительные сведения о запросе данных с помощью Databricks см. в статье "Запрос данных".
Дополнительные сведения о визуализациях см. в разделе "Визуализации" в записных книжках Databricks и редакторе SQL.
Дополнительные сведения о методах анализа аналитических данных (EDA) см. в руководстве по методам EDA с помощью записных книжек Databricks.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2025-05-03

Поделиться через