Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этом руководстве описано, как использовать записную книжку Azure Databricks для запроса примеров данных, хранящихся в каталоге Unity, с помощью SQL, Python, Scala и R, а затем визуализировать результаты запроса в записной книжке.
Требования
Чтобы выполнить задачи в этой статье, необходимо выполнить следующие требования:
- Рабочая область должна включать каталог Unity. Сведения о начале работы с каталогом Unity см. в статье "Начало работы с каталогом Unity".
- Необходимо иметь разрешение на использование существующего вычислительного ресурса или создать новый вычислительный ресурс. См. руководства по началу работы с Azure Databricks или обратитесь к вашему администратору Databricks.
Шаг 1. Создание записной книжки
Чтобы создать записную книжку в рабочей области, нажмите кнопку
"Создать" на боковой панели и нажмите кнопку "Записная книжка". Пустая записная книжка открывается в рабочей области.
Дополнительные сведения о создании записных книжек и управлении ими см. в статье Управление записными книжками.
Шаг 2. Запрос таблицы
Запросите таблицу samples.nyctaxi.trips в каталоге Unity с помощью выбранного языка.
Скопируйте и вставьте следующий код в новую пустую ячейку записной книжки. Этот код отображает результаты запроса
samples.nyctaxi.tripsтаблицы в каталоге Unity.SQL
SELECT * FROM samples.nyctaxi.tripsПитон
display(spark.read.table("samples.nyctaxi.trips"))язык программирования Scala
display(spark.read.table("samples.nyctaxi.trips"))Р
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))Нажмите
Shift+Enter, чтобы запустить ячейку, а затем перейдите к следующей ячейке.Результаты запроса отображаются в записной книжке.
Шаг 3. Отображение данных
Отображение средней суммы тарифа по расстоянию поездки, сгруппированную по zip-коду пикапа.
Рядом с вкладкой "Таблица " щелкните + и щелкните " Визуализация".
Откроется редактор визуализации.
В раскрывающемся списке " Тип визуализации" убедитесь, что выбрана панель .
Выберите
fare_amountдля столбца X.Выберите
trip_distanceстолбец Y.Выберите
Averageв качестве типа агрегирования.Выберите
pickup_zipв качестве группы по столбцу.
Нажмите кнопку Сохранить.
Следующие шаги
- Сведения о добавлении данных из CSV-файла в каталог Unity и визуализации данных см. в руководстве по импорту и визуализации данных CSV из записной книжки.
- Сведения о загрузке данных в Databricks с помощью Apache Spark см. в руководстве по загрузке и преобразованию данных с помощью кадров данных Apache Spark.
- Дополнительные сведения о приеме данных в Databricks см. в статье "Стандартные соединители" в Lakeflow Connect.
- Дополнительные сведения о запросе данных с помощью Databricks см. в статье "Запрос данных".
- Дополнительные сведения о визуализациях см. в разделе "Визуализации" в записных книжках Databricks и редакторе SQL.
- Дополнительные сведения о методах анализа аналитических данных (EDA) см. в руководстве по методам EDA с помощью записных книжек Databricks.