Поделиться через


Визуализации в записных книжках Databricks и редакторе SQL

Azure Databricks имеет мощные встроенные средства для создания диаграмм и визуализаций непосредственно из данных при работе с записными книжками или редактором SQL. На этой странице объясняется, как создавать, изменять и управлять визуализациями в записных книжках и редакторе SQL. Сведения о визуализациях панелей мониторинга ИИ/BI см. в разделе "Визуализации панелей мониторинга".

Чтобы просмотреть типы визуализаций, которые можно создать из записных книжек или редактора SQL, см. типы визуализаций.

Создать набор данных для визуализации

Чтобы создать результирующий набор, используемый на этой странице, используйте следующий код:

SQL

Выполните следующий запрос в редакторе SQL.

USE CATALOG samples;
   SELECT
      hour(tpep_dropoff_datetime) as dropoff_hour,
      COUNT(*) AS num
   FROM samples.nyctaxi.trips
   WHERE pickup_zip in ['10001', '10002']
   GROUP BY 1;

Питон

Выполните следующий код из ячейки Python в записной книжке.

from pyspark.sql.functions import hour, col

pickupzip = '10001'  # Example value for pickupzip
df = spark.table("samples.nyctaxi.trips")
result_df = df.filter(col("pickup_zip") == pickupzip) \
              .groupBy(hour(col("tpep_dropoff_datetime")).alias("dropoff_hour")) \
              .count() \
              .withColumnRenamed("count", "num")
display(result_df)

Создание новой визуализации

Визуализации можно создать в том же пользовательском интерфейсе, где появится таблица результатов. Если вы работаете в записной книжке, вы также можете создать профиль данных, который предоставляет сводную статистику и визуальные представления для фреймов данных и таблиц. Дополнительные сведения о профилях данных см. в статье "Создание профиля данных".

  1. Чтобы создать визуализацию, щелкните + над результатом и выберите "Визуализация ", чтобы открыть редактор визуализации.

    Редактор SQL

    Таблица результатов редактора SQL с параметром визуализации показана.

    Записная книжка

    Таблица результатов записной книжки с показанной опцией визуализации.

  2. В раскрывающемся списке Тип визуализации выберите тип. Затем выберите данные, которые будут отображаться в визуализации. Редактор визуализаций

  3. После выбора конфигурации нажмите кнопку "Сохранить".

Удаление, дублирование или изменение визуализации

Чтобы удалить, дублировать или изменить визуализацию или профиль данных, щелкните стрелку вниз в правой части имени вкладки. Вы также можете создать панель мониторинга из меню.

Примечание.

Если ячейка содержит профиль данных или выполняет код на языке, отличном от SQL, то соответствующая визуализация и профиль данных могут быть добавлены только на инструментальную панель записной книжки. Для ячеек SQL в раскрывающемся списке появится дополнительный элемент меню "Добавить в панель мониторинга ". См. добавление визуализации впанели мониторинга.

Редактор SQL

Параметры меню визуализации в редакторе SQL.

Записная книжка

Опции меню визуализации в блокноте.

Вы также можете переименовать вкладку, щелкнув по имени и изменив его на месте.

Изменение визуализации

Изменение визуализации:

  1. Щелкните стрелку вниз на вкладке визуализации. Затем щелкните Изменить.
  2. Используйте вкладки в редакторе визуализации для доступа к различным частям диаграммы и их редактированию.

Отфильтровать визуализацию

Чтобы применить фильтр к визуализации, щелкните значок фильтра в правом верхнем углу и введите условия фильтра для применения.

Фильтры, примененные к визуализации, также применяются к таблице результатов. Фильтры, примененные к таблице результатов, также применяются к визуализации.

Применение фильтра к визуализации также фильтрует таблицу результатов.

Клонирование визуализацию

Чтобы клонировать визуализацию, щелкните стрелку вниз на вкладке визуализации. Затем нажмите кнопку "Дублировать".

Включение агрегирования в визуализации

Для гистограмм, линий, областей, круговой диаграммы и диаграмм тепловой карты вы добавляете агрегирование непосредственно в визуализацию, а не изменяете запрос для добавления столбца агрегирования. Такой подход обеспечивает следующие преимущества.

  • Вам не нужно изменять код, который создает таблицу результатов.
  • Изменение агрегирования позволяет быстро выполнять сценарный анализ данных.
  • Агрегат применяется ко всему набору данных, а не только к первым 64000 строкам, отображаемым в таблице.

Агрегат доступен в следующих визуализациях:

  • Линия
  • Бар
  • Площадь
  • Пирог
  • Тепловая карта
  • Гистограмма

Агрегаты не поддерживают комбинированные визуализации, такие как одновременное отображение графика и линейчатой диаграммы.

Для агрегирования столбцов по оси Y для визуализации выполните следующие действия.

  1. Откройте редактор визуализации, создав новую диаграмму или изменив существующую диаграмму. Если отображается сообщение This visualization uses an old configuration. New visualizations support aggregating data directly within the editor, необходимо повторно создать визуализацию, прежде чем можно будет использовать агрегат.

  2. Рядом со столбцами оси Y выберите тип агрегата из следующего списка для числовых типов:

    • Sum (по умолчанию)
    • Среднее значение
    • Численность
    • уникальных элементов
    • Макс
    • мин
    • Медиана

    Либо из следующего списка для строковых типов:

    • Численность
    • уникальных элементов
  3. Нажмите кнопку Сохранить. Визуализация показывает количество строк, которые она агрегирует.

В некоторых случаях может не потребоваться использовать агрегирование в столбцах оси Y. Чтобы отключить агрегирование, щелкните значок меню Kebab рядом со столбцами Y и снимите флажок "Использовать агрегирование".

Изменение цветов визуализации

Вы можете настроить цвета визуализации при создании визуализации или его редактировании.

  1. Создайте или начните изменение визуализации.
  2. Щелкните Цвета.
  3. Чтобы изменить цвет, щелкните квадрат и выберите новый цвет, выполнив одно из следующих действий:
    • Щелкните его в селекторе цветов.
    • Введите шестнадцатеричное значение.
  4. Щелкните в любом месте за пределами селектора цветов, чтобы закрыть его.
  5. Нажмите кнопку Сохранить в редакторе визуализации , чтобы сохранить изменения.

Временное скрытие или отображение ряда

Чтобы скрыть ряд в визуализации, щелкните его в условных обозначениях. Чтобы снова отобразить ряд, щелкните его еще раз в условных обозначениях.

Чтобы отобразить только один ряд, дважды щелкните его в условных обозначениях. Чтобы отобразить другие ряды, щелкните каждый из них.

Выбор серии

Чтобы выбрать определенный ряд для анализа на диаграмме, используйте следующие команды:

  • Щелкните один элемент условных обозначений, чтобы выбрать этот ряд
  • Cmd/Ctrl + щелкните на элементе легенды, чтобы выбрать или отменить выбор нескольких серий

выбор рядов

Отсортированные подсказки

Используйте подсказки на линейных диаграммах и несвязанных линейчатых диаграммах, упорядоченных по величине, для упрощения анализа.

отсортированные подсказки

Zoom / Увеличить

Для диаграмм, насыщенных данными, увеличение отдельных точек данных может оказаться полезным для изучения деталей и обрезки выбросов. Чтобы увеличить масштаб диаграммы, щелкните и перетащите его на холст. Чтобы очистить масштаб, наведите указатель мыши на холст и нажмите кнопку Очистить масштаб в правом верхнем углу визуализации.

увеличить масштаб, чтобы просмотреть сведения

Скачивание визуализации в виде PNG-файла

Чтобы загрузить визуализацию в виде PNG-файла, наведите указатель мыши на холст и щелкните значок скачивания в правом верхнем углу.

Щелкните скачивание, чтобы экспортировать визуализацию в виде PNG-файла

Png-файл скачан на устройство.

Добавление визуализации на панель мониторинга

  1. Щелкните стрелку вниз в правой части имени вкладки.
  2. Выберите Добавить на панель мониторинга. Появится список доступных представлений панели мониторинга, а также параметр меню Добавить в новую панель мониторинга.
  3. Выберите панель мониторинга или выберите Добавить в новую панель мониторинга. Откроется панель мониторинга, включая только что добавленную визуализацию.

Устаревшие визуализации

Последняя версия визуализаций диаграмм по умолчанию включена. Параметры в этом разделе описывают устаревшую визуализацию, которая может возникнуть при работе со старой диаграммой или если у вас отключена последняя версия.

Средства визуализации

Если навести указатель мыши на верхний правый угол диаграммы в редакторе визуализации, появится панель инструментов Plotly, с помощью которой можно выполнять операции, такие как выбор, масштабирование и панорамирование.

Панель инструментов Plotly

Если панель инструментов не отображается, ваш администратор отключил отображение панели инструментов.

Настраиваемые палитры цветов

Примечание.

По умолчанию, если устаревшая панель мониторинга использует настраиваемую цветовую палитру, выбор цвета визуализации игнорируется. Чтобы переопределить этот параметр, см . раздел "Использование другого цвета" для визуализации.