Поделиться через


Руководство по началу работы с Azure Databricks

В этом разделе приведены основные функции и рекомендации по работе с платформой Azure Databricks.

Для получения информации об онлайн-ресурсах для обучения см. «Получите бесплатное обучение Databricks».

Если у вас нет учетной записи Azure Databricks, зарегистрируйтесь для получения бесплатной пробной версии.

Туториал Описание
Запрос и визуализация данных Используйте записную книжку Databricks для запроса примеров данных, хранящихся в каталоге Unity, с помощью SQL, Python, Scala и R, а затем визуализировать результаты запроса в записной книжке.
Импорт и визуализация данных CSV из записной книжки Используйте записную книжку Databricks для импорта данных из CSV-файла, содержащего данные имени ребенка из https://health.data.ny.gov тома каталога Unity с помощью Python, Scala и R. Вы также узнаете, как изменить имя столбца, визуализировать данные и сохранить их в таблице.
Создание таблицы Создайте таблицу и предоставьте привилегии в Databricks с помощью модели управления данными каталога Unity.
Создание конвейера ETL с помощью DLT Создание и развертывание конвейера ETL (извлечение, преобразование и загрузка) для оркестрации данных с помощью DLT и автозагрузчика.
Создание конвейера ETL с помощью Apache Spark Разработка и развертывание первого конвейера ETL (извлечение, преобразование и загрузка) для оркестрации данных с помощью Apache Spark™.
Обучение и развертывание модели машинного обучения Создайте модель классификации машинного обучения с помощью библиотеки scikit-learn в Databricks, чтобы предсказать, считается ли вино высоким качеством. В этом руководстве также показано использование MLflow для отслеживания процесса разработки моделей и Hyperopt для автоматизации настройки гиперпараметров.
Запрашивать LLM и прототипировать ИИ-агентов без кодирования Используйте песочницу для ИИ, чтобы запрашивать большие языковые модели (LLM) и проводить одновременное сравнение результатов, создавать прототип агента ИИ для выполнения вызовов инструментов и экспортировать вашего агента в программный код.
Туториал Сведения
Запрос и визуализация данных Используйте записную книжку Databricks для запроса примеров данных, хранящихся в каталоге Unity, с помощью SQL, Python, Scala и R, а затем визуализировать результаты запроса в записной книжке.
Импорт и визуализация данных CSV из записной книжки Используйте записную книжку Databricks для импорта данных из CSV-файла, содержащего данные имени ребенка из https://health.data.ny.gov тома каталога Unity с помощью Python, Scala и R. Вы также узнаете, как изменить имя столбца, визуализировать данные и сохранить их в таблице.
Создание таблицы Создайте таблицу и предоставьте привилегии в Databricks с помощью модели управления данными каталога Unity.
Создание конвейера ETL с помощью DLT Создание и развертывание конвейера ETL (извлечение, преобразование и загрузка) для оркестрации данных с помощью DLT и автозагрузчика.
Создание конвейера ETL с помощью Apache Spark Разработка и развертывание первого конвейера ETL (извлечение, преобразование и загрузка) для оркестрации данных с помощью Apache Spark™.
Обучение и развертывание модели машинного обучения Создайте модель классификации машинного обучения с помощью библиотеки scikit-learn в Databricks, чтобы предсказать, считается ли вино высоким качеством. В этом руководстве также показано использование MLflow для отслеживания процесса разработки моделей и Hyperopt для автоматизации настройки гиперпараметров.
Работа с LLM и создание прототипов агентов ИИ без кода Используйте песочницу ИИ для запроса больших языковых моделей (LLM) и сравнения результатов параллельно, создайте прототип ИИ-агента для вызова инструментов и экспортируйте вашего агента в код.
Подключение к Azure Data Lake Storage Подключитесь из Azure Databricks к Azure Data Lake Storage с помощью OAuth 2.0 и представителя сервиса Microsoft Entra ID.

Получить помощь

  • Если у вас есть вопросы о настройке Azure Databricks и нужна помощь в режиме реального времени, отправьте электронное письмо [email protected].
  • Если у вашей организации нет подписки на службу поддержки Azure Databricks или если вы не являетесь авторизованным контактом для подписки на поддержку вашей компании, вы можете получить ответы от сообщества Databricks.