Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Узнайте о вариантах разработки и управления на компьютере с Windows для работы в экосистеме Apache Hadoop в HDInsight.
HDInsight основан на компонентах Apache Hadoop и Hadoop, технологиях с открытым исходным кодом, разработанных в Linux. HDInsight версии 3.4 и более поздних версий использует дистрибутив Ubuntu Linux в качестве базовой ОС для кластера. Однако вы можете работать с HDInsight из клиента Windows или среды разработки Windows.
Использование PowerShell для задач развертывания и управления
Azure PowerShell — это среда сценариев, которую можно использовать для управления и автоматизации задач развертывания и управления в HDInsight из Windows.
Примеры задач, которые можно выполнить с помощью PowerShell:
- Создание кластеров с помощью PowerShell.
- Запустите запросы Apache Hive с помощью PowerShell.
- Управление кластерами с помощью PowerShell.
Выполните действия, чтобы установить и настроить Azure PowerShell , чтобы получить последнюю версию.
Служебные программы, которые можно запускать в браузере
Следующие служебные программы содержат веб-интерфейс, который выполняется в браузере:
Azure Cloud Shell — это интерактивная командная строка, которая выполняется в браузере и на портале Azure.
Веб-интерфейс Apache Ambari — это программа управления и мониторинга, доступная на портале Azure, которая может использоваться для управления различными типами заданий, например:
Прежде чем перейти к следующим примерам, установите и попробуйте использовать средства Data Lake для Visual Studio.
Visual Studio и пакет SDK для .NET
Visual Studio можно использовать с пакетом SDK для .NET для управления кластерами и разработки приложений больших данных. Для следующих задач можно использовать другие IDE, но примеры показаны в Visual Studio.
Примеры задач, которые можно выполнить с помощью пакета SDK для .NET в Visual Studio:
- Пакет SDK для Azure HDInsight для .NET.
- Запустите запросы Apache Hive с помощью пакета SDK для .NET.
- Используйте пользовательские функции C# для стриминга с Apache Hive и Apache Pig в Apache Hadoop.
IntelliJ IDEA и Eclipse IDE для кластеров Spark
IntelliJ IDEA и Eclipse IDE можно использовать для:
- Разработка и отправка приложения Scala Spark в кластере HDInsight Spark.
- Доступ к ресурсам кластера Spark.
- Разработка и запуск приложения Scala Spark локально.
В следующих статьях показано, как:
- IntelliJ IDEA: создание приложений Apache Spark с помощью подключаемого модуля Azure Toolkit для IntelliJ и пакета SDK Scala.
- Интегрированная среда разработки Eclipse или интегрированная среда разработки Scala для Eclipse: создание приложений Apache Spark и набор средств Azure для Eclipse
Записные книжки в Spark для специалистов по обработке и анализу данных
Кластеры Apache Spark в HDInsight включают ноутбуки Apache Zeppelin и ядра, которые можно использовать с Jupyter Notebook-ами.
- Узнайте, как использовать ядра в кластерах Apache Spark с Jupyter Notebook для тестирования приложений Spark
- Узнайте, как использовать записные книжки Apache Zeppelin в кластерах Apache Spark для запуска заданий Spark
Запуск средств и технологий на основе Linux в Windows
Если вы столкнулись с ситуацией, когда необходимо использовать средство или технологию, доступную только в Linux, рассмотрите следующие варианты:
- Bash в Ubuntu в Windows 10 предоставляет подсистему Linux в Windows. Bash позволяет напрямую запускать служебные программы Linux без необходимости поддерживать выделенную установку Linux. Шаги установки см. в статье Windows Subsystem for Linux Installation Guide for Windows 10 (Подсистема Windows для Linux в Windows 10). Другие оболочки Unix также работают.
- Docker для Windows предоставляет доступ ко многим средствам на основе Linux и может выполняться непосредственно из Windows. Например, можно использовать Docker для запуска клиента Beeline для Hive непосредственно из Windows. Вы также можете использовать Docker для запуска локальной записной книжки Jupyter и удаленного подключения к Spark в HDInsight. Начало работы с Docker для Windows
- MobaXTerm позволяет графически просматривать файловую систему кластера через подключение SSH.
Кроссплатформенные инструменты
Azure CLI — это кроссплатформенный интерфейс командной строки от Майкрософт для управления ресурсами Azure. Дополнительные сведения см. в статье
Дальнейшие шаги
Если вы не знакомы с кластерами под управлением Linux, ознакомьтесь со следующими статьями: