Сравнение продуктов и технологий машинного обучения Майкрософт
Узнайте о продуктах и технологиях машинного обучения Майкрософт. Сравните варианты для эффективной сборки, развертывания и администрирования решений машинного обучения.
Продукты машинного обучения на основе облака
Для машинного обучения в облаке доступны следующие решения.
Варианты облака | Что это | Возможности |
---|---|---|
Машинное обучение Azure | Управляемая платформа для машинного обучения | Использование предварительно обученной модели. Или обучение, развертывание моделей и управление ими в Azure с помощью Python и CLI. |
Azure Cognitive Services | Предварительно созданные возможности AI, реализованные с помощью API-интерфейсов и пакетов SDK. | Быстрое создание интеллектуальных приложений с использованием стандартных языков программирования. Опыт в сфере машинного обучения и обработки и анализа данных не требуется. |
Службы машинного обучения в Управляемом экземпляре SQL Azure | Машинное обучение для баз данных в SQL | Обучение и развертывание моделей в Управляемом экземпляре SQL Azure |
Машинное обучение в Azure Synapse Analytics | Служба аналитики с машинным обучением | Обучение и развертывание моделей в Azure Synapse Analytics |
Машинное обучение и ИИ с помощью ONNX в Azure SQL Edge | Машинное обучение в SQL в Интернете вещей | Обучение и развертывание моделей в SQL Azure для пограничных вычислений |
Azure Databricks | Платформа аналитики на основе Apache Spark | Создание и развертывание моделей и рабочих процессов данных с помощью интеграции с библиотеками машинного обучения с открытым исходным кодом и платформой MLflow . |
Продукты машинного обучения в локальной среде
Для машинного обучения в локальной среде доступны следующие решения. Локальные серверы также можно запустить на виртуальной машине в облаке.
Варианты локальных решений | Что это | Возможности |
---|---|---|
Службы машинного обучения SQL Server | Машинное обучение для баз данных в SQL | Обучение и развертывание моделей внутри SQL Server |
Службы машинного обучения в Кластерах больших данных SQL Server | Машинное обучение в Кластерах больших данных | Обучение и развертывание моделей в Кластерах больших данных SQL Server |
Платформы и средства разработки
Для машинного обучения доступны следующие платформы и средства разработки.
Платформы и средства | Что это | Возможности |
---|---|---|
Виртуальная машина для обработки и анализа данных Azure | Виртуальная машина с предустановленными средствами для обработки и анализа данных | Разработка решений машинного обучения в предварительно настроенной среде |
ML.NET | Кроссплатформенный пакет SDK для машинного обучения с открытым исходным кодом | Разработка решений машинного обучения для приложений .NET |
Машинное обучение Windows | Платформа машинного обучения Windows 10 | Оценка обученных моделей на устройстве под управлением Windows 10 |
SynapseML | Основанная на исходном коде распределенная платформа машинного обучения и микрослужб для Apache Spark | Создание и развертывание масштабируемых приложений машинного обучения для Scala и Python. |
Расширение Машинного обучения для Azure Data Studio | Основанное на открытом исходном коде кроссплатформенное расширение машинного обучения для Azure Data Studio | Управление пакетами, импорт моделей машинного обучения, создание прогнозов и создание записных книжек для выполнения экспериментов для баз данных SQL |
Машинное обучение Azure
Машинное обучение Azure — это полностью управляемая облачная служба, используемая для обучения, развертывания и управления моделями машинного обучения в большом масштабе. Она полностью поддерживает технологии с открытым исходным кодом, позволяя использовать десятки тысяч пакетов Python c открытым исходным кодом, таких как TensorFlow, PyTorch и scikit-learn. Кроме того, доступны полнофункциональные средства, такие как вычислительные экземпляры, записные книжки Jupyter или расширение Машинного обучения Azure для Visual Studio Code — бесплатное расширение для управления ресурсами, рабочими процессами обучения модели и развертываниями в Visual Studio Code. Машинное обучение Azure включает в себя компоненты, которые с легкостью эффективно и точно автоматизируют создание и настройку моделей.
Используйте пакет SDK для Python, записные книжки Jupyter, R и CLI для машинного обучения в масштабе облака. Для варианта с написанием небольшого объема кода или без кода вообще используйте интерактивный конструктор Машинного обучения Azure в студии, чтобы легко и быстро создавать, тестировать и развертывать модели с помощью предварительно созданных алгоритмов машинного обучения.
Попробуйте Машинное обучение Azure бесплатно.
Позиция | Описание |
---|---|
Тип | Решение машинного обучения на основе облака |
Поддерживаемые языки | Python, R |
Этапы машинного обучения | Обучение модели Развертывание MLOps и управление |
Основные преимущества | Сначала код (SDK) и студии и параметры разработки веб-интерфейса конструктора перетаскивания. Централизованное управление скриптами и журналом выполнения, что упрощает сравнение версий модели. Простое развертывание моделей и управление ими в облаке или на граничных устройствах. |
Рекомендации | Необходимо ознакомиться с моделью управления моделями. |
Службы ИИ Azure
Службы искусственного интеллекта Azure — это набор предварительно созданных API, позволяющих создавать приложения, использующие естественные методы взаимодействия. Термин "предварительно созданные" подразумевает, что для обучения моделей добавлять наборы данных или применять знания в области обработки и анализа данных не требуется. Все это уже сделано и упаковано в виде API-интерфейсов и пакетов SDK, позволяющих приложениям видеть, слышать, говорить, понимать и интерпретировать потребности пользователей с помощью всего нескольких строк кода. В приложения можно легко добавить следующие интеллектуальные функции:
- Зрение: обнаружение объектов, распознавание лиц, оптическое распознавание символов (OCR) и т. д. Дополнительные сведения см. в разделе Компьютерное зрение, Face, Azure AI Document Intelligence.
- Речь: речь в тексте, тексте в речь, распознавание говорящего и т. д. Дополнительные сведения см. в службе "Речь".
- Язык: перевод, анализ тональности, извлечение ключевых фраз, распознавание речи и т. д. См. раздел "Переводчик", Анализ текста, Распознавание речи, QnA Maker
- Решение. Обнаружение аномалий, модерация контента, обучение с подкреплением. Дополнительные сведения см. в разделе Детектор аномалий, Content Moderator, Персонализатор.
Используйте службы ИИ Azure для разработки приложений на разных устройствах и платформах. Эти API-интерфейсы постоянно совершенствуются и очень просто настраиваются.
Позиция | Описание |
---|---|
Тип | API-интерфейсы для создания интеллектуальных приложений |
Поддерживаемые языки | Различные варианты в зависимости от службы. Стандартными являются C#, Java, JavaScript и Python. |
Этапы машинного обучения | Развертывание |
Основные преимущества | Создание интеллектуальных приложений с использованием предварительно обученных моделей, доступные с помощью REST API и пакета SDK. Разнообразные модели для естественных методов коммуникации со зрением, речью, языком и решением. Опыт в сфере машинного обучения и обработки и анализа данных не требуется. |
Машинное обучение SQL
Машинное обучение SQLпредоставляет возможности статистического анализа, визуализации данных и прогнозной аналитики на Python и R для реляционных данных как в локальной, так и в облачной среде. Ниже перечислены текущие платформы и средства.
- Службы машинного обучения SQL Server
- Службы машинного обучения в Кластерах больших данных SQL Server
- Службы машинного обучения в Управляемом экземпляре SQL Azure
- Машинное обучение в Azure Synapse Analytics
- Машинное обучение и ИИ с помощью ONNX в Azure SQL Edge
- Расширение Машинного обучения для Azure Data Studio
Используйте машинное обучение SQL, если вам нужны встроенный ИИ и прогнозная аналитика для реляционных данных в SQL.
Позиция | Описание |
---|---|
Тип | Прогнозная аналитика для реляционных данных в локальной среде |
Поддерживаемые языки | Python, R, SQL |
Этапы машинного обучения | Подготовка данных Обучение модели Развертывание |
Основные преимущества | Возможность инкапсулирования прогнозной логики в функции базы данных, что позволяет легко включать ее в логику уровня данных. |
Рекомендации | Предполагается наличие базы данных SQL в качестве уровня данных в вашем приложении. |
Виртуальная машина для обработки и анализа данных Azure
Виртуальная машина для обработки и анализа данных Azure — это настроенная среда виртуальной машины в облаке Microsoft Azure. Доступны версии для Windows и Linux Ubuntu. Среда создана специально для обработки и анализа данных и разработки решений машинного обучения. Она имеет множество популярных платформ обработки и анализа данных, платформ машинного обучения и других инструментов, предварительно установленных и предварительно настроенных для создания интеллектуальных приложений для расширенной аналитики.
Используйте виртуальную машину для обработки и анализа данных, когда нужно запускать или размещать задания на одном узле. Также с ее помощью можно удаленно увеличивать масштаб для обработки на одном компьютере.
Позиция | Описание |
---|---|
Тип | Настроенная среда виртуальной машины для обработки и анализа данных |
Основные преимущества | Сокращение времени на установку, управление и устранение неполадок в средствах и платформах для обработки и анализа данных. Включены последние версии всех широко используемых средств и платформ. Параметры виртуальной машины включают высокомасштабируемые изображения с возможностями графической обработки (GPU) для интенсивного моделирования данных. |
Рекомендации | К виртуальной машине невозможно получить доступ в автономном режиме. За использование виртуальной машины взимается плата в Azure, поэтому следует следить за тем, чтобы она работала только при необходимости. |
Azure Databricks
Azure Databricks — это платформа аналитики на основе Apache Spark, оптимизированная для облачной платформы Microsoft Azure. Databricks интегрируется с Azure, обеспечивая интерактивную рабочую область, простую настройку и упрощенные рабочие процессы. Эта рабочая область позволяет специалистам в области обработки и анализа данных, инжиниринга данных и бизнес-аналитики работать совместно. Используйте код Python, R, Scala и SQL в онлайновых записных книжках, чтобы запрашивать, визуализировать и моделировать данные.
Используйте Databricks для совместной работы над созданием решений для машинного обучения в Apache Spark.
Позиция | Описание |
---|---|
Тип | Платформа аналитики на основе Apache Spark |
Поддерживаемые языки | Python, R, Scala, SQL |
Этапы машинного обучения | Подготовка данных Предварительная обработка данных Обучение модели Настройка модели Вывод модели Управление Развертывание |
ML.NET
ML.NET — это основанный на открытом исходном коде кроссплатформенный фреймворк машинного обучения. С помощью ML.NET можно создавать пользовательские решения машинного обучения и интегрировать их в приложения .NET. ML.NET предлагает различные уровни взаимодействия с популярными платформами, такими как TensorFlow и ONNX, для обучения и оценки моделей машинного обучения и глубокого обучения. Для выполнения ресурсоемких задач, таких как обучение моделей классификации изображений, можно воспользоваться преимуществами Azure для обучения моделей в облаке.
Используйте ML.NET, если вам нужно интегрировать решения для машинного обучения в приложения .NET. Выберите API для работы по модели code-first и Model Builder или CLI для написания небольшого объема кода.
Позиция | Описание |
---|---|
Тип | Кроссплатформенный фреймворк с открытым исходным кодом для разработки пользовательских приложений машинного обучения с помощью .NET |
Поддерживаемые языки | C#, F# |
Этапы машинного обучения | Подготовка данных Обучение Развертывание |
Основные преимущества | Интерфейс обработки и анализа данных и машинного обучения не требуется Использование знакомых средств (Visual Studio, Microsoft Visual Studio Code) и языков Развертывание в среде, где выполняется .NET Расширяемый Масштабируемость Оценка в локальной среде |
Машинное обучение Windows
Подсистема вывода машинного обучения Windows позволяет использовать обученные модели машинного обучения в приложениях, оценивая обученные модели локально на устройствах с Windows 10.
Используйте машинное обучение Windows, если вы хотите использовать обученные модели машинного обучения в приложениях Windows.
Позиция | Описание |
---|---|
Тип | Подсистема вывода для обученных моделей на устройствах Windows |
Поддерживаемые языки | C# или C++, JavaScript |
SynapseML
SynapseML (ранее известный как MMLSpark) — это библиотека с открытым исходным кодом, которая упрощает создание конвейеров машинного обучения с массовым масштабированием. SynapseML предоставляет API для различных задач машинного обучения, таких как анализ текста, визуальное распознавание, обнаружение аномалий и многие другие. SynapseML основан на распределенной вычислительной платформе Apache Spark и использует тот же API, что и библиотека SparkML/MLLib, что позволяет легко внедрять модели SynapseML в существующие рабочие процессы Apache Spark.
SynapseML добавляет множество средств глубокого обучения и обработки и анализа данных в экосистему Spark, включая простую интеграцию конвейеров Spark Машинное обучение с light Gradient Boosting Machine (LightGBM), LIME (Интерпретация модели) и OpenCV. Эти средства можно использовать для создания эффективных прогнозных моделей в любом кластере Spark, например Azure Databricks или Cosmic Spark.
SynapseML также предоставляет сетевые возможности для экосистемы Spark. С помощью проекта HTTP в Spark пользователи могут внедрять любые веб-службы в свои модели SparkML. Кроме того, SynapseML предоставляет удобные средства для оркестрации служб ИИ Azure в большом масштабе. Для развертывания производственного уровня проект Spark Serving обеспечивает высокую пропускную способность и предоставляет веб-службы с задержкой длительностью меньше миллисекунды, поддерживаемые кластером Spark.
Позиция | Описание |
---|---|
Тип | Основанная на исходном коде распределенная платформа машинного обучения и микрослужб для Apache Spark |
Поддерживаемые языки | Scala 2.11, Java, Python 3.5 и более поздние версии, R (бета-версия) |
Этапы машинного обучения | Подготовка данных Обучение модели Развертывание |
Основные преимущества | Масштабируемость Совместимость с потоковой передачей и обслуживанием Отказоустойчивость |
Рекомендации | Требуется Apache Spark |
Соавторы
Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участниками.
Автор субъекта:
- Zoiner Tejada | главный исполнительный директор (генеральный директор) и архитектор
Следующие шаги
- Дополнительные сведения обо всех продуктах для разработки с использованием искусственного интеллекта (ИИ), предлагаемых корпорацией Майкрософт, см. здесь.
- Учебные курсы по разработке решений ИИ и Машинное обучение с помощью Майкрософт см. в обучении Microsoft Learn.