Поделиться через


Данные и искусственный интеллект

В этой статье сравниваются основные службы данных Azure и ИИ с соответствующими службами Amazon Web Services (AWS).

Сравнение других служб AWS и Azure см. в Azure для специалистов по AWS.

Управление данными, менеджмент данных и платформы

Microsoft Purview и сочетание служб AWS, описанных в следующей таблице, предназначены для предоставления комплексных решений по управлению данными. Эти решения позволяют организациям эффективно управлять, обнаруживать, классифицировать и обеспечивать безопасность для своих ресурсов данных.

Служба Майкрософт Службы AWS Описание
Microsoft Purview AWS Glue Каталог данных, AWS Lake Formation, Amazon Macie, AWS Identity and Access Management (IAM), AWS Config Оба варианта обеспечивают надежное управление данными, каталогизацию и функции соответствия требованиям. Microsoft Purview — это единое решение для управления данными, которое позволяет организациям обнаруживать, классифицировать и управлять данными в локальных, многооблачных и saaS-средах. Он также предоставляет возможности прослеживаемости данных и соблюдения нормативных требований. AWS предоставляет аналогичные функциональные возможности с несколькими службами: AWS Glue Каталог данных для управления метаданными, AWS Lake Formation для создания озера данных и управления, Amazon Macie для классификации и защиты данных, AWS IAM для контроля доступа и AWS Config для управления конфигурацией и отслеживания соответствия требованиям.

Универсальная платформа против услуг AWS

Microsoft Fabric предоставляет встроенную платформу, которая объединяет службы данных и ИИ, необходимые для современных решений аналитики. Это упрощает процесс перемещения данных между службами, обеспечивает унифицированное управление и безопасность, а также упрощает модели ценообразования. Этот унифицированный подход контрастирует с подходом AWS, в котором службы часто используются отдельно и требуют больше усилий для интеграции. Fabric обеспечивает простую интеграцию с этими функциями, которые помогут вашей организации ускорить инициативы на основе данных в экосистеме Azure.

AWS и Fabric предоставляют службы для интеграции данных, обработки, аналитики, машинного обучения и бизнес-аналитики.

Службы AWS ткань Описание
AWS Glue, AWS Data Pipeline Интеграция данных с Фабрика данных Azure AWS предоставляет набор отдельных служб, которые можно объединить для создания решений для обработки данных и аналитики. Этот подход обеспечивает гибкость, но требует больше усилий для интеграции служб в комплексное решение. Fabric предоставляет эти возможности в рамках единой платформы для упрощения рабочих процессов, совместной работы и управления.

Подробное сравнение служб AWS с компонентами Fabric

Службы AWS ткань
AWS Glue, AWS Data Pipeline Интеграция данных с Фабрикой данных
Интерактивные сеансы Amazon EMR, AWS Glue Проектирование данных с помощью Spark
Amazon Redshift Хранение данных с помощью хранилища данных Synapse
Amazon SageMaker Наука о данных (интеграция с Azure Machine Learning)
Amazon Kinesis, Amazon Managed Service для Apache Flink Аналитика в режиме реального времени (база данных KQL)
Amazon QuickSight Power BI для бизнес-аналитики
Amazon S3 Единое хранилище данных OneLake
AWS Lake Formation, AWS Glue Каталог данных, Amazon Macie Управление данными (интеграция Microsoft Purview)
Amazon Bedrock, Amazon SageMaker JumpStart Создание искусственного интеллекта (интеграция Azure OpenAI Service)

Средства интеграции данных и ETL

Средства интеграции данных и извлечения, преобразования, загрузки (ETL) помогают извлекать, преобразовывать, загружать данные из нескольких источников в единую систему для анализа.

Служба AWS Служба Azure Анализ
AWS Glue Фабрика данных AWS Glue и Фабрика данных Azure являются полностью управляемыми службами ETL, которые упрощают интеграцию данных между различными источниками.
Управляемые рабочие процессы Amazon для Apache Airflow (MWAA) Фабрика данных с конвейерами Azure Synapse Analytics Apache Airflow обеспечивает оркестрацию управляемых рабочих процессов для сложных конвейеров данных. Конвейеры Azure Synapse Analytics интегрируют Apache Airflow с Azure Data Factory для более интегрированного опыта работы. AWS MWAA — это управляемое решение Airflow.
Конвейер данных AWS Фабрика данных AWS Data Pipeline и Azure Data Factory позволяют перемещать и обрабатывать данные между различными службами и местоположениями.
AWS Database Migration Service (DMS) Миграция баз данных Azure Эти службы помогают перенести базы данных в облако с минимальным временем простоя. Основное различие заключается в том, что служба Azure оптимизирована для простой миграции в базы данных Azure, предоставляя средства оценки и рекомендаций, в то время как AWS DMS фокусируется на миграции в среде AWS. AWS DMS предоставляет текущие функции репликации для гибридных архитектур.
Amazon AppFlow Приложения логики Azure Эти службы позволяют автоматизированные потоки данных между облачными приложениями и сервисами, без необходимости написания кода. Logic Apps предоставляет широкие возможности интеграции с широким спектром соединителей и визуальным конструктором. AppFlow фокусируется на безопасном передаче данных между конкретными приложениями SaaS и службами AWS и предоставляет встроенные функции преобразования данных.
AWS Step Functions Фабрика данных вместе с Logic Apps Эти службы обеспечивают оркестрацию рабочих процессов для координации распределенных приложений и микрослужб. Step Functions предназначены для оркестрации сервисов AWS и микросервисов в бессерверных приложениях. Logic Apps используется как для интеграции данных, так и для автоматизации корпоративных рабочих процессов.

Хранение данных

Эти решения предназначены для хранения больших объемов структурированных данных, оптимизированных для запросов и отчетов.

Служба AWS Служба Azure Анализ
Amazon Redshift Azure Synapse Analytics Amazon Redshift и Azure Synapse Analytics являются полностью управляемыми, петабайтово-масштабируемыми службами хранения данных, предназначенными для крупномасштабной аналитики и отчетности. Основное различие заключается в том, что Azure Synapse Analytics предоставляет единую платформу аналитики, которая объединяет хранение данных и обработку больших данных, в то время как Redshift фокусируется в основном на хранилище данных.
Amazon Redshift Spectrum Azure Synapse Analytics с интеграцией Data Lake Эти службы позволяют запрашивать данные между хранилищами данных и озерами данных без перемещения данных. Azure Synapse Analytics предоставляет интегрированные подсистемы SQL и Spark. Redshift Spectrum расширяет SQL-запрос Redshift к данным в Amazon S3.
AWS Lake Formation Azure Synapse Analytics вместе с Azure Data Lake Storage Эти службы помогут вам создать безопасные озера данных для аналитики. Azure объединяет функции озера данных и хранилища данных в Azure Synapse Analytics. AWS предлагает Lake Formation для создания озер данных и Redshift как отдельную услугу для хранилища данных.
Amazon RDS с федеративным запросом Redshift База данных SQL Azure Эти службы поддерживают запросы между операционными базами данных и хранилищами данных. Azure Synapse Analytics предоставляет единый встроенный интерфейс аналитики. AWS требует объединения RDS и Redshift для аналогичных возможностей запросов между службами.
Amazon Aurora с интеграцией Redshift Azure Synapse Link для Azure Cosmos DB Эти службы обеспечивают высокопроизводительную аналитику по операционным данным. AWS требует настроить каналы передачи данных между Авророй и Redshift. При использовании Azure Synapse Link вам не нужно перемещать данные.

Решения хранилищ данных

Эти платформы хранят огромные объемы необработанных неструктурированных и структурированных данных в собственном формате для последующей обработки.

Служба AWS Служба Azure Анализ
Amazon S3 Azure Data Lake Storage Amazon S3 и Azure Data Lake Storage — это масштабируемые решения для создания озер данных для хранения и анализа больших объемов данных. Data Lake Storage предоставляет иерархическое пространство имен. Amazon S3 использует плоскую структуру.
AWS Lake Formation Azure Synapse Analytics AWS Lake Formation и Azure Synapse Analytics помогут вам настроить, управлять и защищать озера данных для аналитики. Основное отличие заключается в том, что Azure Synapse Analytics предоставляет все-в-одном службу аналитики, которая объединяет озеро данных, хранилище данных и аналитику больших данных, в то время как Lake Formation ориентировано на упрощение создания и управления озером данных с помощью надежных функций безопасности и управления.
Amazon Athena Бессерверные SQL пулы Azure Synapse Analytics Эти службы позволяют запрашивать данные, хранящиеся в озерах данных с помощью SQL, без настройки инфраструктуры. Amazon Athena — это автономное решение, которое интегрируется с другими службами AWS. Бессерверные пулы SQL являются частью платформы Azure Synapse Analytics.
AWS Glue Каталог Данных Microsoft Purview Эти службы предоставляют централизованный репозиторий метаданных для хранения и управления схемами данных в дата-озерах. AWS Glue предоставляет подмножество функций Microsoft Purview. Microsoft Purview поддерживает каталогизацию данных, отслеживание происхождения и классификацию конфиденциальных данных, расположение данных в локальной среде, в облаке или в приложении SaaS.

Аналитика больших данных

Эти службы обрабатывают и анализируют большие и сложные наборы данных для выявления шаблонов, аналитических сведений и тенденций. В следующей таблице приведены прямые сравнения отдельных служб больших данных. Microsoft Fabric — это единая служба для больших данных и аналитики. Он предоставляет следующие службы и многое другое.

Служба AWS Служба Azure Анализ
Amazon EMR Azure HDInsight Обе службы предоставляют управляемые платформы больших данных для обработки данных, хранящихся в озерах данных. EMR предоставляет управляемые платформы Hadoop и Spark. HDInsight — это полностью управляемое корпоративное решение, которое поддерживает Hadoop, Spark, Kafka и другие открытый код аналитики.
Amazon EMR Azure Databricks Эти службы позволяют обрабатывать большие данные с помощью Apache Spark в управляемой среде. EMR позволяет запускать кластеры Apache Spark с гибкими параметрами конфигурации и масштабирования. Azure Databricks предоставляет оптимизированную платформу Apache Spark с совместными записными книжками и интегрированными рабочими процессами.
Amazon Kinesis Центры событий Azure и Azure Stream Analytics Эти службы предоставляют потоковую передачу и аналитику данных в режиме реального времени для обработки и анализа потоков данных с большим объемом.
AWS Glue с AWS Glue Studio Azure Synapse Analytics с пулами Apache Spark Обе службы предоставляют возможности обработки больших данных с интегрированным преобразованием данных и аналитикой.

Бизнес-аналитика и отчетность

Эти службы предоставляют визуализацию данных, отчеты и панели мониторинга, помогающие предприятиям принимать обоснованные решения.

Служба AWS Служба Azure Анализ
Amazon QuickSight Power BI QuickSight и Power BI предоставляют средства бизнес-аналитики для визуализации данных и интерактивных панелей мониторинга.
Amazon Managed Grafana Управляемая Grafana от Azure Эти службы предоставляют управляемую Grafana, что позволяет вам визуализировать метрики, журналы и трассы из нескольких источников данных.
Обмен данными AWS Общий ресурс данных Azure Эти службы упрощают безопасный общий доступ и обмен данными между организациями. Обмен данными предоставляет модель платформы для торговли. Общий доступ к данным ориентирован на межарендаторское обмен данными.
Amazon OpenSearch Service, совместимый с Kibana Azure Data Explorer с панелями мониторинга Эти службы предоставляют анализ данных в режиме реального времени и интерактивную аналитику по большим объемам данных. OpenSearch использует Kibana для поиска и визуализации. Azure Data Explorer использует Kusto, оптимизированный для быстрого приема и запроса данных.

Обработка данных в режиме реального времени

Эти системы принимают и анализируют данные по мере их создания, чтобы предоставлять мгновенные аналитические выводы и ответы.

Служба AWS Служба Azure Анализ
Amazon Kinesis Центры событий Azure и Azure Stream Analytics Эти службы предоставляют потоковую передачу и аналитику данных в режиме реального времени для обработки и анализа потоков данных с большим объемом. Kinesis предоставляет интегрированный набор для потоковой передачи данных и аналитики в AWS. Azure разделяет прием (центры событий) и обработку (Stream Analytics).
Amazon Managed Streaming for Apache Kafka (MSK) Azure HDInsight и Apache Kafka Эти службы предоставляют управляемые кластеры Apache Kafka для создания конвейеров и приложений потоковой передачи в режиме реального времени.
AWS Лямбда Функции Azure Эти бессерверные вычислительные платформы выполняют код в ответ на события и автоматически управляют базовыми вычислительными ресурсами.
Amazon DynamoDB Streams Канал изменений Azure Cosmos DB Эти службы обеспечивают обработку данных в режиме реального времени путем записи и предоставления потока изменений данных.
Amazon ElastiCache для потоков Redis Кэш Azure для Redis с потоками Redis Эти службы предоставляют управляемые экземпляры Redis, поддерживающие потоки Redis для приема и обработки данных в режиме реального времени.
Аналитика Amazon IoT Центр Интернета вещей Azure и Azure Stream Analytics Эти службы позволяют обрабатывать и анализировать данные с устройств Интернета вещей в режиме реального времени. AWS IoT Analytics предоставляет встроенные возможности хранения и анализа данных. Azure предоставляет модульные службы: Центр Интернета вещей обрабатывает прием данных, а Stream Analytics обрабатывает данные.

Службы машинного обучения

Эти средства и платформы позволяют разрабатывать, обучать и развертывать модели машинного обучения.

Служба AWS Служба Azure Анализ
Amazon SageMaker Машинное обучение Azure Эти комплексные платформы позволяют создавать, обучать и развертывать модели машинного обучения.
ИНТЕРФЕЙСы AMIS для глубокого обучения AWS Azure Виртуальная машина для обработки и анализа данных Эти службы предоставляют предварительно настроенные виртуальные машины, оптимизированные для рабочих нагрузок машинного обучения и обработки и анализа данных.
Amazon SageMaker Autopilot Автоматизированное машинное обучение (AutoML) Эти службы предоставляют автоматизированное машинное обучение для создания и обучения моделей.
Amazon SageMaker Studio Студия машинного обучения Azure Эти службы предоставляют интегрированные среды разработки для машинного обучения. SageMaker Studio предоставляет единый интерфейс для всех шагов разработки машинного обучения, включая средства отладки и профилирования.

Службы искусственного интеллекта

Службы ИИ предоставляют предварительно созданные, настраиваемые возможности искусственного интеллекта для приложений, включая визуальное распознавание, речь, язык и принятие решений.

Служба AWS Служба Azure Анализ
Amazon Rekognition Распознавание ИИ Azure с помощью OCR и ИИ Эти услуги предоставляют возможности анализа изображений и видео, в том числе распознавание объектов и модерацию контента.
Amazon Polly Система ИИ Azure для преобразования текста в речь Эти службы можно использовать для преобразования текста в жизненную речь, чтобы приложения могли взаимодействовать с пользователями с естественным звуком голоса.
Amazon Transcribe Речь ИИ Azure Эти службы преобразуют речь в текст, что позволяет приложениям транскрибировать звуковые потоки.
Amazon Translate Azure AI Translator Эти службы предоставляют возможности машинного перевода для перевода текста с одного языка на другой.
Amazon Comprehend Язык ИИ Azure Эти службы анализируют текст для извлечения аналитических сведений, таких как тональность, ключевые фразы, сущности и обнаружение языка.
Amazon Lex Служба ботов Azure AI Эти службы можно использовать для создания диалоговых интерфейсов и чат-ботов, использующих распознавание естественного языка. Azure предоставляет модульный подход с отдельными службами для платформы разработки ботов и распознавания речи. Amazon Lex предоставляет интегрированное решение для создания диалоговых интерфейсов в AWS.
Amazon Textract Интеллектуальный анализ документов Azure AI Обе эти службы автоматически извлекают текст и данные из сканированных документов и форм с помощью машинного обучения. Azure предоставляет настраиваемые модели для определенных типов документов, которые позволяют извлекать данные с учетом специфики. Textract обеспечивает извлечение сложных структур данных вне поля.
Amazon OpenSearch Service Поиск ИИ Azure (создание поиска) OpenSearch и поиск ИИ предоставляют мощные возможности поиска и аналитики. Их можно использовать для распространенных шаблонов ИИ, таких как генерация с расширением получения (RAG).

Службы создания искусственного интеллекта

Эти службы искусственного интеллекта создают новое содержимое или данные, которые похожи на выходные данные, созданные человеком, например текст, изображения или звук.

Служба AWS Службы Azure; Анализ
Amazon Bedrock Azure OpenAI ServiceAzure AI Foundry Amazon Bedrock, Azure AI Foundry и Azure OpenAI Service предоставляют базовые модели для создания и развертывания создаваемых приложений ИИ.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участниками.

Основной автор

Другой участник:

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Следующие шаги