Поделиться через


Готовность к ИИ

В этой статье описывается организационный процесс создания рабочих нагрузок ИИ в Azure. В этой статье приводятся рекомендации по принятию ключевых решений по проектированию и процессу внедрения рабочих нагрузок ИИ в большом масштабе. В нем рассматриваются рекомендации по использованию ИИ для организации ресурсов и подключения.

Схема, на которую показаны 6 этапов внедрения ИИ: стратегия, планирование, подготовка, управление, защита, управление.

Установка системы управления ИИ

Система управления ИИ требует надлежащей организации ресурсов и управления политиками для обеспечения безопасных, совместимых и экономичных операций. Необходимо создать четкие границы управления для защиты конфиденциальных данных и эффективного управления доступом к ресурсам ИИ. Это делается следующим образом:

  1. Создайте отдельные группы управления для рабочих нагрузок, подключенных к Интернету и внутренних рабочих нагрузок ИИ. Разделение групп управления устанавливает критически важные границы управления данными между внешними ("онлайн") и внутренними (корпоративными) приложениями ИИ. Это разделение предотвращает доступ внешних пользователей к конфиденциальным внутренним бизнес-данным при сохранении соответствующих элементов управления доступом. Подход соответствует принципам архитектуры группы управления целевыми зонами Azure и поддерживает наследование политик между типами рабочих нагрузок.

  2. Применение политик, относящихся к ИИ, к каждой группе управления. Начните с базовых политик из целевых зон Azure и добавьте определения политик Azure для Foundry, Foundry Tools, Azure AI Search и виртуальных машин Azure. Применение политик обеспечивает единое управление ИИ на платформе и снижает контроль соответствия вручную.

  3. Разверните ресурсы ИИ в подписках, предназначенных для конкретных рабочих нагрузок. Ресурсы ИИ должны наследовать политики управления от группы управления рабочей нагрузкой, а не подписок платформы. Это разделение предотвращает узкие места в разработке, возникающие из-за контроля команды платформы, и позволяет командам по рабочим нагрузкам действовать с надлежащей степенью автономии. Развертывание рабочих нагрузок ИИ в подписках целевой зоны приложений в средах целевой зоны Azure.

Установка сети искусственного интеллекта

Сеть ИИ охватывает проектирование сетевой инфраструктуры, меры безопасности и эффективные шаблоны передачи данных для рабочих нагрузок ИИ. Необходимо реализовать надлежащие средства управления безопасностью и параметры подключения, чтобы предотвратить нарушения на основе сети и обеспечить согласованную производительность. Это делается следующим образом:

  1. Активируйте защиту от атак DDoS Azure для рабочих нагрузок ИИ, подключенных к Интернету.Защита от атак DDoS Azure защищает службы искусственного интеллекта от потенциальных сбоев и простоев, которые вызывают атаки типа "отказ в обслуживании". Защита от атак DDoS на уровне виртуальной сети защищает от наводнений трафика, предназначенных для приложений, подключенных к Интернету, и обеспечивает доступность служб во время атак.

  2. Безопасный рабочий доступ к рабочим нагрузкам ИИ с помощью Бастиона Azure. Используйте jumpbox и Azure Bastion для обеспечения безопасного административного доступа к рабочим нагрузкам ИИ и защиты интерфейсов управления от прямого доступа к интернету. Этот подход создает безопасный шлюз для административных задач при сохранении сетевой изоляции для ресурсов искусственного интеллекта.

  3. Выберите подходящее подключение для локальных источников данных. Организациям, которые передают большие объемы данных из локальных источников в облачные среды, требуются подключения с высокой пропускной способностью для поддержки требований к производительности рабочей нагрузки ИИ.

    • Используйте Azure ExpressRoute для передачи данных с большим объемом.Azure ExpressRoute обеспечивает выделенное подключение для больших объемов данных, обработки в режиме реального времени или рабочих нагрузок, требующих согласованной производительности. ExpressRoute включает функцию FastPath , которая повышает производительность пути к данным путем обхода шлюза ExpressRoute для определенных потоков трафика.

    • Используйте VPN-шлюз Azure для умеренной передачи данных.VPN-шлюз Azure хорошо подходит для умеренных объемов данных, редкой передачи данных или при необходимости общедоступного доступа к Интернету. VPN-шлюз предлагает более простую настройку и эффективную операцию для небольших наборов данных по сравнению с ExpressRoute. Используйте соответствующую топологию и проектирование для рабочих нагрузок ИИ, включая VPN типа "сеть — сеть" для межсайтовых подключений и VPN типа "точка — сеть" для безопасного доступа к устройству.

Обеспечение надежности искусственного интеллекта

Надежность искусственного интеллекта требует стратегического размещения и планирования резервирования для обеспечения устойчивой производительности и высокого уровня доступности. Организации должны обращаться к модели размещения, локальности данных и аварийному восстановлению, чтобы поддерживать надежные службы искусственного интеллекта. Необходимо спланировать стратегию регионального развертывания, чтобы избежать прерываний работы служб и оптимизировать производительность. Это делается следующим образом:

  1. Разверните конечные точки ИИ в нескольких регионах для производственных рабочих нагрузок. Рабочие нагрузки искусственного интеллекта требуют размещения по крайней мере в двух регионах, чтобы обеспечить избыточность и обеспечить высокий уровень доступности. Развертывания в нескольких регионах позволяют ускорить переключение и восстановление в случае региональных сбоев. Для Azure OpenAI в Foundry используйте глобальные развертывания , которые автоматически направляют запросы в регионы с доступной емкостью. Для региональных развертываний реализуйте управление API Azure для балансировки нагрузки запросов API между конечными точками ИИ.

  2. Перед развертыванием проверьте доступность службы ИИ в целевых регионах. Различные регионы обеспечивают различные уровни доступности и поддержки функций службы ИИ. Проверьте доступность службы Azure по регионам , чтобы убедиться, что доступны необходимые службы ИИ. Модели развертывания Azure OpenAI включают глобальный стандарт, глобально подготовленные, региональный стандарт и регионально подготовленные модели с различными шаблонами региональной доступности.

  3. Оцените ограничения квоты региона и требования к емкости. Средства Foundry имеют ограничения на региональные подписки, влияющие на крупномасштабные развертывания моделей и рабочие нагрузки вывода. Обратитесь в службу поддержки Azure заранее, когда предполагается, что потребности в емкости превышают стандартные квоты, чтобы предотвратить нарушения работы служб во время масштабирования.

  4. Оптимизируйте размещение данных для приложений генерации с дополнением поиска. Расположение хранилища данных значительно влияет на производительность приложений в сценариях RAG. Совместное размещение данных с моделями ИИ в одном регионе снижает задержку и повышает эффективность извлечения данных, хотя конфигурации между регионами остаются жизнеспособными для конкретных бизнес-требований.

  5. Репликация критически важных ресурсов ИИ в вторичные регионы для обеспечения непрерывности бизнес-процессов. Для обеспечения непрерывности бизнес-процессов требуется репликация точно настроенных моделей, наборов данных RAG, обученных моделей и обучающих данных в вторичные регионы. Репликация ресурсов позволяет ускорить восстановление во время сбоя и поддерживать доступность службы в разных сценариях сбоя.

Создание основы ИИ

Фонд ИИ предоставляет базовую инфраструктуру и иерархию ресурсов, которая поддерживает рабочие нагрузки ИИ в Azure. Она включает в себя настройку масштабируемых, безопасных сред, которые соответствуют потребностям управления и эксплуатации. Надежная основа искусственного интеллекта обеспечивает эффективное развертывание рабочих нагрузок ИИ и управление ими. Она также обеспечивает безопасность и гибкость для будущего роста.

Используйте посадочную зону Azure

Целевая зона Azure — это рекомендуемая отправная точка, которая подготавливает среду Azure. Она предоставляет предопределенную настройку для ресурсов платформы и приложений. После того как платформа будет развернута, вы можете развернуть рабочие нагрузки ИИ в выделенных целевых зонах приложений.

Если ваша организация использует целевые зоны Azure для рабочих нагрузок, продолжайте использовать их для рабочих нагрузок, использующих ИИ. Вы развертываете рабочие нагрузки ИИ в обычных целевых зонах приложений, как любые другие рабочие нагрузки. См. ИИ в целевых зонах Azure. На рисунке 2 ниже показано, как рабочие нагрузки ИИ интегрируются в целевую зону Azure.

Схема, на которой показаны рабочие нагрузки ИИ в целевой зоне Azure. Рис. 2. Рабочая нагрузка ИИ в целевой зоне Azure.

Создание среды ИИ

Если вы не используете целевую зону Azure, следуйте рекомендациям, приведенным в этой статье, чтобы создать среду ИИ. На следующей схеме показана базовая иерархия ресурсов. Он сегментирует внутренние рабочие нагрузки ИИ и рабочие нагрузки, подключенные к Интернету. Внутренние рабочие процессы используют политику для запрета онлайн-доступа клиентов. Это разделение защищает внутренние данные от воздействия внешних пользователей. Разработка ИИ должна предусматривать использование промежуточных серверов для управления ресурсами и данными ИИ.

Схема, показывающая организацию ресурсов для внутренних и интернет-рабочих нагрузок ИИ. Рис. 3. Базовая иерархия ресурсов для рабочих нагрузок ИИ.

Дальнейшие шаги

Следующим шагом является создание и развертывание рабочих нагрузок ИИ в среде ИИ. Чтобы найти рекомендации по архитектуре, соответствующие вашим потребностям, воспользуйтесь приведенными ниже ссылками. Начните с архитектур платформы как службы (PaaS). PaaS — это рекомендуемый подход Майкрософт к внедрению ИИ.