Готовность к ИИ

В этой статье описывается организационный процесс создания рабочих нагрузок ИИ в Azure. В этой статье приводятся рекомендации по принятию ключевых решений по проектированию и процессу внедрения рабочих нагрузок ИИ в большом масштабе. В нем рассматриваются рекомендации по использованию ИИ для организации ресурсов и подключения.

Управление ИИ

Система управления ИИ требует надлежащей организации ресурсов и управления политиками для обеспечения безопасных, совместимых и экономичных операций. Необходимо создать четкие границы управления для защиты конфиденциальных данных и эффективного управления доступом к ресурсам ИИ. Это делается следующим образом:

Создайте отдельные группы управления для рабочих нагрузок, подключенных к Интернету и внутренних рабочих нагрузок ИИ. Разделение групп управления устанавливает критически важные границы управления данными между внешними ("онлайн") и внутренними (корпоративными) приложениями ИИ. Это разделение предотвращает доступ внешних пользователей к конфиденциальным внутренним бизнес-данным при сохранении соответствующих элементов управления доступом. Подход соответствует принципам архитектуры Azure посадочной зоны и поддерживает наследование политик между типами рабочих нагрузок.
Применение политик, относящихся к ИИ, к каждой группе управления. Начните с базовых политик из целевых зон Azure и при необходимости добавьте определения политик Политика Azure для Foundry, Foundry Tools, Поиск с использованием ИИ Azure и Виртуальные машины Azure. Применение политик обеспечивает единое управление ИИ на платформе и снижает контроль соответствия вручную.
Разверните ресурсы ИИ в подписках, предназначенных для конкретных рабочих нагрузок. Ресурсы ИИ должны наследовать политики управления от группы управления рабочей нагрузкой, а не подписок платформы. Это разделение предотвращает узкие места в разработке, возникающие из-за контроля команды платформы, и позволяет командам по рабочим нагрузкам действовать с надлежащей степенью автономии. Развертывайте рабочие нагрузки ИИ в подписках на целевые зоны приложений в средах Azure Landing Zone.

Сети искусственного интеллекта

Сеть ИИ охватывает проектирование сетевой инфраструктуры, меры безопасности и эффективные шаблоны передачи данных для рабочих нагрузок ИИ. Необходимо реализовать надлежащие средства управления безопасностью и параметры подключения, чтобы предотвратить нарушения на основе сети и обеспечить согласованную производительность. Это делается следующим образом:

Активируйте защиту Azure DDoS для интернет-ориентированных ИИ нагрузок.Azure DDoS Protection защищает ваши службы ИИ от потенциальных сбоев и простоя, вызываемых распределенными атаками типа "отказ в обслуживании". Защита от атак DDoS на уровне виртуальной сети защищает от наводнений трафика, предназначенных для приложений, подключенных к Интернету, и обеспечивает доступность служб во время атак.
Безопасный рабочий доступ к рабочим нагрузкам ИИ с помощью Бастион Azure. Используйте прыжковый сервер и Бастион Azure, чтобы обеспечить оперативный доступ к рабочим нагрузкам ИИ и предотвратить прямое интернет-воздействие на интерфейсы управления. Этот подход создает безопасный шлюз для административных задач при сохранении сетевой изоляции для ресурсов искусственного интеллекта.
Выберите подходящее подключение для локальных источников данных. Организациям, которые передают большие объемы данных из локальных источников в облачные среды, требуются подключения с высокой пропускной способностью для поддержки требований к производительности рабочей нагрузки ИИ.
- Use Azure ExpressRoute для передачи данных с большим объемом данных.Azure ExpressRoute обеспечивает выделенное подключение для больших объемов данных, обработки в режиме реального времени или рабочих нагрузок, требующих согласованной производительности. ExpressRoute включает функцию FastPath , которая повышает производительность пути к данным путем обхода шлюза ExpressRoute для определенных потоков трафика.
- Использовать Azure VPN Gateway для умеренной передачи данных.Azure VPN Gateway хорошо подходит для умеренных объемов данных, редкой передачи данных или при необходимости общедоступного доступа к Интернету. VPN-шлюз предлагает более простую настройку и эффективную операцию для небольших наборов данных по сравнению с ExpressRoute. Используйте соответствующую топологию и проектирование для рабочих нагрузок ИИ, включая VPN типа "сеть — сеть" для межсайтовых подключений и VPN типа "точка — сеть" для безопасного доступа к устройству.

Надежность искусственного интеллекта

Надежность искусственного интеллекта требует стратегического размещения и планирования резервирования для обеспечения устойчивой производительности и высокого уровня доступности. Организации должны обращаться к модели размещения, локальности данных и аварийному восстановлению, чтобы поддерживать надежные службы искусственного интеллекта. Необходимо спланировать стратегию регионального развертывания, чтобы избежать прерываний работы служб и оптимизировать производительность. Это делается следующим образом:

Конечные точки ИИ и несколько регионов. Рабочие нагрузки ИИ обычно используют по крайней мере два региона, где требования к доступности и критичности оправдывают добавленные затраты и сложность. Развертывания в нескольких регионах позволяют ускорить переключение и восстановление в случае региональных сбоев. Для региональных развертываний реализуйте Azure API Management для балансировки нагрузки запросов API между конечными точками ИИ.
Перед развертыванием проверьте доступность службы ИИ в целевых регионах. Различные регионы обеспечивают различные уровни доступности и поддержки функций службы ИИ. Проверьте доступность службы Azure по регионам, чтобы убедиться, что необходимые службы ИИ доступны.
Оцените ограничения квоты региона и требования к емкости. Средства Foundry имеют ограничения на региональные подписки, влияющие на крупномасштабные развертывания моделей и рабочие нагрузки вывода. Обратитесь к поддержка Azure заранее, когда ожидается необходимость в емкости, превышающей стандартные квоты, чтобы предотвратить нарушения работы служб во время масштабирования.
Оптимизируйте размещение данных для приложений генерации с дополнением поиска. Расположение хранилища данных значительно влияет на производительность приложений в сценариях RAG. Совместное размещение данных с моделями ИИ в одном регионе снижает задержку и повышает эффективность извлечения данных, хотя конфигурации между регионами остаются жизнеспособными для конкретных бизнес-требований.
Репликация критически важных ресурсов ИИ в вторичные регионы для обеспечения непрерывности бизнес-процессов. Для обеспечения непрерывности бизнес-процессов требуется репликация точно настроенных моделей, наборов данных RAG, обученных моделей и обучающих данных в вторичные регионы. Репликация ресурсов позволяет ускорить восстановление во время сбоя и поддерживать доступность службы в разных сценариях сбоя.

Фонд искусственного интеллекта

Фонд ИИ предоставляет базовую инфраструктуру и иерархию ресурсов, которая поддерживает рабочие нагрузки ИИ в Azure. Она включает в себя настройку масштабируемых, безопасных сред, которые соответствуют потребностям управления и эксплуатации. Надежная основа искусственного интеллекта обеспечивает эффективное развертывание рабочих нагрузок ИИ и управление ими. Она также обеспечивает безопасность и гибкость для будущего роста.

Использование целевой зоны Azure

Зона высадки Azure — это рекомендуемая отправная точка, которая подготавливает среду Azure. Она предоставляет предопределенную настройку для ресурсов платформы и приложений. После того как платформа будет развернута, вы можете развернуть рабочие нагрузки ИИ в выделенных целевых зонах приложений.

Если ваша организация использует Azure целевые зоны для рабочих нагрузок, продолжайте использовать их для рабочих нагрузок, использующих ИИ. Вы развертываете рабочие нагрузки ИИ в обычных целевых зонах приложений, как любые другие рабочие нагрузки. См. раздел AI в целевых зонах Azure. На рисунке 2 ниже показано, как рабочие нагрузки ИИ интегрируются в посадочной зоне Azure.

Рисунок 2. Рабочая нагрузка ИИ в целевой зоне Azure.

Создание среды ИИ

Если вы не используете целевую зону Azure, следуйте рекомендациям, приведенным в этой статье, чтобы создать среду ИИ. На следующей схеме показана базовая иерархия ресурсов. Он сегментирует внутренние рабочие нагрузки ИИ и рабочие нагрузки, подключенные к Интернету. Внутренние рабочие процессы используют политику для запрета онлайн-доступа клиентов. Это разделение защищает внутренние данные от воздействия внешних пользователей. Разработка ИИ должна предусматривать использование промежуточных серверов для управления ресурсами и данными ИИ.

Рис. 3. Базовая иерархия ресурсов для рабочих нагрузок ИИ.

Дальнейшие действия

Следующим шагом является создание и развертывание рабочих нагрузок ИИ в среде ИИ. Чтобы найти рекомендации по архитектуре, соответствующие вашим потребностям, воспользуйтесь приведенными ниже ссылками. Начните с архитектур платформы как службы (PaaS). PaaS — это рекомендуемый подход Microsoft к внедрению ИИ.

AI на платформах Azure

AI в инфраструктуре Azure

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-04-10