Модель зрелости операционного превосходства

Путь к операционному совершенству — это процесс непрерывных улучшений, где каждый этап основывается на предыдущем, чтобы повысить эффективность и действенность в проектировании, реализации и поддержке рабочих процессов.

В основном это о упрощении ключевых методик, таких как развертывание, мониторинг, тестирование и автоматизация. Путешествие начинается с сильного фундамента: общий словарь, стандартизованные практики и мышление DevOps, которое поощряет совместную работу и стабильность. Оттуда стандартизация вводит согласованность и прогнозируемость в процессы. По мере того как команды становятся более опытными, отдельные задачи развиваются в интегрированных рабочих процессах, поддерживаемых рабочими возможностями, такими как автоматизированное тестирование, интеллектуальный мониторинг и непрерывная интеграция.

Когда системы вводятся в эксплуатацию в рабочей среде, операции усложняются. Команды оснащены для быстрого и надежного управления изменениями, соблюдения стандартов качества и уверенной реализации запросов на функции от продуктовых владельцев.

Самый зрелый этап — это все о оптимизации и инновациях. Здесь команды работают в масштабе, непрерывно адаптируя системы в режиме реального времени для удовлетворения изменяющихся бизнес-потребностей и технологических сдвигов. Однако это не фиксированное назначение; это динамическое мышление, готовность к постоянному улучшению и адаптации.

Модель структурирована на пяти отдельных уровнях зрелости, каждая из которых имеет основную цель и набор основных стратегий. Чтобы добиться значимых результатов производительности, начните оценивать, где искусственный интеллект может быть внедрен в свои операции с самого начала. Используйте приведенные ниже вкладки, чтобы изучить каждый уровень. Не забудьте также проверить выделенные компромиссы и связанные риски по ходу выполнения.

Значок цели Модернизировать операции посредством намеренного внедрения инструментов с поддержкой ИИ, чтобы уменьшить ручной труд, подверженный ошибкам, и обеспечить измеримую ценность.

Оценка рабочих процессов от начала до конца, чтобы определить, где ИИ может повысить согласованность и производительность, прагматически балансируя затраты, риски и время до достижения ценности.

Купить: готовые решения GenAI

У готовых средств GenAI есть встроенные возможности ИИ. Они могут быть широко классифицированы по намерению. Один из них — это универсальные интерактивные средства помощи, такие как GitHub Copilot, которые зависят от контекста и могут использоваться для различных задач. Эти средства не требуют установки и предоставления поддержки с учетом контекста, внедренной непосредственно в существующие рабочие процессы разработчика. Другая категория — это специально созданные средства и агенты, такие как агенты развертывания, агенты SRE, предназначенные для конкретных функций. Их можно интегрировать для повышения производительности разработчиков с помощью помощников по интегрированной среде разработки и интерфейса командной строки.

Существуют также службы Azure с интегрированными функциями ИИ, которые могут сопровождаться дополнительными затратами.

Сборка: GenAI с пользовательской реализацией

Custom GenAI внедряет ИИ непосредственно в рабочие процессы и рабочие процессы разработки, адаптированные к определенной рабочей нагрузке. Пользовательские агенты могут извлекать контекст из билетов, репозиториев кода, метрик и систем мониторинга для получения аналитических сведений, которые отражают текущее состояние операций и действовать в пределах определенных границ.

Более сложные реализации могут создавать и проверять код или инфраструктуру на основе внутренних стандартов, маршрутизировать работу на основе опыта или доступности, а также применять пользовательские модели машинного обучения для специализированных прогнозов. Этот подход обеспечивает более глубокую автоматизацию и более жесткое согласование с организационными процессами, но требует постоянного инвестиций в проектирование, качество данных, управление, безопасность и обслуживание.

Функциональные шаблоны ИИ

Ниже приведены некоторые из наиболее распространенных и подходных возможностей искусственного интеллекта, которые используются на практике, но этот список не является исчерпывающим. Используйте это в качестве вдохновения, чтобы оценить, где в ваших операциях можно внедрить ИИ для повышения производительности.

Замечание

Внедрение должно выполняться намеренно с течением времени: начните с ориентированных вариантов использования, таких как суммирование или создание контента, а затем введите агентские интерфейсы, которые перерабатывают задачи и рабочие процессы по мере роста возможностей и уверенности. На более высоком уровне зрелости многоагентные системы работают в интегрированных системах и данных для поддержки более сложных операционных сценариев.

  • Сводка. Средства искусственного интеллекта, которые считывают и конденсируют информацию из документов, отчетов, журналов или бесед, создавая краткие сводки, ключевые точки, используя язык и терминологию, которые пользователи будут понимать.
  • Рекомендации. Средства искусственного интеллекта, которые анализируют несколько источников данных вместе для обнаружения шаблонов и предоставления рекомендаций по контексту для операционных решений.
  • Создание артефактов. Средства искусственного интеллекта, которые преобразуют письменные требования в исполняемый код, определения инфраструктуры и автоматические тесты при соблюдении определенных стандартов.
  • Проверка политики. Средства искусственного интеллекта, которые просматривают код, конфигурации и рабочие процессы в соответствии с политиками, стандартами и проектными документами для обеспечения соответствия требованиям.
  • Действия по оптимизации. Средства искусственного интеллекта, использующие аналитические сведения в артефактах для маршрутизации работы и принятия решений.

Caution

Меры защиты не являются гипотетическими при привлечении агентов. Одна неконтролируемая модель, одна неисправная автоматизация или один параметр чрезмерного доступа может распространять ошибки, утечку конфиденциальных данных или компрометировать операционную целостность в масштабе.

Для защиты конфиденциальных данных все платформы должны применять строгое маскирование ПДн и ограничение доступа для безопасности. Пользователи видят только те выходные данные, к доступу к которых они авторизованы. Это означает, что выходные данные ИИ могут быть неполными, но полная видимость сопряжена с риском потенциального воздействия.

Анализ человека остается обязательным, особенно для архитектуры, безопасности и операционных проблем. Проверки должны сосредоточиться на намерении и рисках, а также на соответствии стандартам организации, вместо внимания к синтаксическому уровню деталей. Отзывы о проверках должны быть записаны для непрерывного улучшения запросов, шаблонов и стандартов.

✓ Агенты суммирования

Агенты суммаризации обычно используют простую архитектуру в стиле Copilot с понятным процессом извлечения и генерации ответов, что делает их относительно простыми для реализации и эксплуатации.

Риск: Суммирование несет риск правильности, особенно при синтезе в нескольких документах. Хотя ошибки не могут быть полностью устранены, операционный риск может быть сокращен с помощью объяснимости и добавочной навигации. Системы должны четко указывать, какое содержимое было обобщено и позволяет пользователям детализировать исходный материал для проверки.

Затраты на вывод могут накапливаться с течением времени. Перенаправляйте простые запросы к меньшим, менее затратным моделям, и резервируйте более сложные модели для сложного синтеза многодокументных материалов, принимая во внимание дополнительную оркестрацию, которая может потребоваться. Предоставьте краткие начальные сводки и позволить пользователям детализировать вспомогательные сведения и исходное содержимое.

Управление данными представляет дополнительные скрытые затраты. Активно управляйте жизненным циклом данных, чтобы предотвратить раздувание индекса, вызванное устаревшими документами или лишними версиями. Если требуется исторический контекст, сохраните предварительное содержимое путем преднамеренного управления версиями, а не неконтролируемого дублирования.

Прямая обратная связь пользователей ценна. Захватить входные данные о качестве и полезности резюме и использовать их для оценки решений маршрутизации моделей, эффективности индексов и влияния стратегий кэширования и предварительной обработки.

Примеры
  • Культура DevOps OE:01. Извлеките структурированные элементы, такие как действия, ответственные, крайние сроки и оценки рисков из неструктурированных документов.
  • Ответ на инцидент OE:08. Сводите инциденты, посмертные отчеты, выявленные проблемы безопасности и отчеты аудита, чтобы быстро получить представление об области, влиянии и результатах.

✓ Агенты рекомендаций

Агенты ИИ, предоставляющие рекомендации, полагаются на модели, ориентированные на обоснование, способные анализировать несколько источников данных. Эти модели должны иметь достаточную аналитическую глубину, чтобы поддерживать корреляцию между источниками, а не полагаться на упрощенные или чисто генеривные подходы.

Компромисс: Хотя более широкий охват может добавить ценность, перекрестные ссылки могут иметь неправильный вес или несоответствовать исходному намерению; чрезмерное использование таких ответов, созданных ИИ, рискует усилить ошибки и потенциально усложнить проблему с итеративными вызовами.

Обычно они увеличивают затраты на запрос и задержку вывода. Свести к минимуму внешние обращения, предпочитая меньшее количество более содержательных запросов вместо множества более детализированных запросов. Доступ к нескольким внешним источникам во время выполнения может быть дорогостоящим, поэтому выполняйте параллельный доступ к данным и, при возможности, предварительно загружайте данные в общие индексы.

Работа с несколькими источниками повышает сложность интеграции. Ошибки в одном источнике могут распространяться через конвейер рекомендаций. При объединении входных данных примените валидацию и средства защиты для обеспечения безопасности. Если требуется низкая задержка, запросы следует выполнять параллельно на различных источниках. Шаги предварительной обработки, которые не зависят от конкретного запроса, например классификации, обогащения и поиска. Кэшируйте промежуточные результаты и часто используемые функции для уменьшения повторяющихся вычислений.

Рассматривайте подсистемы рекомендаций как системы поддержки принятия решений, а не черные ящики. Объяснение является центральным для создания доверия и надежности эксплуатации. Системы должны предоставлять четкие обоснование рекомендаций, выделение ключевых сигналов и вклад источников данных. Рассмотрите возможность включения индикаторов достоверности (например, 0–100%), чтобы помочь нижестоящим системам или пользователям оценить надежность.

Примеры
  • OE:06 Проектирование цепочки поставок рабочей нагрузки. Найдите клиентские предельные случаи и сценарии, которые трудно обнаружить и которые часто остаются незамеченными, чтобы включить их в ваш набор тестов.
  • Управление инцидентами OE:08. Проверьте правильность планов перехода поставщиков, используя ИИ для имитации группы поддержки поставщиков с помощью только предоставленной документации, планов действий, моделей работоспособности и путей эскалации. Имитация выделяет пробелы и скрытые зависимости перед передачей.
  • Проектирование автоматизации OE:10. Оцените код автоматизации, данные телеметрии и инциденты, чтобы рекомендовать, какие службы автоматизации следует улучшить, снять с учета или развернуть.

✓ Агенты создания артефактов

Агенты ИИ могут помочь в создании кода, определений инфраструктуры и тестов, но их выходные данные могут стать частью рабочей нагрузки. Создание кода по сути является недетерминированным, и преобразование требований естественного языка в исполняемые артефакты может привести к результатам, которые отступят от исходного намерения. По этой причине четкое владение, явные элементы управления и интеграция с существующими методиками проектирования являются важными. ИИ наиболее эффективен в тех случаях, когда пространство проблем хорошо понято, а вариативность ограничена, например, в повторяющихся или стандартизированных задачах программирования, и к его выходным данным должны применяться контрольные меры.

Выбор правильных моделей имеет решающее значение. Используйте модели, подходящие для создания кода и выполнения инструментов, и сочетайте их в соответствии с соответствующими параметрами. Модель рассуждений может помочь в системном анализе, планировании или декомпозиции, модель, ориентированная на код, может создавать сами артефакты, а дополнительные модели могут послужить поддержкой на этапах тестирования или развертывания.

Создание должно основываться на шаблонах, эталонных реализациях, рекомендациях по написанию кода и примерах, которые отражают организационные и отраслевые стандарты. Четкие стандарты помогают обнаруживать смещение и применять согласованность. С помощью шаблонов выходные данные ИИ являются более предсказуемыми.

Как и большинство агентов, генераторы кода могут извлекаться из нескольких источников. Все выходные данные должны рассматриваться как ненадежные до тех пор, пока не будут проверены. Применение принципов наименьших привилегий для ограничения разрешений и областей выполнения инструментов. Агенты никогда не должны развертывать или изменять рабочие ресурсы без явного, контрольного утверждения.

Интеграция созданных артефактов в стандартный жизненный цикл разработчика. Сюда входят запросы на вытягивание, проверки кода, автоматическое тестирование и сканирование безопасности. Примените ту же строгость, что и для кода, созданных человеком, включая проверки зависимостей и сканирование инфраструктуры как кода, чтобы обеспечить надежность и соответствие требованиям.

Компромисс: Анализ человека остается частью модели затрат и должен быть учтен в ROI. Кроме того, увеличение генерации артефактов перемещает нагрузку по пропускной способности дальше по потоку; рабочие процессы тестирования, проверки и развертывания должны масштабироваться соответствующим образом, чтобы избежать появления новых узких мест. Автоматизация проверки везде, где это возможно, с помощью линтеров, тестов, статического анализа и проверок политик необходима для сохранения сквозного потока и сокращения времени получения ценности.

Примеры
  • OE:02 Стандартизировать операции. Генерируйте артефакты кода и документов, соответствующие стандартам организации, и обновляйте документацию по стандартам по мере развития активов.
  • OE:07 Проектирование системы мониторинга. Создайте конфигурации интегрированных панелей мониторинга, которые выравнивают метрики проектирования с бизнес-результатами, автоматически выбирая нужные метрики в разных источниках.
  • Проектирование автоматизации OE:10. Автономно отслеживайте рабочие среды на отклонения конфигурации, определяйте предполагаемое состояние и обновляйте настройки начальной загрузки для поддержания согласованности систем со временем.

✓ Агенты проверки политики

Агенты ИИ могут помочь в проверке и валидации активов на предмет соответствия политике и стандартам. Их роль заключается в поддержке принятия решений, выявлении отклонений и обеспечении соблюдения, в то время как люди сохраняют окончательный надзор.

Проверка начинается с тщательной оценки и тестирования перед развертыванием. Стандарты должны иметь версии, и каждый актив должен четко ссылаться на соответствующую политику, обеспечивая прослеживаемость. По мере развития политик необходимо учитывать затраты на обслуживание, а процессы проверки обновляются соответствующим образом. Выполняйте проверки пакетно и параллельно, а проверки изменений делайте инкрементно, вместо повторного сканирования всех ресурсов.

Затраты и производительность требуют тщательного баланса. Рассмотрим объем исторических данных, необходимых для точного прогнозирования влияния на хранение, обработку и задержку. Слишком мало данных снижает надежность, в то время как слишком много увеличивает затраты.

Безопасность остается ключевым фактором. Доступ к выходным данным проверки должен быть ограничен авторизованными пользователями, такими как рецензенты безопасности, обеспечивая защиту конфиденциальной информации.

Эффективность измеряется, а не предполагается. Используйте панели мониторинга для отслеживания таких метрик, как обнаруженные проблемы, проблемы в продакшене, ложные срабатывания и покрытие. Введите эти аналитические сведения обратно в логику проверки, запросы и операционные процессы, непрерывно уточняя вклад агента.

Примеры

✓ Агенты оптимизации действий

Агенты оптимизации действий выходят за рамки анализа и рекомендаций, принимая прямые операционные действия. Так как их выходные данные могут изменять системы или процессы, эти агенты требуют тщательного проектирования, надзора и интеграции с рабочими процессами.

Риск: Безопасность является основной проблемой. Агенты должны в идеале работать в процессе, включающем участие человека, где предлагаемые действия проходят проверку и утверждение перед выполнением в производственной системе. Доступ к средствам и системам должен соответствовать принципу наименьших привилегий, ограничивая агент только разрешениями, необходимыми для выполнения своих задач. Подробный аудит имеет важное значение, фиксируя предлагаемые действия, кто их одобрил, и журналы выполнения, обеспечивающие трассировку.

Реализуйте ограждения, которые обеспечивают минимальный радиус взрыва, сохраняя область каждого изменения ограничена. Выполнение инструментов должно быть идемпотентным, чтобы обеспечить безопасные повторные попытки, а система должна включать механизмы проверки и возврата. Контрольные точки, резервные копии или другие стратегии восстановления могут поддерживать безопасное исправление непредвиденных изменений.

Примеры
  • Управление инцидентами OE:08. Как только оповещение срабатывает, автоматически собирать контекст, сопоставлять данные и выполнять первоначальную оценку. Инженеры начинают с четкой картины инцидента вместо ручной сбора данных.
  • Проектирование автоматизации OE:10. Непрерывно оптимизируйте параметры рабочей среды с низким риском, такие как размеры кэша и значения времени ожидания, в пределах определенных человеком границ, используя значения, полученные из анализа данных мониторинга.
  • Методы безопасного развертывания OE:11. Автоматизируйте прогрессивную стратегию развертывания, при самостоятельном определении оптимального времени выпуска, а также правильного целевого сегмента и процентов для канареечного развертывания.

Дальнейшие шаги