Применение принципов проектирования и расширенных операций
Первые три дисциплины управления облаком описывают базовый план управления. Базовый план управления должен включать в себя как минимум стандартное бизнес-обязательство по минимизации перерывов в работе бизнеса и ускорению восстановления при прерывании работы служб. Большинство базовых планов управления предполагают направленность на обеспечение инвентаризации и видимости, операционного соответствия, защиты и восстановления.
Цель базового плана управления заключается в создании согласованного предложения, обеспечивающего минимальный уровень бизнес-обязательств для всех поддерживаемых рабочих нагрузок. Этот базовый план типичных предложений по управлению позволяет команде обеспечивать высокооптимизированное управление операционными средами с минимальными отклонениями. Однако обязательств в рамках этого стандартного предложения может быть недостаточно для бизнеса.
На схеме в следующем разделе показаны три способа выхода за рамки базового плана управления.
Базовый план управления должен соответствовать минимальным обязательствам, которые требуются 80 процентам рабочих нагрузок с самым низким уровнем важности в портфеле. Базовый план не должен применяться к критически важным рабочим нагрузкам. Он также не должен применяться к общим платформам, которые используются рабочими нагрузками совместно. Эти рабочие нагрузки должны быть ориентированы на принципы проектирования и расширенные операции.
Расширенные операции
Существует три рекомендованных пути для расширения бизнес-обязательств за пределы базового плана управления, как показано на следующей схеме:
Улучшенный базовый план управления
Как описано в руководстве по управлению Azure, в улучшенном базовом плане управления используются облачные средства для увеличения времени доступности и ускорения восстановления. Улучшения существенны, но не настолько, как при специализации рабочей нагрузки или платформы. Преимущество улучшенного базового плана управления заключается в одинаково значительном снижении затрат и времени внедрения.
Специализация управления
Для аспектов операций рабочей нагрузки и платформы может потребоваться внести изменения в принципы проектирования и архитектуры. Эти изменения могут занять определенное время и привести к увеличению эксплуатационных расходов. Чтобы сократить количество рабочих нагрузок, требующих таких инвестиций, улучшенный базовый план управления может обеспечить достаточный уровень улучшения бизнес-обязательств.
Для рабочих нагрузок, которые требуют более значительных инвестиций для выполнения бизнес-обязательства, специализация операций является ключевым фактором.
Области специализации управления
Существуют две области специализации:
- Специализация платформы. Инвестируйте в текущие операции общей платформы, распределяя инвестиции между несколькими рабочими нагрузками.
- Специализация рабочей нагрузки. Инвестируйте в текущие операции определенной рабочей нагрузки, обычно критически важной.
Центральное ИТ-подразделение или облачный центр инноваций (CCoE)
Выбор между специализацией платформы и специализацией рабочей нагрузки зависит от степени важности и влияния каждой рабочей нагрузки. Однако этот выбор также обусловлен более серьезными культурными различиями между организационными моделями центрального ИТ-подразделения и CCoE.
Специализация рабочей нагрузки часто вызывает культурные изменения. Как традиционное, так и централизованное ИТ-подразделение разрабатывает процессы, которые обеспечивают поддержку в требуемом масштабе. Масштабирование поддержки легче достигается для повторяемых служб в базовом плане управления, улучшенном базовом плане или даже в операциях платформы. Специализация рабочей нагрузки зачастую не масштабируется. Из-за невозможности масштабирования централизованному ИТ-отделу труднее предоставлять необходимую поддержку без достижения ограничений организационного масштабирования.
В свою очередь, подход на основе облачного центра инноваций обеспечивает масштабирование путем целенаправленного делегирования ответственности и выборочной централизации. Специализация рабочей нагрузки, как правило, лучше соответствует методу делегирования ответственности в CCoE.
Естественное согласование ролей в CCoE происходит следующим образом:
- Команда, ответственная за облачную платформу, помогает создавать общие платформы, поддерживающие работу нескольких команд по внедрению облачных решений.
- Команда по автоматизации облака расширяет эти платформы, распространяя их на развертываемые активы в каталоге услуг.
- Команда по управлению облаком обеспечивает централизованное применение базового плана управления и помогает в использовании каталога услуг.
- Однако бизнес-подразделение (бизнес-группа DevOps или команды по внедрению облачных решений) несет ответственность за повседневные операции рабочей нагрузки, конвейера или производительности.
Что касается согласования областей управления, модели центрального ИТ-подразделения и CCoE, как правило, обеспечивают специализацию платформы с минимальными культурными изменениями. Обеспечение специализации рабочей нагрузки может быть более сложным для центрального ИТ-подразделения.
Процессы специализации управления
Каждая специализация состоит из выполнения следующих четырех этапов упорядоченным и последовательным образом. Такой подход требует сотрудничества между специалистами по внедрению облачных технологий, реализации облачной платформы, автоматизации облака и управлению облаком для создания жизнеспособного цикла обратной связи.
- Улучшение структуры систем. Улучшайте структуру общих систем (платформ) или определенных рабочих нагрузок для эффективного снижения количества прерываний.
- Автоматизация исправления. Некоторые улучшения не являются экономичными. В таких случаях можно автоматизировать исправление и снизить влияние прерываний.
- Масштабирование решения. По мере усовершенствования проектирования систем и автоматического исправления эти изменения можно масштабировать в среде с помощью каталога услуг.
- Непрерывное улучшение. Различные средства мониторинга можно использовать для поиска добавочных улучшений, которые можно применить в следующем этапе проектирования, автоматизации и масштабирования системы.
Улучшение проектирования системы
Улучшение проектирования системы — это самый эффективный подход к улучшению операций любой распространенной платформы. Благодаря улучшениям структуры системы можно повысить стабильность и уменьшить количество прерываний бизнес-процессов. Структура отдельных систем выходит за рамки представления среды, рассматриваемого в рамках Cloud Adoption Framework.
Дополнением к этой платформе служит Microsoft Azure Well-Architected Framework. Здесь представлены основные принципы повышения качества платформы или конкретной рабочей нагрузки. Решение ориентировано на улучшение в пяти базовых аспектах эффективности архитектуры:
- Оптимизация затрат: Управляйте затратами, чтобы повысить рентабельность.
- Эффективность операционных процессов. Придерживайтесь рабочих процессов, обеспечивающих функционирование системы в рабочей среде.
- Уровень производительности. Масштабируйте системы в соответствии с изменениями нагрузки.
- Надежность. Разрабатывайте системы, способные к восстановлению и возобновлению работы после сбоев.
- Безопасность. Обеспечьте защиту приложений и данных от угроз.
Большинство прерываний бизнес-процессов эквивалентны определенной форме технического долга или недостатка в архитектуре. Для существующих развертываний улучшения проектирования систем можно рассматривать как оплату имеющегося технического долга. Для новых развертываний улучшения проектирования систем можно рассматривать как избегание возникновения технического долга. В следующем разделе описывается, что делать с техническим долгом, который невозможно погасить или не следует погашать.
Чтобы улучшить структуру систем, ознакомьтесь с дополнительными сведениями о Microsoft Azure Well-Architected Framework. По мере улучшения структуры системы вернитесь к этой статье, чтобы найти новые возможности для улучшения и масштабирования этих улучшений в среде.
Автоматическое устранение
Некоторые технические долги невозможно погасить или не следует погашать. Устранение проблемы может быть слишком дорогостоящим. Оно может быть запланировано, но приведет к длительному выполнению. Прерывание бизнес-процессов может не оказывать существенного влияния на бизнес, либо приоритет бизнес-процесса заключается в быстром восстановлении, а не в инвестициях в устойчивость.
Если разрешение технического долга не является желаемым путем, следующим необходимым шагом является автоматическое исправление. Наиболее распространенный подход к автоматическому исправлению — использование службы автоматизации Azure и Azure Monitor для обнаружения тенденций и обеспечения автоматического исправления.
Рекомендации по автоматическому исправлению см. в статье Use an alert to trigger an Azure Automation runbook (Использование оповещения для активации runbook службы автоматизации Azure).
Масштабирование решения с помощью каталога служб
Основой специализации платформы и операций платформ является хорошо управляемый каталог служб. Это уровень того, как усовершенствования в проектировании и исправлении систем масштабируются в среде. Команды разработчиков облачной платформы и автоматизации облачных задач вместе создают повторяемые решения для самых распространенных платформ в любой среде. Однако если эти решения не используются постоянно, управление облаком предоставляет немного больше возможностей, чем базовое предложение.
Чтобы максимально повысить внедрение и снизить затраты на обслуживание любой оптимизированной платформы, необходимо добавить эту платформу в каталог услуг. Каждое приложение в каталоге можно развернуть для внутреннего использования с помощью каталога служб или как предложение Marketplace для внешних потребителей.
Сведения о публикации в каталоге услуг см. в этой серии статей.
Постоянное совершенствование
Специализация платформы и операции платформ зависят от надежных циклов обратной связи между командами внедрения, платформы, автоматизации и управления. Учет этих циклов обратной связи в данных позволяет каждой команде принимать разумные решения. Чтобы достичь долгосрочных бизнес-обязательств для операций платформы, важно использовать аналитические сведения, относящиеся к централизованной платформе. Так как контейнеры и SQL Server являются двумя наиболее распространенными централизованно управляемыми платформами, можно приступить к сбору данных непрерывных улучшений с помощью следующих статей:
- Azure Monitor for containers overview (Обзор Azure Monitor для контейнеров)
- Monitor Azure SQL Database using Azure SQL Analytics (Preview) (Мониторинг Базы данных SQL Azure с помощью решения "Аналитика SQL Azure" (предварительная версия))
- Optimize your SQL environment with the SQL Server Health Check solution in Azure Monitor (Оптимизация среды SQL с помощью решения "Проверка работоспособности SQL Server" в Azure Monitor)