Развертывание и тестирование критически важных рабочих нагрузок в Azure

Неудачные развертывания и ошибочные выпуски являются распространенными причинами сбоя приложений. Подход к развертыванию и тестированию играет важную роль в общей надежности критически важного приложения.

Развертывание и тестирование должны быть основой для всех операций приложений и инфраструктуры, чтобы обеспечить согласованные результаты для критически важных рабочих нагрузок. Будьте готовы к развертыванию еженедельно, ежедневно или чаще. Разработайте конвейеры непрерывной интеграции и непрерывного развертывания (CI/CD) для поддержки этих целей.

Стратегия должна реализовать следующее:

Строгое предварительное тестирование. Обновления не должны вводить дефекты, уязвимости или другие факторы, которые могут поставить под угрозу работоспособность приложений.
Прозрачные развертывания. В любое время можно развертывать обновления, не затрагивая пользователей. Пользователи должны продолжать взаимодействие с приложением без прерывания.
Высокодоступные операции. Процессы и средства развертывания и тестирования должны быть высокодоступен для обеспечения общей надежности приложений.
Согласованные процессы развертывания. Для развертывания инфраструктуры и кода приложения в разных средах следует использовать одни и те же артефакты и процессы приложения. Сквозная автоматизация является обязательной. Необходимо избежать вмешательства вручную, так как они могут привести к рискам надежности.

Эта область проектирования содержит рекомендации по оптимизации процессов развертывания и тестирования с целью минимизации простоя и поддержания работоспособности и доступности приложений.

Это важно

Эта статья является частью серии жизненно важных рабочих нагрузок в рамках Azure Well-Architected Framework. Если вы не знакомы с этой серией, мы рекомендуем начать с Что такое критически важная рабочая нагрузка?.

Развертывание без простоя

Просмотрите следующее видео для обзора развертывания без простоя.

Достижение развертываний без простоев — это основная цель для критически важных приложений. Ваше приложение должно быть доступно круглосуточно, всегда, даже если новые версии выпускаются в рабочее время. Приложите усилия заранее, чтобы определить и спланировать процессы развертывания, которые повлияют на ключевые решения по проектированию, такие как определение, считать ли ресурсы эфемерными.

Чтобы добиться развертывания без простоя, разверните новую инфраструктуру рядом с существующей инфраструктурой, тщательно протестируйте его, переключите трафик конечных пользователей и только затем выключите предыдущую инфраструктуру. Другие методики, такие как архитектура единиц масштабирования, также являются ключевыми.

Эталонные реализации Mission-Critical Online и Azure Mission-Critical Connected иллюстрируют этот подход к развертыванию, как показано на этой схеме.

Среды приложений

Просмотрите следующее видео, чтобы просмотреть общие сведения о рекомендациях для сред приложений.

Для проверки и выполнения операций развертывания требуется различные типы сред. Типы имеют различные возможности и жизненные циклы. Некоторые среды могут отражать производственную среду и иметь длительное время существования, а другие могут быть недолговечными и обладать меньшими возможностями, чем у производственной. Настройка этих сред в начале цикла разработки помогает обеспечить гибкость, разделение производственных и предварительных ресурсов и тщательное тестирование операций перед выпуском в рабочей среде. Все среды должны отражать рабочую среду как можно больше, хотя при необходимости можно применить упрощение к более низким средам. На этой схеме показана критически важная архитектура:

Существуют некоторые общие соображения.

Компоненты не должны совместно использоваться в средах. Возможные исключения являются нижестоящими устройствами безопасности, такими как брандмауэры и исходные расположения для синтетических тестовых данных.
Все среды должны использовать инфраструктуру в качестве артефактов кода (IaC), таких как Terraform или шаблоны Azure Resource Manager (ARM).

Среды разработки

Просмотрите следующее видео, чтобы узнать о временных средах разработки и автоматической проверке компонентов.

Тестовые или пробные среды

Эти среды используются для тестирования и проверки. Многие циклы тестирования выполняются для обеспечения развертывания без ошибок в рабочей среде. Соответствующие тесты для критически важной рабочей нагрузки описаны в разделе "Непрерывная проверка и тестирование ".

Рабочие среды

Эфемерные развертывания синего и зеленого цвета

Для модели развертывания синего и зеленого цвета требуется не менее двух идентичных развертываний. Синее развертывание — это активное, которое обслуживает пользовательский трафик в рабочей среде. Зелёное развертывание — это новая версия, которая подготовлена и протестирована для получения трафика. После завершения и тестирования развертывания зеленой версии, трафик постепенно перенаправляется с синей на зеленую версию. Если передача нагрузки выполнена успешно, зеленое развертывание становится новым активным развертыванием. Затем старое синее развертывание можно вывести из эксплуатации с помощью поэтапного процесса. Однако если в новом развертывании возникли проблемы, его можно прервать, и трафик может остаться в старом синем развертывании или перенаправить на него.

Azure Mission-Critical рекомендует подход к развертыванию синим и зеленым цветом, в котором инфраструктура и приложения развертываются вместе в рамках метки развертывания. Таким образом, развертывание изменений в инфраструктуре или приложении всегда приводит к зеленому развертыванию, которое содержит оба уровня. Этот подход позволяет полностью тестировать и проверять влияние изменений на инфраструктуру и всю систему в целом перед перенаправлением пользовательского трафика. Этот подход повышает уверенность в выпуске изменений и обеспечивает обновление без простоя, так как можно проверить совместимость с подчиненными зависимостями, такими как платформа Azure, поставщики ресурсов и модули IaC.

Развертывание в рамках подписки

В зависимости от требований к масштабированию вашего приложения может потребоваться несколько подписок в производственной среде, которые будут служить единицами масштабирования.

Просмотрите следующее видео, чтобы получить общие сведения о рекомендациях по области подписок для критически важного приложения.

Непрерывная проверка и тестирование

Тестирование — это критическое действие, которое позволяет полностью проверить работоспособность кода приложения и инфраструктуры. В частности, тестирование позволяет соответствовать стандартам надежности, производительности, доступности, безопасности, качества и масштабирования. Тестирование должно быть хорошо определено и применяться в рамках стратегии разработки приложений и DevOps. Тестирование является ключевым фактором во время локального процесса разработчика ( внутреннего цикла) и в рамках полного жизненного цикла DevOps ( внешнего цикла), который происходит при запуске кода на пути от процессов конвейера выпуска к рабочей среде.

Просмотрите следующее видео, чтобы получить общие сведения о непрерывной проверке и тестировании.

В этом разделе основное внимание уделяется тестированию внешнего цикла. В нем описываются различные типы тестов.

Тест	Описание
Модульное тестирование	Подтверждает, что бизнес-логика приложения работает должным образом. Проверяет общий эффект изменений кода.
Тестирование дыма	Определяет, доступны ли компоненты инфраструктуры и приложений и функционируют в соответствии с ожиданиями. Как правило, тестируется только один сеанс виртуального пользователя. Результатом должно быть то, что система отвечает ожидаемыми значениями и поведением. Распространенные сценарии тестирования дыма включают достижение конечной точки HTTPS веб-приложения, запрос базы данных и имитацию потока пользователя в приложении.
Тестирование пользовательского интерфейса	Проверяет, развернуты ли пользовательские интерфейсы приложений и что взаимодействие с пользовательским интерфейсом выполняется должным образом. Для управления автоматизацией пользовательского интерфейса следует использовать средства автоматизации пользовательского интерфейса. Во время теста пользовательского интерфейса скрипт должен имитировать реалистичный пользовательский сценарий и выполнить ряд шагов для выполнения действий и достижения предполагаемого результата.
Нагрузочное тестирование	Проверяет масштабируемость и операцию приложения путем быстрого увеличения нагрузки и (или) постепенно до достижения предопределенного порогового значения. Нагрузочные тесты обычно предназначены для определенного потока пользователя, чтобы убедиться, что требования приложения удовлетворяются определенной нагрузкой.
Стресс-тестирование	Применяет действия, которые перегружают существующие ресурсы, чтобы определить пределы возможности решения и проверить способность системы восстановиться корректно. Основной целью является определение потенциальных узких мест производительности и ограничений масштабирования. И наоборот, уменьшайте вычислительные ресурсы системы и отслеживайте, как она ведет себя под нагрузкой, и определите, может ли она восстановиться.
Тестирование производительности	Объединяет аспекты нагрузочного и стресс-тестирования, чтобы проверить производительность при нагрузке и установить поведение тестов для работы приложения.
Тестирование хаоса	Внедряет искусственные сбои в систему, чтобы оценить способ реагирования и проверить эффективность мер устойчивости, операционных процедур и устранения рисков. Завершение работы компонентов инфраструктуры, намеренное снижение производительности и введение ошибок приложений — это примеры тестов, которые можно использовать для проверки того, что приложение будет реагировать должным образом при выполнении сценариев.
Выполнение тестов на проникновение	Гарантирует, что приложение и его среда соответствуют требованиям ожидаемого состояния безопасности. Цель заключается в выявлении уязвимостей безопасности. Тестирование безопасности может включать сквозную цепочку поставок программного обеспечения и зависимости пакетов с проверкой и мониторингом известных распространенных уязвимостей и уязвимостей (CVE).

Инфраструктура в виде развертываний кода

Инфраструктура как код (IaC) обрабатывает определения инфраструктуры как исходный код, управляемый версией вместе с другими артефактами приложений. Использование IaC способствует согласованности кода в разных средах, устраняет риск человеческой ошибки во время автоматизированных развертываний и обеспечивает возможность трассировки и отката. Для развертывания по схеме синего/зеленого применение IaC с полностью автоматизированными развертываниями является обязательным.

Критически важный репозиторий IaC имеет два различных определения, которые соответствуют глобальным и региональным ресурсам. Сведения об этих типах ресурсов см. в шаблоне основной архитектуры.

Средства DevOps

Эффективное использование средств развертывания крайне важно для общей надежности, так как процессы DevOps влияют на общую функцию и структуру приложений. Например, операции отказоустойчивости и масштабирования могут зависеть от автоматизации, предоставляемой инструментами DevOps. Инженеры должны понимать влияние недоступности службы развертывания в отношении общей рабочей нагрузки. Средства развертывания должны быть надежными и высокодоступными.

Корпорация Майкрософт предоставляет два набора инструментов на основе Azure, GitHub Actions и Azure Pipelines, которые могут эффективно развертывать критически важные приложения и управлять ими.

Стратегия ветвления

Существует множество допустимых подходов к ветвлениям. Следует выбрать стратегию, которая обеспечивает максимальную надежность. Хорошая стратегия обеспечивает параллельную разработку, обеспечивает четкий путь от разработки к рабочей среде и поддерживает быстрые выпуски.

ИИ для DevOps

Методологии AIOps можно применять в конвейерах CI/CD, чтобы дополнить традиционные подходы к тестированию. Это позволяет обнаруживать потенциальные регрессии или ухудшения состояния, а также позволяет развертываниям быть предварительно остановленными, чтобы предотвратить потенциальные негативные последствия.

Следующий шаг

Ознакомьтесь с рекомендациями по обеспечению безопасности.

Безопасность

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2023-04-20

Поделиться через

Развертывание и тестирование критически важных рабочих нагрузок в Azure

Развертывание без простоя

Среды приложений

Среды разработки

Рекомендации по проектированию

Рекомендации по проектированию

Тестовые или пробные среды

Рекомендации по проектированию

Рекомендации по проектированию

Рабочие среды

Рекомендации по проектированию

Рекомендации по проектированию

Эфемерные развертывания синего и зеленого цвета

Рекомендации по проектированию

Рекомендации по проектированию

Развертывание в рамках подписки

Рекомендации по проектированию

Рекомендации по проектированию

Непрерывная проверка и тестирование

Рекомендации по проектированию

Рекомендации по проектированию

Инфраструктура в виде развертываний кода

Рекомендации по проектированию

Рекомендации по проектированию

Средства DevOps

Рекомендации по проектированию

Рекомендации по проектированию

Стратегия ветвления

Рекомендации по проектированию

Рекомендации по проектированию

ИИ для DevOps

Рекомендации по проектированию

Рекомендации по проектированию

Следующий шаг

Обратная связь

Дополнительные ресурсы