Поделиться через


Ошибки и действия в Azure Chaos Studio

В Azure Chaos Studio все действия, которые происходят в рамках эксперимента, называются действием. Наиболее распространенный тип действия — это ошибка. В этой статье описываются действия и ошибки и свойства каждого из них.

Действия эксперимента

Действие — это любое действие, оркестрованное в рамках эксперимента хаоса. Действия организованы по шагам и ветвям, что позволяет выполнять действия последовательно или параллельно. Каждое действие имеет следующие свойства:

  • Имя: конкретное действие, которое происходит. Имя обычно принимает форму URN для действия, например urn.
  • Тип: способ выполнения действия. Действия могут быть непрерывными или дискретными. Непрерывное действие выполняется в течение определенного периода времени. Пример применения давления ЦП в течение 10 минут. Дискретное действие происходит только один раз. Пример перезагрузки экземпляра Кэш Azure для Redis.

Типы действий

В Студии Хаоса есть два варианта действий:

  • Ошибки. Это действие приводит к нарушению одного или нескольких ресурсов.
  • Задержки времени: это действие "ждёт", не влияя на ресурсы. Это полезно для приостановки между сбоями, чтобы ждать, пока система будет затронута предыдущей ошибкой.

Ошибки

Ошибки являются наиболее распространенным действием в Chaos Studio. Сбои приводят к нарушению работы системы, что позволяет убедиться, что система эффективно обрабатывает это нарушение, не влияя на доступность.

Ошибки могут:

  • Быть разрушительным. Например, ошибка может убить процесс.
  • Применить давление. Например, ошибка может добавить давление виртуальной памяти.
  • Добавьте задержку.
  • Причина изменения конфигурации.

Помимо имени и типа, ошибки могут также иметь длительность, если непрерывная, и параметры. Параметры описывают, как должна применяться ошибка и относится к имени сбоя. Например, параметр для сбоя отработки отказа Azure Cosmos DB — это регион чтения, который будет повышен до области записи во время сбоя области записи. Некоторые параметры являются обязательными, а другие — необязательными.

Ошибки подразделяются на основанные на агенте или непосредственно связанные со службой в зависимости от типа цели. Для сбоя на основе агента требуется, чтобы агент Chaos Studio был установлен на виртуальной машине или масштабируемом наборе виртуальных машин. Агент доступен как для Windows, так и для Linux, но не все ошибки доступны в обеих операционных системах. Сведения о том, какие ошибки поддерживаются в каждой операционной системе, см. в библиотеке ошибок и действий Chaos Studio. Сбои непосредственной службы не требуют какого-либо агента. Они выполняются непосредственно в ресурсе Azure.

Ошибки также включают имя селектора, описывающего ресурсы, с которыми выполняется ошибка. Дополнительные сведения о селекторах см. в статье "Эксперименты Хаоса". Ошибка может повлиять только на ресурс, если ресурс был подключен в качестве целевого объекта и имеет соответствующую возможность сбоя в ресурсе.

Следующие шаги

Теперь, когда вы понимаете действия и ошибки, к которым вы готовы: