Поделиться через


Общие сведения о работоспособности ресурсов

Служба "Работоспособность ресурсов Azure" помогает диагностировать проблемы служб, влияющих на ресурсы Azure, и получить соответствующую поддержку. Служба сообщает о текущем и прошлом состоянии здоровья ваших ресурсов.

Снимок экрана панели

Отчеты о состоянии Azure о проблемах службы, влияющих на широкий набор клиентов Azure. Работоспособность ресурсов предоставляет персонализированную панель мониторинга работоспособности ресурсов и показывает все время, когда ресурсы недоступны из-за проблем со службой Azure. Эти данные позволяют легко узнать, было ли нарушено соглашение об уровне обслуживания .SLA.

Определение ресурсов и оценка состояния

Ресурс — это конкретный экземпляр службы Azure, например виртуальная машина, веб-приложение или база данных SQL. Для оценки состояния ресурса в службе "Работоспособность ресурсов" используются сигналы от различных служб Azure. Если ресурс неработоспособен, служба работоспособности ресурсов анализирует дополнительные сведения, чтобы определить источник проблемы. Он также сообщает о действиях, которые корпорация Майкрософт принимает для устранения проблемы и определяет действия, которые можно сделать для решения этой проблемы.

Дополнительные сведения об оценке работоспособности см. в списке типов ресурсов и проверок работоспособности в Azure Resource Health.

Сведения и действия по созданию оповещения о работоспособности ресурсов см. в статье "Создание оповещения о работоспособности ресурсов"

Состояние здоровья

Состояние ресурса отображается как статус.

В наличии

Доступно означает, что не обнаружено событий, влияющих на работоспособность ресурса. Если ресурс был восстановлен после незапланированного простоя в течение последних 24 часов, появится уведомление "Недавно восстановлено".

Снимок экрана: состояние *Доступно* для шлюза.

Недоступно

Недоступно означает, что служба обнаружила текущее событие платформы или неплатформенного события, влияющее на работоспособность ресурса.

События на платформе

Несколько компонентов инфраструктуры Azure инициируют события платформы. К ним относятся как запланированные действия (например, плановое обслуживание), так и непредвиденные инциденты (например, незапланированная перезагрузка узла или сниженное оборудование узла, которое, как ожидается, завершится сбоем после указанного периода времени).

Здоровье ресурсов предоставляет более подробную информацию о событии и процессе восстановления. Кроме того, вы можете обратиться в службу поддержки Майкрософт, даже если у вас нет активного соглашения о поддержке.

Снимок экрана: состояние *Недоступно* для виртуальной машины из-за события платформы.

Неплатформенные события

Действия пользователя могут активировать события, не связанные с платформой. Примеры включают остановку виртуальной машины или достижение максимального количества подключений к кэшу Azure для Redis.

Снимок экрана, демонстрирующий состояние Недоступно для виртуальной машины в результате внешнего события.

Неизвестно

Неизвестно означает, что в разделе работоспособности ресурсов отсутствует информация о ресурсе более 10 минут, что обычно происходит при освобождении виртуальных машин. Хотя это состояние не является окончательным указанием состояния ресурса, это может быть важная точка данных для устранения неполадок.

Если ресурс начнет работать должным образом, состояние ресурса изменится на Доступно через несколько минут.

Если у вас возникли проблемы с ресурсом, состояние работоспособности "Неизвестно " может означать, что событие на платформе влияет на ресурс.

Снимок экрана: состояние *Unknown* для плана службы приложений.

Деградация

Понижение означает, что ресурс обнаружил потерю производительности, хотя он по-прежнему доступен для использования.

Разные ресурсы имеют свои собственные критерии, когда они сообщают, что они ухудшаются.

Снимок экрана: состояние *Понижено* для виртуальной машины.

Для масштабируемых наборов виртуальных машин посетите состояние работоспособности ресурсов "Понижено" на странице масштабируемого набора виртуальных машин Azure для получения дополнительных сведений.

Поддержка здоровья не осуществляется

Существует два сообщения: работоспособность не поддерживается, или поставщик ресурсов (RP) не имеет сведений о ресурсе или у вас нет доступа на чтение и запись для этого ресурса. Это означает, что ресурс не поддерживается для метрик работоспособности.

Чтобы узнать, какие ресурсы поддерживают метрики работоспособности, перейдите на страницу "Поддерживаемые типы ресурсов ".

События работоспособности ресурсов, отправленные в журнал активности

Событие работоспособности ресурсов записывается в журнал действий, когда:

  • Аннотация, например, ResourceDegraded или AccountClientThrottling, отправляется для ресурса.
  • Ресурс перешел в состояние неисправности или вышел из него.
  • Ресурс неработоспособен более 15 минут.

В журнале действий не записываются переходы работоспособности ресурсов, перечисленные ниже:

  • Переход к неизвестному состоянию.
  • Переход из неизвестного состояния, если:
    • Этот переход в области здравоохранения первый.
    • Состояние до неизвестности совпадает с новым состоянием после. (Например, если ресурс перешел из "Работоспособного" в "Неизвестный" и обратно в "Работоспособный").
    • Для вычислительных ресурсов: виртуальные машины, которые переходят от работоспособного состояния к неработоспособному состоянию и обратно в работоспособное состояние, когда время пребывания в неработоспособном состоянии занимает менее 35 секунд.

Историческая информация

Замечание

Вы можете перечислить текущие события работоспособности службы в подписке и запрашивать данные за период до одного года, используя параметр QueryStartTime REST API Events - List By SubscriptionId.
Тем не менее, так как в разделе "События" нет параметра QueryStartTime — список по REST API одного ресурса , вы не можете запрашивать данные до одного года при перечислении текущих событий работоспособности службы для данного ресурса.

Вы можете получить доступ к истории до 30 дней в разделе истории работоспособности ресурсов на портале Azure.

Снимок экрана: список событий работоспособности ресурсов за последние две недели.

Сведения о первопричине

Если в Azure есть дополнительные сведения о основной причине недоступности, инициированной платформой, эта информация может быть размещена в работоспособности ресурсов до 72 часов после первоначальной недоступности. В настоящее время эта информация доступна только для виртуальных машин.

Начало работы

Чтобы открыть работоспособности ресурсов для одного ресурса, выполните приведенные действия.

  1. Войдите на портал Azure.
  2. Перейдите к вашему ресурсу.
  3. В меню ресурсов в левой области выберите "Работоспособности ресурсов".
  4. В матрице истории здоровья выберите ссылку на название ресурса, чтобы открыть новое окно со сведениями об этом ресурсе.
  5. В этом окне можно выбрать для диагностики и решения проблем или открыть средство устранения неполадок.

Снимок экрана: открытие работоспособности ресурсов из представления ресурсов.

Дальнейшие шаги

Изучите следующие источники, чтобы узнать больше о состоянии ресурсов.