Мониторинг Azure Service Fabric

2024-09-25

В этой статье рассматриваются следующие вопросы:

Типы данных мониторинга, которые можно собирать для этой службы.
Способы анализа данных.

Примечание.

Если вы уже знакомы с этой службой и (или) Azure Monitor и просто хотите знать, как анализировать данные мониторинга, см. раздел "Анализ" в конце этой статьи.

При наличии критически важных приложений и бизнес-процессов, использующих ресурсы Azure, необходимо отслеживать и получать оповещения для системы. Служба Azure Monitor собирает и агрегирует метрики и журналы из каждого компонента системы. Azure Monitor предоставляет представление о доступности, производительности и устойчивости, а также уведомляет вас о проблемах. Вы можете использовать портал Azure, PowerShell, Azure CLI, REST API или клиентские библиотеки для настройки и просмотра данных мониторинга.

Дополнительные сведения об Azure Monitor см. в Обзоре Azure Monitor.
Дополнительные сведения о том, как отслеживать ресурсы Azure в целом, см. в статье "Мониторинг ресурсов Azure" с помощью Azure Monitor.

Мониторинг Azure Service Fabric

Azure Service Fabric содержит следующие уровни, которые можно отслеживать:

Мониторинг приложений: приложения , выполняемые на узлах. Вы можете отслеживать приложения с помощью ключа Application Insights или пакета SDK, EventStore или ведения журнала в ASP.NET Core.
Мониторинг платформы (кластера): метрики клиентов, журналы и события для узлов платформы или кластера, включая метрики контейнеров. Метрики и журналы отличаются для узлов Linux или Windows.
Мониторинг инфраструктуры (производительности): Работоспособность служб и счетчики производительности для инфраструктуры служб.

Вы можете отслеживать использование приложений, действия, выполняемые платформой Service Fabric, использование ресурсов с счетчиками производительности и общее состояние работоспособности кластера. Журналы Azure Monitor и Application Insights предлагают встроенную интеграцию с Service Fabric.

Чтобы узнать о лучших практиках, смотрите статью «Лучшие практики мониторинга и диагностики для Azure Service Fabric».
Руководство по просмотру событий Service Fabric и отчетов о работоспособности, запроса API EventStore и мониторинга счетчиков производительности см . в руководстве по мониторингу кластера Service Fabric в Azure.
Сведения о настройке журналов Azure Monitor для мониторинга контейнеров Windows, управляемых в Service Fabric, см. в руководстве по мониторингу контейнеров Windows в Service Fabric с помощью журналов Azure Monitor.

Service Fabric Explorer

Service Fabric Explorer, классическое приложение для Windows, macOS и Linux, — это средство с открытым исходным кодом для проверки кластеров Azure Service Fabric и управления ими. Чтобы включить автоматизацию, все действия, которые можно выполнить с помощью Service Fabric Explorer, также можно выполнить с помощью PowerShell или REST API.

Мониторинг приложений

В процессе мониторинга приложений фиксируются особенности использования возможностей и компонентов приложения. Вы хотите отслеживать свои приложения, чтобы убедиться, что проблемы, влияющие на пользователей, были выявлены. Ответственность за мониторинг приложения лежит на пользователях, разрабатывающих приложение и его службы, так как он привязан к бизнес-логике приложения. Мониторинг приложений может оказаться полезным в следующих случаях.

Какой трафик у моего приложения? — Нужно ли масштабировать службы для удовлетворения потребностей пользователей или устранения потенциального узкого места в приложении?
Успешно ли выполняются и отслеживаются мои вызовы между службами?
Какие действия предпринимают пользователи моего приложения? — При разработке новых функций и выявлении ошибок в приложении можно ориентироваться на данные телеметрии.
Мое приложение выбрасывает необработанные исключения?
Что происходит в сервисах, работающих в моих контейнерах?

Самое замечательное в мониторинге приложений — это то, что разработчики могут использовать любые инструменты и платформы, так как он выполняется в контексте приложения! Дополнительные сведения о решении Azure для мониторинга приложений с помощью Azure Monitor Application Insights см. в анализе событий с помощью Application Insights.

У нас также есть руководство по настройке мониторинга для приложений .NET. Это руководство содержит инструкции по установке нужных инструментов и просмотру данных диагностики и телеметрии приложения на портале Azure, а также пример написания собственной телеметрии в приложении.

Ведение журнала приложения

Инструментирование кода — не только метод получения аналитических сведений о пользователях, но и единственный способ проверить наличие проблем в приложении, а также выяснить, где требуются исправления. Технически есть возможность подключить отладчик к рабочей службе, но обычно так никто не делает. Поэтому вам нужны подробные данные инструментирования.

Некоторые продукты автоматически выполняют инструментирование вашего кода. Они могут вполне успешно работать, но почти всегда требуется инструментирование вручную, которое должно соответствовать используемой бизнес-логике. В итоге у вас должно быть достаточно информации для экспертной отладки приложения. Приложения Service Fabric можно инструментировать на любой платформе ведения журналов. В этом разделе описываются несколько различных подходов к инструментированию вашего кода и когда стоит предпочесть один подход другому.

SDK Application Insights: Application Insights имеет богатую интеграцию с Service Fabric из коробки. Пользователи могут добавлять пакеты NuGet AI Service Fabric и получать данные и журналы, созданные и собранные, которые готовы к просмотру на портале Azure. Кроме того пользователям рекомендуется добавлять свои собственные данные телеметрии для диагностики и отладки своих приложений, а также получения сведения о самых используемых службах и частей приложений. Класс TelemetryClient в библиотеке SDK предоставляет множество способов отслеживания данных телеметрии в ваших приложениях. Дополнительные сведения см. в разделе "Анализ событий" и визуализация с помощью Application Insights.

Ознакомьтесь с примером, как инструментировать и добавлять аналитику приложений в ваше приложение в нашем руководстве по мониторингу и диагностике .NET приложений.
EventSource: Когда вы создаете решение Service Fabric из шаблона в Visual Studio, создается класс, который является производным от EventSource (ServiceEventSource или ActorEventSource). При этом создается шаблон, в который вы можете добавлять события для конкретного приложения или службы. Имя EventSource должно быть уникальным, поэтому потребуется изменить стандартную строку шаблона MyCompany-solution-project. Наличие нескольких определений EventSource с одинаковым именем приведет к возникновению проблемы во время выполнения. У каждого определенного события должен быть уникальный идентификатор. Если идентификатор не является уникальным, происходит сбой во время выполнения. Некоторые организации предварительно назначают для идентификаторов диапазоны значений, чтобы избежать конфликтов между командами разработчиков. Дополнительные сведения см. в блоге Вэнса (Vance) или в документации MSDN.
Логирование ASP.NET Core: Важно тщательно спланировать инструментирование вашего кода. Правильный план инструментирования позволит избежать потенциальной дестабилизации базы кода, которая повлечет за собой повторное инструментрирование кода. Чтобы снизить риск, вы можете применить библиотеку инструментирования, например Microsoft.Extensions.Logging, которая входит в Microsoft ASP.NET Core. ASP.NET Core имеет интерфейс ILogger, который можно использовать с любым поставщиком, минимизируя влияние на существующий код. Код ASP.NET Core можно использовать на платформах Windows, Linux и в полной версии .NET Framework, то есть код инструментирования будет полностью стандартизирован.

Для примеров по использованию этих рекомендаций см. статью Добавление логирования в приложение Service Fabric.

Мониторинг платформы (кластера)

Пользователь контролирует, какие данные телеметрии поступают из его приложения, так как он сам пишет код, но что насчет данных диагностики с платформы Service Fabric? Одна из целей создания Service Fabric — это обеспечение работы приложения в случае сбоев оборудования. Это достигается благодаря способности системных служб платформы обнаруживать проблемы с инфраструктурой и быстро выполнять отработку отказа рабочих нагрузок на другие узлы в кластере. Но в этом случае, что делать, если в самих системных службах есть проблемы? Или если при попытке развертывания или перемещения рабочей нагрузки нарушаются правила размещения служб? Service Fabric предоставляет диагностику, чтобы вы были в курсе об этих и многих других видов деятельности, происходящих в вашем кластере. Примеры сценариев для мониторинга кластера:

Дополнительные сведения о мониторинге платформы (кластера) см. в разделе «Мониторинг кластера».

События Service Fabric

Service Fabric предоставляет полный набор событий диагностики из коробки, доступ к которым можно получить через EventStore или канал операционных событий, предоставляемый платформой. Эти события Service Fabric иллюстрируют действия, выполненные платформой на различных сущностях, таких как узлы, приложения, службы и части. Эти события доступны как для кластеров Windows, так и для кластеров Linux.

Каналы событий Service Fabric: на Windows события Service Fabric доступны от одного поставщика ETW с использованием набора соответствующих logLevelKeywordFilters для выбора между операционными каналами и каналами обмена данными и сообщениями. Это способ, с помощью которого мы выделяем исходящие события Service Fabric для фильтрации при необходимости. В Linux все события Service Fabric проходят через LTTng и помещаются в одну таблицу службы хранения, в которой они могут быть отфильтрованы нужным образом. Эти каналы содержат проверенные структурированные события, которые помогают лучше понять состояние вашего кластера. Диагностика включается по умолчанию в момент создания кластера, и при этом создается таблица службы хранилища Azure, в которую отправляются события, поступающие из всех каналов для последующего запроса.
EventStore — это функция, которая отображает события платформы Service Fabric в Service Fabric Explorer и предоставляет программный доступ через REST API клиентской библиотеки Service Fabric. Вы можете видеть моментальный снимок того, что происходит в вашем кластере для каждого узла, службы и приложения, и выполнять запросы на основе времени события. API EventStore доступны только для кластеров Windows, работающих в Azure. На компьютерах Windows эти события передаются в журнал событий, чтобы вы могли видеть события Service Fabric в Просмотр событий.

Screenshot shows the EVENTS tab of the Nodes pane several events, including a NodeDown event. На снимке экрана показана вкладка "События" в панели "Узлы" с несколькими событиями, включая событие "NodeDown".

Диагностика предоставляется в форме исчерпывающего набора событий, готового к использованию сразу. Эти события Service Fabric иллюстрируют действия, выполняемые платформой с различными объектами, такими как узлы, приложения, службы, разделы и т. д. В последнем из приведенных выше сценариев, если узел выйдет из строя, платформа сгенерирует событие NodeDown, и вы можете немедленно получить уведомление от выбранного вами средства мониторинга. Другие примеры включают ApplicationUpgradeRollbackStarted или PartitionReconfigured во время отказоустойчивости. Эти события доступны как для кластеров Windows, так и для кластеров Linux.

События отправляются по стандартным каналам как в Windows, так и в Linux и могут считываться любым средством мониторинга, которое их поддерживает. Решение Azure Monitor — журналы Azure Monitor. Вы можете узнать больше об интеграции журналов Azure Monitor, которая включает в себя индивидуальную операционную панель мониторинга для вашего кластера и некоторые примеры запросов, из которых можно создавать оповещения. Больше концепций мониторинга кластера доступны на странице создание событий и журналов на уровне платформы.

Мониторинг здоровья

Платформа Service Fabric включает модель работоспособности, которая обеспечивает расширяемую отчетность о состоянии работоспособности сущностей в кластере. Каждый узел, приложение, служба, раздел, реплика или экземпляр имеет постоянно обновляемое состояние работоспособности. Состояние здоровья может быть "OK", "Предупреждение" или "Ошибка". Думайте о событиях Service Fabric как о командах, выполняемых кластером с различными объектами, а о работоспособности как о характеристике каждого объекта. Событие будет издаваться каждый раз, когда состояние здоровья объекта переходит из одного состояния в другое. Таким образом, вы можете настроить запросы и оповещения для событий, касающихся состояния системы, в выбранном вами инструменте мониторинга, как и для любых других событий.

Кроме того, мы даже позволяем пользователям переопределять состояние сущностей. Если ваше приложение проходит обновление, и у вас неудачно проходят тесты проверки, вы можете сообщить Service Fabric Health с помощью API работоспособности, что ваше приложение больше не является здоровым, и Service Fabric автоматически выполнит откат обновления. Чтобы узнать больше о модели мониторинга здоровья, ознакомьтесь с введением в мониторинг работоспособности Service Fabric.

Снимок экрана панели контроля SFX.

Наблюдатели

Как правило, служба наблюдения является отдельной службой, которая отслеживает работоспособность и нагрузку в службах, проверяет конечные точки и сообщает о непредвиденных событиях работоспособности в кластере. Он позволяет предотвратить ошибки, которые невозможно обнаружить только на основе производительности отдельной службы. В модулях наблюдения также удобно размещать код, выполняющий корректирующие действия, не требующие участия пользователя (например, очистку файлов журнала в хранилище через определенные интервалы времени). Если вам нужна полностью реализованная служба наблюдения Service Fabric с открытым кодом, включающая простую в использовании модель расширяемости механизмов наблюдения и работающая в кластерах Windows и Linux, см. проект FabricObserver. FabricObserver — это готовое к использованию программное обеспечение. Мы рекомендуем разворачивать FabricObserver в тестовых и рабочих кластерах и расширять его в соответствии с вашими потребностями, либо через модель подключаемых модулей, либо отвлекая и написав собственные встроенные наблюдатели. Рекомендуется использовать первый подход (подключаемые модули).

Мониторинг инфраструктуры (производительности)

Теперь, когда мы рассмотрели диагностику в вашем приложении и на платформе, как мы узнаем, что оборудование функционирует должным образом? Мониторинг базовой инфраструктуры является ключевым в понимании состояния кластера и использовании ресурсов. Измерение производительности системы зависит от многих факторов, которые могут быть субъективными в зависимости от рабочих нагрузок. Эти факторы обычно измеряется с помощью счетчиков производительности. Счетчики производительности могут поступать из различных источников, включая операционную систему, платформу .NET Framework или саму платформу Service Fabric. Сценарии, в которых они будут полезны:

Эффективно ли я использую свое оборудование? Вы хотите, чтобы ваш процессор работал на 90% или 10%? Это полезно при масштабировании кластера или оптимизации процессов приложения.
Можно ли прогнозировать проблемы с инфраструктурой? — Возникновению многих проблем предшествуют внезапные изменения (снижения) производительности, поэтому для прогнозирования и диагностики таких проблем можно использовать счетчики производительности, такие как сетевые операции ввода-вывода и использование ЦП.

Список счетчиков производительности, которые необходимо собрать на уровне инфраструктуры, можно найти на странице Метрики производительности.

Для мониторинга событий на уровне кластера рекомендуется использовать журналы Azure Monitor. После настройки агента Log Analytics с рабочей областью вы можете собирать:

Метрики производительности, такие как использование ЦП.
Счетчики производительности .NET, такие как использование ЦП на уровне процесса.
Счетчики производительности Service Fabric, например, количество исключений из отказоустойчивой службы.
Метрики контейнеров, такие как использование процессора.

Типы ресурсов

Azure использует концепцию типов ресурсов и идентификаторов для идентификации всего в подписке. Типы ресурсов также являются частью идентификаторов ресурсов для каждого ресурса, работающего в Azure. Например, одним из типов ресурсов для виртуальной машины является Microsoft.Compute/virtualMachines. Для получения списка служб и связанных с ними типов ресурсов см. в разделе "Поставщики ресурсов".

Azure Monitor аналогично упорядочивает ключевые данные мониторинга в метрики и журналы на основе типов ресурсов, также называемых пространствами имен. Различные метрики и журналы доступны для различных типов ресурсов. Служба может быть связана с несколькими типами ресурсов.

Дополнительные сведения о типах ресурсов для Azure Service Fabric см. в разделе Справочник по данным мониторинга Service Fabric.

Хранилище данных

Для Azure Monitor:

Данные метрик хранятся в базе данных метрик Azure Monitor.
Данные журнала хранятся в хранилище журналов Azure Monitor. Log Analytics — это средство на портале Azure, которое может запрашивать это хранилище.
Журнал действий Azure — это отдельное хранилище с собственным интерфейсом в портале Azure.

При необходимости можно перенаправить данные журнала метрик и действий в хранилище журналов Azure Monitor. Затем с помощью Log Analytics можно запрашивать данные и сопоставлять их с другими данными журнала.

Многие службы могут использовать параметры диагностики для отправки данных метрик и журналов в другие расположения хранилища за пределами Azure Monitor. Примеры включают службы хранилища Azure, размещенные партнерские системы и системы партнеров, отличные от Azure, с использованием Центров событий.

Для получения подробной информации о том, как Azure Monitor хранит данные, см. платформа данных Azure Monitor.

Метрики платформы Azure Monitor

Azure Monitor предоставляет метрики платформы для многих служб. Чтобы увидеть список всех метрик, которые можно собрать для всех ресурсов в Azure Monitor, см. статью "Поддерживаемые метрики в Azure Monitor".

Эта служба не собирает метрики платформы.

Метрики, отличные от Azure Monitor

Эта служба предоставляет другие метрики, которые не включены в базу данных метрик Azure Monitor.

Метрики гостевой ОС

Метрики гостевой операционной системы (OS), работающей на узлах кластера Service Fabric, должны собираться с помощью одного или нескольких агентов, работающих в гостевой ОС. Метрики гостевой ОС включают счетчики производительности, которые отслеживают нагрузку на ЦП или память гостевой ОС, данные о которой часто используются для автомасштабирования или создания оповещений.

Рекомендуется использовать и настроить агент Azure Monitor для отправки метрик производительности гостевой ОС с помощью API пользовательских метрик в базу данных метрик Azure Monitor. Метрики гостевой ОС можно отправлять в журналы Azure Monitor с помощью того же агента. Затем вы можете запросить эти метрики и журналы с помощью Log Analytics.

Примечание.

Агент Azure Monitor заменяет расширение Диагностика Azure и агент Log Analytics для маршрутизации гостевой ОС. Для получения дополнительной информации см. статью Общие сведения об агентах Azure Monitor.

Журналы ресурсов Azure Monitor

Журналы ресурсов предоставляют аналитические сведения об операциях, выполненных ресурсом Azure. Журналы создаются автоматически, но их необходимо перенаправить в журналы Azure Monitor, чтобы сохранить или запросить их. Логи организованы по категориям. Заданное пространство имен может содержать несколько категорий журналов ресурсов, которые можно собирать.

Эта служба не собирает журналы ресурсов, но информацию о них можно найти в данных мониторинга ресурсов Azure.

Журналы и события Service Fabric

Service Fabric может собирать следующие журналы:

Для кластеров Windows можно настроить мониторинг кластера с помощью агента диагностики и журналов Azure Monitor.
Для кластеров Linux журналы Azure Monitor также являются рекомендуемыми средствами для мониторинга платформы и инфраструктуры Azure. Для диагностики на платформе Linux требуется другая конфигурация. Для получения дополнительной информации см. раздел «События кластера Linux в Service Fabric» в Syslog.
Агент Azure Monitor можно настроить для отправки журналов гостевой ОС в журналы Azure Monitor, где их можно запрашивать с помощью Log Analytics.
Журналы контейнеров Service Fabric можно записывать в stdout или stderr, чтобы они были доступны в Azure Monitor Logs.
Вы можете настроить решение для мониторинга контейнеров в журнале Azure Monitor, чтобы просматривать события контейнера.

Другие решения для ведения журнала

Хотя мы рекомендуем два решения, журналы Azure Monitor и Application Insights, встроены в интеграцию со Service Fabric, многие события записываются через поставщиков ETW и расширяемы с другими решениями для ведения журнала. Стоит также рассмотреть Elastic Stack (особенно если вы планируете запускать кластер в автономной среде), Dynatrace или любую другую платформу по вашему выбору. Для получения списка интегрированных партнеров см. в разделе "Партнеры по мониторингу Azure Service Fabric".

Основные моменты, на которые следует обратить внимание при выборе платформы: удобство пользовательского интерфейса, возможности запроса данных, доступные визуализации и панели мониторинга, а также наличие дополнительных инструментов для улучшения мониторинга.

Журнал действий Azure

Журнал действий содержит события на уровне подписки, которые отслеживают операции для каждого ресурса Azure, как они видны из внешней среды; например, создание нового ресурса или запуск виртуальной машины.

Коллекция: события журнала действий автоматически создаются и собираются в отдельное хранилище для просмотра в портале Azure.

Маршрутизация. Вы можете отправлять данные журнала активности в Azure Monitor Logs, чтобы анализировать их вместе с другими данными журналов. Также доступны другие расположения, такие как служба хранилища Azure, Центры событий Azure и некоторые партнеры по мониторингу Майкрософт. Дополнительные сведения о маршрутизации журнала действий см. в разделе Обзор журнала действий Azure.

Анализ данных мониторинга

Существует множество средств для анализа данных мониторинга.

Средства Azure Monitor

Azure Monitor поддерживает следующие основные средства:

Обозреватель метрик в Azure — средство в портале Azure, позволяющее просматривать и анализировать метрики для ресурсов Azure. Для получения дополнительной информации см. обозреватель метрик Azure Monitor для анализа метрик.
Log Analytics— средство в портале Azure, позволяющее запрашивать и анализировать данные журнала с помощью языка запросов Kusto (KQL). Дополнительные сведения см. в статье Начало работы с запросами журнала в Azure Monitor.
Журнал действий имеет пользовательский интерфейс на портале Azure для просмотра и базового поиска. Для более подробного анализа необходимо направлять данные в журналы Azure Monitor и выполнять более сложные запросы в Log Analytics.

Средства, которые позволяют более сложной визуализации, включают:

Дашборды, которые позволяют объединять различные виды данных в одну панель в портале Azure.
Рабочие книги, настраиваемые отчёты, которые можно создать в портале Azure. Рабочие книги могут включать текст, метрики и лог-запросы.
Grafana — открытый платформенный инструмент, который превосходит в создании операционных панелей мониторинга. С помощью Grafana можно создавать панели мониторинга, содержащие данные из нескольких источников, отличных от Azure Monitor.
Power BI — служба бизнес-аналитики, предоставляющая интерактивные визуализации из различных источников данных. Вы можете настроить Power BI на автоматический импорт данных журналов из Azure Monitor, чтобы воспользоваться этими визуализациями.

Для общего ознакомления с распространенными сценариями аналитики мониторинга в Service Fabric см. в статье "Диагностика распространенных сценариев с помощью Service Fabric".

Инструменты экспорта Azure Monitor

Вы можете получить данные из Azure Monitor в другие средства с помощью следующих методов:

Метрики. Используйте REST API для метрик для извлечения данных о метриках из базы данных Azure Monitor. API поддерживает выражения фильтров для уточнения полученных данных. Дополнительные сведения см. в справочнике по REST API Azure Monitor.
Журналы: используйте REST API или связанные библиотеки клиентов.
Другим вариантом является экспорт данных рабочей области.

См. пошаговое руководство, чтобы начать работу с REST API для Azure Monitor.

Запросы Kusto

Данные мониторинга можно анализировать в хранилище журналов Azure Monitor или Log Analytics с помощью языка запросов Kusto (KQL).

Внимание

При выборе Журналов в меню службы на портале откроется Log Analytics с областью запроса, настроенной на текущую службу. Эта область означает, что запросы журналов будут включать только данные из этого типа ресурса. Если вы хотите выполнить запрос, содержащий данные из других служб Azure, выберите Журналы из меню Azure Monitor. Для получения подробной информации см. статью "Область запросов журнала и временной диапазон в Azure Monitor Log Analytics".

Список распространенных запросов для любой службы см. в интерфейсе запросов Log Analytics.

Примеры запросов

Следующие запросы возвращают события Service Fabric, включая действия на узлах. Сведения о других полезных запросах см. в разделе "События Service Fabric".

Этот запрос возвращает операционные события, записанные за последний час:

ServiceFabricOperationalEvent
| where TimeGenerated > ago(1h)
| join kind=leftouter ServiceFabricEvent on EventId
| project EventId, EventName, TaskName, Computer, ApplicationName, EventMessage, TimeGenerated
| sort by TimeGenerated

Возвращает отчеты о работоспособности при HealthState == 3 (ошибка) и извлекает дополнительные свойства из поля EventMessage:

ServiceFabricOperationalEvent
| join kind=leftouter ServiceFabricEvent on EventId
| extend HealthStateId = extract(@"HealthState=(\S+) ", 1, EventMessage, typeof(int))
| where TaskName == 'HM' and HealthStateId == 3
| extend SourceId = extract(@"SourceId=(\S+) ", 1, EventMessage, typeof(string)),
         Property = extract(@"Property=(\S+) ", 1, EventMessage, typeof(string)),
         HealthState = case(HealthStateId == 0, 'Invalid', HealthStateId == 1, 'Ok', HealthStateId == 2, 'Warning', HealthStateId == 3, 'Error', 'Unknown'),
         TTL = extract(@"TTL=(\S+) ", 1, EventMessage, typeof(string)),
         SequenceNumber = extract(@"SequenceNumber=(\S+) ", 1, EventMessage, typeof(string)),
         Description = extract(@"Description='([\S\s, ^']+)' ", 1, EventMessage, typeof(string)),
         RemoveWhenExpired = extract(@"RemoveWhenExpired=(\S+) ", 1, EventMessage, typeof(bool)),
         SourceUTCTimestamp = extract(@"SourceUTCTimestamp=(\S+)", 1, EventMessage, typeof(datetime)),
         ApplicationName = extract(@"ApplicationName=(\S+) ", 1, EventMessage, typeof(string)),
         ServiceManifest = extract(@"ServiceManifest=(\S+) ", 1, EventMessage, typeof(string)),
         InstanceId = extract(@"InstanceId=(\S+) ", 1, EventMessage, typeof(string)),
         ServicePackageActivationId = extract(@"ServicePackageActivationId=(\S+) ", 1, EventMessage, typeof(string)),
         NodeName = extract(@"NodeName=(\S+) ", 1, EventMessage, typeof(string)),
         Partition = extract(@"Partition=(\S+) ", 1, EventMessage, typeof(string)),
         StatelessInstance = extract(@"StatelessInstance=(\S+) ", 1, EventMessage, typeof(string)),
         StatefulReplica = extract(@"StatefulReplica=(\S+) ", 1, EventMessage, typeof(string))

Получите операционные события Service Fabric, связанные с конкретной службой и узлом.

ServiceFabricOperationalEvent
| where ApplicationName  != "" and ServiceName != ""
| summarize AggregatedValue = count() by ApplicationName, ServiceName, Computer

Оповещения

Оповещения Azure Monitor заранее уведомляют вас о конкретных условиях, обнаруженных в данных мониторинга. Оповещения позволяют выявлять и устранять проблемы в системе, прежде чем клиенты заметят их. Для получения более подробной информации посетите страницу об оповещениях Azure Monitor.

Существует множество источников распространенных оповещений для ресурсов Azure. Для примеров распространенных оповещений для ресурсов Azure см. Примеры запросов журналов оповещений. Сайт базовых оповещений Azure Monitor (AMBA) предоставляет полуавтоматический метод реализации важных оповещений метрик платформы, дашбордов и рекомендаций. Сайт применяется к постоянно расширяющемуся подмножеству служб Azure, включая все службы, которые являются частью зоны развертывания Azure (ALZ).

Общая схема оповещений стандартизирует обработку уведомлений об оповещениях Azure Monitor. Дополнительные сведения см. в разделе «Общая схема оповещений».

Типов оповещений

Вы можете получать оповещения о любых источниках данных метрик или журналов на платформе данных Azure Monitor. Существует множество различных типов оповещений в зависимости от служб, которые вы отслеживаете, и данных мониторинга, которые вы собираете. Различные типы оповещений имеют различные преимущества и недостатки. Дополнительные сведения см. в разделе «Выберите правильный тип оповещений мониторинга».

В следующем списке описаны типы оповещений Azure Monitor, которые можно создать:

Оповещения на основе метрик оценивают показатели ресурсов с регулярными интервалами. Метрики могут быть метриками платформы, пользовательскими метриками, журналами из Azure Monitor, преобразованными в метрики или метриками Application Insights. Оповещения метрик могут также применять несколько условий и динамические пороговые значения.
Оповещения журнала позволяют пользователям использовать запрос Log Analytics для оценки журналов ресурсов с заданной частотой.
Оповещения журнала действий активируются при возникновении нового события журнала действий, соответствующего определенным условиям. Оповещения о работоспособности ресурсов и оповещения о работоспособности служб — это оповещения журнала действий, которые сообщают о работоспособности ваших служб и ресурсов.

Некоторые службы Azure также поддерживают оповещения интеллектуального обнаружения, оповещения Prometheus или рекомендуемые правила оповещений.

Для некоторых служб можно отслеживать масштаб, применяя одно правило генерации оповещений метрик к нескольким ресурсам одного типа, которые существуют в одном регионе Azure. Для каждого отслеживаемого ресурса отправляются отдельные уведомления. Сведения о поддерживаемых службах и облаках Azure см. в статье "Мониторинг нескольких ресурсов с помощью одного правила генерации оповещений".

Правила генерации оповещений Service Fabric

В следующей таблице перечислены некоторые правила генерации оповещений для Service Fabric. Эти оповещения являются лишь примерами. Вы можете настроить уведомления для любой метрики, записи журнала или записи действий, указанных в справочнике по данным мониторинга Service Fabric или списке событий Service Fabric.

Тип оповещения	Условие	Описание
Событие узла	Узел выходит из строя	ServiceFabricOperationalEvent, где EventID >= 25622 и EventID <= 25626. Эти идентификаторы событий упомянуты в справочнике событий узла.
Событие приложения	Откат обновления приложения	ServiceFabricOperationalEvent, где EventID == 29623 или EventID == 29624. Эти идентификаторы событий находятся в справочнике по событиям приложения.
Работоспособность ресурса	Служба обновления недостижима или недоступна	Кластер переходит в состояние UpgradeServiceUnreachable.

Поделиться через

Мониторинг Azure Service Fabric

Мониторинг Azure Service Fabric

Service Fabric Explorer

Мониторинг приложений

Ведение журнала приложения

Мониторинг платформы (кластера)

События Service Fabric

Мониторинг здоровья

Наблюдатели

Мониторинг инфраструктуры (производительности)

Типы ресурсов

Хранилище данных

Метрики платформы Azure Monitor

Метрики, отличные от Azure Monitor

Метрики гостевой ОС

Журналы ресурсов Azure Monitor

Журналы и события Service Fabric

Другие решения для ведения журнала

Журнал действий Azure

Анализ данных мониторинга

Средства Azure Monitor

Инструменты экспорта Azure Monitor

Запросы Kusto

Примеры запросов

Оповещения

Типов оповещений

Правила генерации оповещений Service Fabric

Рекомендации Помощника

Рекомендуемая настройка

Связанный контент

Обратная связь

Дополнительные ресурсы