Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье рассматриваются следующие вопросы:
- Типы данных мониторинга, которые можно собирать для этой службы.
- Способы анализа данных.
Примечание.
Если вы уже знакомы с этой службой и (или) Azure Monitor и просто хотите знать, как анализировать данные мониторинга, см . раздел "Анализ " в конце этой статьи.
При наличии критически важных приложений и бизнес-процессов, использующих ресурсы Azure, необходимо отслеживать и получать оповещения для системы. Служба Azure Monitor собирает и агрегирует метрики и журналы из каждого компонента системы. Azure Monitor предоставляет представление о доступности, производительности и устойчивости, а также уведомляет вас о проблемах. Вы можете использовать портал Azure, PowerShell, Azure CLI, REST API или клиентские библиотеки для настройки и просмотра данных мониторинга.
- Дополнительные сведения об Azure Monitor см. в обзоре Azure Monitor.
- Дополнительные сведения о том, как отслеживать ресурсы Azure в целом, см. в статье "Мониторинг ресурсов Azure" с помощью Azure Monitor.
Примечание.
Эта статья в основном предназначена для администраторов, так как описывается мониторинг для службы машинного обучения Azure и связанных служб Azure. Если вы являетесь специалистом по обработке и анализу данных или разработчиком и хотите отслеживать сведения, относящиеся к выполнению обучения модели, ознакомьтесь со следующими документами:
- Мониторинг и анализ заданий в студии
- Метрики журналов, параметры и файлы с помощью MLflow
- Отслеживание экспериментов и моделей с помощью MLflow
Сведения о мониторинге данных, созданных моделями, развернутыми в сетевых конечных точках, см. в статье "Мониторинг сетевых конечных точек".
Важные инсайты
Некоторые службы в Azure имеют встроенную панель мониторинга в портал Azure, которая предоставляет отправную точку для мониторинга службы. Эти панели мониторинга называются Insights, и их можно найти в центре Insights Hub Azure Monitor в портале Azure.
Машинное обучение Azure может использовать Application Insights для отслеживания метрик и журналов. Встроенные метрики и журналы можно отправлять в Application Insights, а также использовать такие функции Application Insights, как динамические метрики, поиск транзакций, ошибки и производительность для дальнейшего анализа. Дополнительные сведения см. в статье Отслеживание сетевых конечных точек.
Типы ресурсов
Azure использует концепцию типов ресурсов и идентификаторов для идентификации всего в подписке. Типы ресурсов также являются частью идентификаторов ресурсов для каждого ресурса, работающего в Azure. Например, для виртуальной машины используется Microsoft.Compute/virtualMachinesодин тип ресурса. Список служб и связанных с ними типов ресурсов см. в разделе "Поставщики ресурсов".
Azure Monitor аналогично упорядочивает данные мониторинга в метрики и журналы на основе типов ресурсов, которые также называются пространствами имен. Различные метрики и журналы доступны для различных типов ресурсов. Служба может быть связана с несколькими типами ресурсов.
Дополнительные сведения о типах ресурсов для Машинного обучения Azure см. в справочнике по данным мониторинга машинного обучения.
Хранилище данных
Для Azure Monitor:
- Данные метрик хранятся в базе данных метрик Azure Monitor.
- Данные журнала хранятся в хранилище журналов Azure Monitor. Log Analytics — это средство в портале Azure, которое может запрашивать это хранилище.
- Журнал действий Azure — это отдельное хранилище с собственным интерфейсом в портале Azure.
При необходимости можно перенаправить данные журнала метрик и действий в хранилище журналов Azure Monitor. Затем с помощью Log Analytics можно запрашивать данные и сопоставлять их с другими данными журнала.
Многие службы могут использовать параметры диагностики для отправки данных метрик и журналов в другие расположения хранилища за пределами Azure Monitor. Примеры включают хранилище Azure, размещенные партнерские системы и партнёрские системы, не относящиеся к Azure, с помощью Центров обработки событий.
Подробные сведения о том, как Azure Monitor хранит данные, см. на платформе данных Azure Monitor.
Метрики платформы Azure Monitor
Azure Monitor предоставляет метрики платформы для большинства служб. Эти метрики перечислены ниже.
- По отдельности определяется для каждого пространства имен.
- Хранится в базе данных метрик временных рядов Azure Monitor.
- Легкий и способный обеспечивать оповещения практически в режиме реального времени.
- Используется для отслеживания производительности ресурса с течением времени.
Коллекция: Azure Monitor автоматически собирает метрики платформы. Настройка не требуется.
Маршрутизация: Вы также можете направлять некоторые метрики платформы в Azure Monitor Logs / Log Analytics, чтобы выполнять запросы к ним вместе с другими журнальными данными. Проверьте параметр экспорта DS для каждой метрики, чтобы узнать, можно ли использовать параметр диагностики для маршрутизации метрик в журналы Azure Monitor или Log Analytics.
- Для получения дополнительной информации см. настройки диагностики метрик.
- Сведения о настройке параметров диагностики для службы см. в статье "Создание параметров диагностики" в Azure Monitor.
Список всех метрик, которые можно собрать для всех ресурсов в Azure Monitor, см. в статье "Поддерживаемые метрики в Azure Monitor".
Список доступных метрик для Машинного обучения Azure см. в справочнике по данным мониторинга машинного обучения.
Все метрики Машинного обучения Azure находятся в пространстве имен рабочей области службы "Машинное обучение".
Журналы ресурсов Azure Monitor
Журналы ресурсов предоставляют аналитические сведения об операциях, выполненных ресурсом Azure. Журналы создаются автоматически, но их необходимо перенаправить в журналы Azure Monitor, чтобы сохранить или запросить их. Лог-файлы организованы по категориям. Заданное пространство имен может содержать несколько категорий журналов ресурсов.
Сбор: Журналы ресурсов не собираются и не хранятся, пока вы не создадите настройку диагностики и не перенаправите журналы в одно или несколько мест. Создавая параметр диагностики, нужно указать, какие категории журналов должны собираться. Существует несколько способов создания и обслуживания настроек диагностики, включая использование портала Azure, программное управление и через Политику Azure.
Маршрутизация: рекомендуемая настройка по умолчанию — маршрутизация журналов ресурсов в Azure Monitor Logs позволит вам делать запросы вместе с другими данными журнала. Также доступны другие расположения, такие как служба хранилища Azure, Центры событий Azure и некоторые партнеры по мониторингу Майкрософт. Для получения дополнительной информации см. журналы ресурсов Azure и назначения журналов ресурсов.
Подробные сведения о сборе, хранении и маршрутизации журналов ресурсов см. в разделе "Параметры диагностики" в Azure Monitor.
Список всех доступных категорий журналов ресурсов в Azure Monitor см. в статье "Поддерживаемые журналы ресурсов" в Azure Monitor.
Все журналы ресурсов в Azure Monitor имеют одинаковые поля заголовков, а затем поля для конкретной службы. Общая схема показана в разделе Схема журнала ресурсов Azure Monitor.
Доступные категории журналов ресурсов, связанные таблицы Log Analytics и схемы журналов для Машинного обучения Azure, см. в справочнике по данным мониторинга машинного обучения.
Журнал действий Azure
Журнал действий содержит события уровня подписки, отслеживающие операции для каждого ресурса Azure, как видно извне этого ресурса; например, создание нового ресурса или запуск виртуальной машины.
Коллекция: события журнала действий автоматически создаются и собираются в отдельном хранилище для просмотра в портале Azure.
Маршрутизация. Вы можете отправлять данные журнала действий в журналы Azure Monitor, чтобы их можно было анализировать вместе с другими данными журнала. Также доступны другие расположения, такие как служба хранилища Azure, Центры событий Azure и некоторые партнеры по мониторингу Майкрософт. Дополнительные сведения о маршрутизации журнала действий см. в разделе "Обзор журнала действий Azure".
Анализ данных мониторинга
Существует множество средств для анализа данных мониторинга.
Средства Azure Monitor
Azure Monitor поддерживает следующие основные средства:
Обозреватель метрик — средство в портале Azure, позволяющее просматривать и анализировать метрики для ресурсов Azure. Дополнительные сведения см. в разделе "Анализ метрик" с помощью обозревателя метрик Azure Monitor.
Log Analytics— средство в портал Azure, позволяющее запрашивать и анализировать данные журнала с помощью языка запросов Kusto (KQL). Дополнительные сведения см. в статье Начало работы с запросами журнала в Azure Monitor.
Журнал действий, имеющий пользовательский интерфейс в портале Azure для просмотра и базового поиска. Для более подробного анализа необходимо направлять данные в журналы Azure Monitor и выполнять более сложные запросы в Log Analytics.
Средства, которые позволяют более сложной визуализации, включают:
- Информационные панели, позволяющие объединить различные виды данных в одну область внутри портала Azure.
- Рабочие книги, настраиваемые отчеты, которые можно создать в портале Azure. Рабочие книги могут включать текст, метрики и запросы журналов.
- Grafana — открытая платформа, которая прекрасно подходит для создания операционных панелей мониторинга. С помощью Grafana можно создавать панели мониторинга, содержащие данные из нескольких источников, отличных от Azure Monitor.
- Power BI— служба бизнес-аналитики, которая предоставляет интерактивные визуализации в различных источниках данных. Вы можете настроить Power BI на автоматический импорт данных журналов из Azure Monitor, чтобы воспользоваться этими визуализациями.
Инструменты экспорта Azure Monitor
Вы можете получить данные из Azure Monitor в другие средства с помощью следующих методов:
Метрики. Используйте REST API для метрик для извлечения данных метрик из базы данных метрик Azure Monitor. API поддерживает выражения фильтров для уточнения полученных данных. Дополнительные сведения см. в справочнике по REST API Azure Monitor.
Журналы: используйте REST API или связанные библиотеки клиента.
Другим вариантом является экспорт данных рабочей области.
Для получения информации о начале работы с REST API для Azure Monitor см. пошаговое руководство по REST API мониторинга Azure.
Запросы Kusto
Данные мониторинга можно анализировать в хранилище журналов Azure Monitor или Log Analytics с помощью языка запросов Kusto (KQL).
Внимание
При выборе Журналы в меню службы на портале откроется Log Analytics с областью запроса, установленной для текущей службы. Эта область означает, что запросы журналов будут включать только данные из этого типа ресурса. Если вы хотите выполнить запрос, содержащий данные из других служб Azure, выберите журналы в меню Azure Monitor . Подробные сведения см. в статье Область запросов журнала и временной диапазон в Azure Monitor Log Analytics.
Список распространенных запросов для любой службы см. в интерфейсе запросов Log Analytics.
Используйте следующие запросы, чтобы отслеживать ресурсы Машинного обучения Azure:
Получение невыполненных заданий за последние пять дней:
AmlComputeJobEvent | where TimeGenerated > ago(5d) and EventType == "JobFailed" | project TimeGenerated , ClusterId , EventType , ExecutionState , ToolTypeПолучение записей о задании с определенным именем:
AmlComputeJobEvent | where JobName == "automl_a9940991-dedb-4262-9763-2fd08b79d8fb_setup" | project TimeGenerated , ClusterId , EventType , ExecutionState , ToolTypeПолучение событий кластера за последние пять дней для кластеров, где размер виртуальной машины Standard_D2s_v5:
AmlComputeClusterEvent | where TimeGenerated > ago(4d) and VmSize == "STANDARD_D2S_V5" | project ClusterName , InitialNodeCount , MaximumNodeCount , QuotaAllocated , QuotaUtilizedПолучите распределение узлов кластера за последние восемь дней:
AmlComputeClusterEvent | where TimeGenerated > ago(8d) and TargetNodeCount > CurrentNodeCount | project TimeGenerated, ClusterName, CurrentNodeCount, TargetNodeCount
При подключении нескольких рабочих областей Машинного обучения Azure к одной рабочей области Log Analytics вы можете запрашивать все ресурсы.
Чтобы получить количество работающих узлов в рабочих областях и кластерах за последний день, используйте следующую команду:
AmlComputeClusterEvent | where TimeGenerated > ago(1d) | summarize avgRunningNodes=avg(TargetNodeCount), maxRunningNodes=max(TargetNodeCount) by Workspace=tostring(split(_ResourceId, "/")[8]), ClusterName, ClusterType, VmSize, VmPriorityПолучите данные о неудачных запросах к конечной точке API в интернете за последний день:
AmlOnlineEndpointTrafficLog | where TimeGenerated > ago(1d) and ResponseCode != 200 | project TimeGenerated, EndpointName, DeploymentName, ResponseCode, ResponseCodeReason
Оповещения
Оповещения Azure Monitor заранее уведомляют вас о конкретных условиях, обнаруженных в данных мониторинга. Оповещения позволяют выявлять и устранять проблемы в системе, прежде чем клиенты заметят их. Дополнительные сведения см. в оповещениях Azure Monitor.
Существует множество источников распространенных оповещений для ресурсов Azure. Примеры распространенных оповещений для ресурсов Azure см. в запросах на оповещения журнала. Сайт базовых оповещений Azure Monitor (AMBA) предоставляет полуавтоматический метод реализации важных оповещений метрик платформы, панелей управления и рекомендаций. Сайт применяется к постоянно расширяющемуся подмножеству служб Azure, включая все службы, которые являются частью зоны приземления Azure (ALZ).
Общая схема оповещений стандартизирует обработку уведомлений от Azure Monitor. Дополнительные сведения см. в разделе "Общая схема оповещений".
Типов оповещений
Вы можете получать оповещения о любых источниках данных метрик или журналов на платформе данных Azure Monitor. Существует множество различных типов оповещений в зависимости от служб, которые вы отслеживаете, и данных мониторинга, которые вы собираете. Различные типы оповещений имеют различные преимущества и недостатки. Дополнительные сведения см. в разделе "Выбор правильного типа оповещений мониторинга".
В следующем списке описаны типы оповещений Azure Monitor, которые можно создать:
- Оповещения метрик оценивают метрики ресурсов на регулярной основе. Метрики могут быть метриками платформы, пользовательскими метриками, журналами из Azure Monitor, преобразованными в метрики или метриками Application Insights. Оповещения метрик также могут применять несколько условий и динамические пороговые значения.
- Оповещения журнала позволяют пользователям использовать запрос Log Analytics для оценки журналов ресурсов на предопределенной частоте.
- Оповещения журнала действий активируются при возникновении нового события журнала действий, соответствующего определенным условиям. Оповещения о работоспособности ресурсов и оповещения о работоспособности служб являются оповещениями журнала действий, которые информируют о состоянии работоспособности ваших служб и ресурсов.
Некоторые службы Azure также поддерживают оповещения интеллектуального обнаружения, оповещения Prometheus или рекомендуемые правила генерации оповещений.
Для некоторых служб можно отслеживать масштаб, применяя одно правило генерации оповещений метрик к нескольким ресурсам одного типа, которые существуют в одном регионе Azure. Для каждого отслеживаемого ресурса отправляются отдельные уведомления. Сведения о поддерживаемых службах и облаках Azure см. в статье "Мониторинг нескольких ресурсов с помощью одного правила генерации оповещений".
Примечание.
Если вы создаете или запускаете приложение, работающее в службе, аналитика приложений Azure Monitor может предложить дополнительные типы оповещений.
правила оповещений машинного обучения
В следующей таблице перечислены распространенные и рекомендуемые правила оповещения для машинного обучения.
| Тип оповещения | Условие | Описание |
|---|---|---|
| Развертывание модели завершилось неудачей | Тип агрегирования: сумма, оператор: больше, пороговое значение: 0 | При ошибке развертывания одной или нескольких моделей |
| Процент использования квоты | Тип агрегирования: среднее, оператор: больше, пороговое значение: 90 | Когда процент использования квоты превышает 90% |
| Недоступные для использования узлы | Тип агрегирования: сумма, оператор: больше, пороговое значение: 0 | Когда есть один или несколько неиспользуемых узлов |
Рекомендации Помощника
Для некоторых служб, если критические условия или неизбежные изменения происходят во время операций ресурсов, на странице обзора службы на портале отображается оповещение. Вы можете найти дополнительную информацию и рекомендуемые исправления для оповещения в рекомендациях Помощника в разделе Мониторинг в меню слева. Во время обычных операций рекомендации помощника не отображаются.
Дополнительные сведения об Azure Advisor см. в разделе обзор Azure Advisor.
Связанный контент
- Справочные сведения о метриках, журналах и других важных значениях, созданных для машинного обучения, см. в справочнике по данным мониторинга машинного обучения.
- Общие сведения о мониторинге ресурсов Azure см. в статье "Мониторинг ресурсов Azure" с помощью Azure Monitor.
- Сведения о работе с квотами, связанными с машинным обучением, см. в статье "Управление и запрос квоты для ресурсов Azure".