Что такое метрики сети контейнеров?

Расширенные сетевые службы контейнеров в Службе Azure Kubernetes (AKS) упрощают сбор комплексных метрик сети контейнеров, чтобы получить ценные сведения о производительности контейнерной среды. Возможность непрерывно фиксирует основные метрики на уровне узла и на уровне pod, включая объем трафика, удаленные пакеты, состояния подключения и время разрешения системы доменных имен (DNS) для эффективного мониторинга и оптимизации производительности сети.

Сбор этих метрик важен для понимания того, как контейнеры общаются, как трафик течёт между службами и где могут возникнуть узкие места или перебои. Расширенные сетевые службы контейнеров легко интегрируются с такими средствами мониторинга, как Prometheus и Grafana, чтобы обеспечить полное представление сетевых метрик. Используйте метрики для подробного устранения неполадок, оптимизации сети и настройки производительности.

В облачном мире поддержание работоспособной и эффективной сети в динамической контейнерной среде жизненно важно, чтобы обеспечить выполнение приложений должным образом. Без надлежащей видимости сетевого трафика и его шаблонов выявление потенциальных проблем или неэффективности становится сложной задачей.

Important

Начиная с 30 ноября 2025 г. служба Azure Kubernetes (AKS) больше не поддерживает или предоставляет обновления безопасности для Azure Linux 2.0. Образ узла Linux 2.0 Azure заморожен в выпуске 202512.06.0. Начиная с 31 марта 2026 г. образы узлов будут удалены, и вы не сможете масштабировать пулы узлов. Выполните миграцию в поддерживаемую версию Linux Azure, обновив пулы узлов до поддерживаемой версии Kubernetes или переключив ее на osSku AzureLinux3. Дополнительные сведения см. в вопросе о прекращении поддержки на GitHub и объявлении об устаревании обновлений Azure. Чтобы оставаться в курсе объявлений и обновлений, следуйте заметкам о выпуске AKS.

Ключевые преимущества

Глубокое представление о производительности сети
Улучшенное устранение неполадок и оптимизация
Упреждающее обнаружение аномалий
Улучшение управления ресурсами и масштабирования
Планирование емкости и соответствие требованиям
Фильтрация метрик на уровне источника для оптимизации затрат и снижения шума и фильтрация сетевых метрик контейнера
Упрощенные параметры хранилища метрик и визуализации. Доступны следующие параметры:
- Управляемая служба Azure для Prometheus и Azure Managed Grafana: Azure управляет инфраструктурой и обслуживанием, чтобы сосредоточиться на настройке метрик и визуализации метрик.
- Используйте собственные (BYO) Prometheus и Grafana: развертываете и настраиваете собственные экземпляры Prometheus и Grafana и управляете основной инфраструктурой.

Метрики, захваченные

Метрики уровня узла

Понимание работоспособности сети контейнеров на уровне узла имеет решающее значение для обеспечения оптимальной производительности приложения. Эти метрики предоставляют аналитические сведения о томе трафика, удаленных пакетах, количестве подключений и других данных по узлу. Метрики хранятся в формате Prometheus, поэтому их можно просмотреть в Grafana.

Следующие метрики агрегируются для каждого узла. Все метрики включают одну из этих меток:

cluster
instance (имя узла)

Cilium
Non-Cilium

В сценариях плоскости данных Cilium наблюдение за сетями контейнеров предоставляет метрики только для Linux. В настоящее время Windows не поддерживается. Cilium предоставляет несколько метрик, включая указанные ниже метрики, используемые при наблюдении за сетями контейнеров.

Имя метрики	Description	Дополнительные метки	Linux	Windows
cilium_forward_count_total	Общее число пересылаемых пакетов	`direction`	✅	❌
cilium_forward_bytes_total	Общее число перенаправленных байтов	`direction`	✅	❌
cilium_drop_count_total	Общее число потерянных пакетов	`direction`, `reason`	✅	❌
cilium_drop_bytes_total	Общее число утраченных байтов	`direction`, `reason`	✅	❌

Для сценариев плоскости данных, отличных от Cilium, наблюдение за сетями контейнеров предоставляет метрики для операционных систем Linux и Windows.

Созданные метрики описаны в следующей таблице.

Note

Из-за обнаруженной ошибки временно не отображаются сбросы TCP. В результате метрика networkobservability_tcp_flag_counters в настоящее время не публикуется. Наша команда активно работает над решением проблемы.

Имя метрики	Description	Дополнительные метки	Linux	Windows
networkobservability_forward_count	Общее число пересылаемых пакетов	`direction`	✅	✅
networkobservability_forward_bytes	Общее число перенаправленных байтов	`direction`	✅	✅
networkobservability_drop_count	Общее число потерянных пакетов	`direction`, `reason`	✅	✅
networkobservability_drop_bytes	Общее число утраченных байтов	`direction`, `reason`	✅	✅
networkobservability_tcp_state	Число активных сокетов TCP в настоящее время по состоянию TCP.	`state`	✅	✅
networkobservability_tcp_connection_remote	Число активных сокетов TCP в настоящее время по удаленному IP-адресу и порту.	`address` (IP), `port`	✅	❌
networkobservability_tcp_connection_stats	Статистика TCP-подключения. (например, отложенные ACK, TCPKeepAlive, TCPSackFailures)	`statistic`	✅	✅
networkobservability_tcp_flag_counters	Количество tcp-пакетов по флагу.	`flag`	❌	✅
networkobservability_ip_connection_stats	Статистика IP-подключения.	`statistic`	✅	❌
networkobservability_udp_connection_stats	Статистика подключения UDP.	`statistic`	✅	❌
networkobservability_udp_active_sockets	Количество текущих активных UDP-сокетов		✅	❌
networkobservability_interface_stats	Статистика интерфейса.	ИнтерфейсИмя, `statistic`	✅	✅

Метрики уровня pod (метрики Hubble)

Эти метрики Prometheus включают сведения об исходном и целевом pod, чтобы определить проблемы, связанные с сетью, на детальном уровне. Метрики охватывают такие сведения, как объем трафика, удаленные пакеты, сбросы TCP и потоки пакетов уровня 4/уровня 7. Метрики DNS, такие как ошибки DNS и запросы DNS отсутствующих ответов, собираются по умолчанию для плоскостей данных, отличных от Cilium. Для плоскостей данных Cilium политика полного доменного имени Cilium требуется для сбора метрик DNS, или клиенты также могут устранять неполадки DNS с помощью Интерфейса командной строки Hubble и наблюдения журналов в режиме реального времени.

В следующей таблице описаны метрики, агрегированные для каждого pod (информация об узле сохраняется).

Все метрики включают метки:

cluster
instance (имя узла)
source или destination
- Для исходящего трафика применяется метка, source указывающая исходное пространство имен pod и имя.
- Для входящего трафика применяется метка, destination указывающая пространство имен и имя целевого модуля pod.

Имя метрики	Description	Дополнительные метки	Linux	Windows
hubble_dns_queries_total	Общий объем ЗАПРОСОВ DNS по запросу	`source` или `destination`, `query`, `qtypes` тип запроса	✅	❌
hubble_dns_responses_total	Общее количество ответов DNS по запросу и ответу	`source`or `destination`, `queryqtypes` (тип запроса), `rcode` (возвращаемый код), `ips_returned` (число IP-адресов)	✅	❌
hubble_drop_total	Общее число потерянных пакетов	`source`или `destination`, `protocolreason`	✅	❌
hubble_tcp_flags_total	Общее число tcp-пакетов по флагу	`source` или `destination`, `flag`	✅	❌
hubble_flows_processed_total	Общий объем обработанных сетевых потоков (трафик уровня 4/7)	`source` или `destination`, `protocol`, `verdict`, `type`, `subtype`	✅	❌

Фильтрация сетевых метрик контейнера (предварительная версия)

Теперь, когда у вас есть возможность собирать комплексные метрики на уровнях узлов и модулей pod, вы можете столкнуться со значительным объемом данных. Чтобы снизить шум и оптимизировать затраты на хранение, наблюдение за сетями контейнеров предоставляет фильтрацию сетевых метрик контейнера. Эта функция позволяет фильтровать метрики в источнике перед их сбором и хранением, что позволяет контролировать, какие метрики наиболее важны для конкретных потребностей в мониторинге и устранении неполадок. Эта функция доступна только для кластеров Cilium.

Фильтрация сетевых метрик контейнера особенно важна в крупномасштабных рабочих средах, где объем метрик может повлиять на затраты на хранение и производительность запросов. Отфильтровав ненужные метрики в начале процесса сбора, вы можете сосредоточиться на данных, наиболее важных для ваших операций, сохраняя видимость, необходимую для эффективного мониторинга сети.

Возможность фильтрации поддерживает несколько измерений, включая фильтрацию на основе пространства имен для сосредоточения на конкретных приложениях, фильтрацию по подам (Pods) и меткам для целевого мониторинга, а также фильтрацию по метрикам для сбора только тех типов метрик, которые необходимы для вашего варианта использования. Эта гибкость позволяет обеспечить правильный баланс между комплексной наблюдаемостью и экономически эффективными операциями.

Дополнительные сведения о том, как включить фильтрацию метрик сети контейнеров, см. в статье "Настройка фильтрации метрик сети контейнеров ".

Limitations

Метрики уровня pod доступны только в Linux.
Плоскость данных Cilium поддерживается начиная с Kubernetes версии 1.29.
Метки имеют тонкие различия между кластерами Cilium и не-Cilium.
Для кластеров на основе Cilium метрики DNS доступны только для модулей pod, имеющих политики сети Cilium (CNP), настроенные в своих кластерах, или клиенты также могут устранять неполадки DNS с помощью интерфейса командной строки Hubble и наблюдения журналов в режиме реального времени.
Журналы потоков в настоящее время недоступны в облаке с воздушным зазором.
Ретранслятор Hubble может завершиться сбоем, если один из агентов узла Hubble выходит из строя, и это может вызвать перебои в работе интерфейса командной строки Hubble.
При использовании расширенных сетевых служб контейнеров (ACNS) в плоскостях данных, отличных от Cilium, поддержка FIPS недоступна на узлах Ubuntu 20.04 из-за ограничений ядра. Чтобы включить FIPS в этом сценарии, необходимо использовать пул узлов Linux Azure. Ожидается, что это ограничение будет разрешено с помощью выпуска Ubuntu 22 FIPS. Информацию об обновлениях см. в трекере проблем AKS.
Фильтрация метрик сети контейнеров доступна только для кластеров Cilium.

См. матрицу поддержки FIPS ниже:

Операционная система	Поддержка FIPS
Azure Linux 3.0	Yes
Azure Linux 2.0	Yes
Ubuntu 20.04	No

Это ограничение не применяется при запуске ACNS на плоскостях данных Cilium.

Scale

Управляемая служба для Prometheus в Azure Monitor и Azure Managed Grafana накладывает ограничения на масштабирование, специфичные для услуг. Дополнительные сведения см. в разделе "Сбор метрик Prometheus в большом масштабе в Azure Monitor".

Pricing

Important

Расширенные услуги контейнерной сети предоставляются на платной основе.

Дополнительные сведения о ценах см. в разделе "Расширенные сетевые службы контейнеров" — цены.

Сведения о создании кластера AKS с помощью наблюдаемости сети контейнеров для отслеживания метрик см. в статье Настройка сетевого наблюдения контейнеров для AKS.
Дополнительные сведения об услугах расширенной настройки сетей контейнеров для AKS.
Изучите функцию наблюдения за сетями контейнеров в расширенных сетевых службах контейнеров.
Изучите функцию безопасности сети контейнеров в расширенных сетевых службах контейнеров.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2025-11-08