Поделиться через


Мониторинг облачной среды

Для обеспечения плавной работы рабочих нагрузок требуется наблюдение за облачной средой, независимо от того, является ли вы владельцем бизнеса, владельцем платформы или владельцем приложения. Вам нужно знать, если:

  • Ваши приложения доступны и выполняются ли они в ожидании клиентов.
  • У вас есть какие-либо угрозы безопасности, требующие расследования.
  • Затраты на потребление находятся в ожидаемом диапазоне.

Мониторинг — это процесс сбора, анализа и действия в телеметрии, который указывает на работоспособность платформы, ресурсов и приложений. Эффективная среда мониторинга включает весь облачный ресурс, который может включать ресурсы в нескольких облаках и локальных средах.

Наблюдаемость — это свойство системы, которая измеряет, насколько хорошо его внутренние состояния можно вывести из внешних выходных данных. Необходимо развернуть службы и процессы для мониторинга облачной среды. И вам нужно иметь возможность наблюдать и понимать поведение служб, работающих в облаке.

Преимущества мониторинга

Инвестируйте в среду мониторинга, чтобы получить следующие преимущества в нескольких аспектах облака:

  • Доступность и производительность: отслеживайте ресурсы, чтобы обеспечить доступность облачных служб и приложений и их выполнение должным образом. Чтобы определить и реагировать на проблемы, прежде чем они влияют на пользователей, отслеживайте ключевые метрики и настраивайте правила генерации оповещений.

  • Оптимизация затрат: используйте мониторинг для отслеживания использования ресурсов и масштабирования ресурсов в соответствии с требованиями. Этот подход помогает предотвратить избыточные и неиспользуемые ресурсы, что оптимизирует затраты. Мониторинг также может определять и оповещать вас о превышении затрат или непредвиденных пиках использования.

  • Соответствие требованиям. Используйте мониторинг для поддержания журналов и записей действий, которые помогают обеспечить соответствие облачных служб политикам и нормативным требованиям. Отчеты, использующие эти данные, могут помочь в регулярных аудитах и проверках соответствия.

  • Безопасность. Реализуйте непрерывный мониторинг для обнаружения угроз безопасности и уязвимостей, чтобы вы могли немедленно действовать для защиты данных и ресурсов. Вы также можете анализировать собранные данные для обнаружения угроз и реагирования.

Платформы мониторинга

Эффективная стратегия мониторинга включает все платформы в вычислительной среде. В дополнение к Azure могут быть локальные, многооблачные и пограничные ресурсы. Для каждого ресурса требуются одинаковые уровни мониторинга. Следуйте рекомендациям Cloud Adoption Framework для Azure и включите мониторинг в стратегию унифицированных операций. В этой стратегии основное облако размещает средства мониторинга и другие средства управления. Средства мониторинга отслеживают все ресурсы на всех платформах.

Концептуальная схема, показывающая стратегию унифицированных операций.

Типы мониторинга

Мониторинг — это многоплановая дисциплина, требующая сочетания инструментов, процессов и практик. В следующей таблице рассматриваются различные типы мониторинга. Различные службы и функции могут предоставлять различные сочетания этих типов мониторинга. Но комплексная среда мониторинга включает все эти типы мониторинга на каждой из платформ в вычислительной среде.

Тип Описание
Инфраструктура Мониторинг инфраструктуры включает производительность и доступность облачных ресурсов, таких как виртуальные машины, ресурсы хранилища и сети. Этот тип мониторинга помогает обеспечить оптимальную работу базовой инфраструктуры, которая помогает поддерживать доступность и производительность приложений, которые полагаются на него.
Мониторинг производительности приложений (APM) APM отслеживает производительность и доступность приложений, работающих в облаке. Он отслеживает метрики, такие как время отклика, частота ошибок и тома транзакций. APM определяет узкие места производительности и помогает обеспечить соответствие приложений ожиданиям пользователей.
База данных Мониторинг базы данных отслеживает производительность, доступность и потребление ресурсов облачных баз данных. Ключевые метрики включают производительность запросов, использование индекса и состояние блокировки.
Network Мониторинг сети отслеживает производительность и доступность сетевых компонентов в облачной среде. Метрики включают использование пропускной способности, задержку и потерю пакетов.
Безопасность Мониторинг безопасности отслеживает и анализирует события безопасности и уязвимости в облачной среде, включая несанкционированный доступ, вредоносные программы и нарушения соответствия требованиям. Эффективный мониторинг безопасности помогает защитить конфиденциальные данные, обеспечить соответствие нормативным требованиям и предотвратить дорогостоящие нарушения безопасности.
Соответствие нормативным требованиям Мониторинг соответствия требованиям помогает обеспечить соответствие облачной среде нормативным и отраслевым стандартам. Он отслеживает конфигурации, элементы управления доступом и методики обработки данных, чтобы обеспечить соответствие соответствующим нормативным требованиям.
Себестоимость Мониторинг затрат отслеживает использование облачных расходов и ресурсов для выявления возможностей экономии затрат и предотвращения перерасхода бюджета. Он отслеживает использование ресурсов, определяет неиспользуемые ресурсы и оптимизирует конфигурации ресурсов, чтобы снизить затраты.

Совместная ответственность

В локальной среде вы несете ответственность за все аспекты мониторинга, так как вы владеете всеми вычислительными ресурсами и управляете ими. В облаке вы разделяете эту ответственность с поставщиком облачных служб. В зависимости от типа выбранной модели развертывания обязанности по мониторингу различных уровней облачного стека могут передаваться от поставщика облачных служб.

В развертывании инфраструктуры как службы (IaaS) поставщик облачных служб отслеживает базовую облачную платформу, например физический уровень инфраструктуры и виртуализации. И вы отслеживаете операционную систему, приложения и данные, которые выполняются на виртуальных машинах, развернутых на облачной платформе. Когда модель развертывания перемещается вверх по стеку, поставщик облачных служб несет большую ответственность за мониторинг среды. Эта ответственность завершается развертыванием программного обеспечения как службы (SaaS), так как вы передаете ответственность за мониторинг поставщику облачных служб для всего стека, включая приложение и данные.

Схема, на которой показаны общие обязанности по мониторингу в облаке.

Вы можете использовать средства мониторинга от поставщика облачных служб для мониторинга уровней стека, но вы несете ответственность за настройку этих средств и анализ собираемых данных. Вам необходимо предоставить доступ к различным членам организации и создавать панели мониторинга и оповещения, чтобы помочь им различать критически важные сведения. Эти компоненты также могут потребоваться интегрировать с другими инструментами и системами билетов, которые использует ваша организация.

Поставщик облачных служб должен выполнять те же типы служб для их слоев стека, который вы предоставляете внутренним клиентам. Они должны постоянно отслеживать работоспособность и производительность платформы, которую они контрактируют с вами. Они предоставляют вам панели мониторинга и оповещения для упреждающего уведомления о любых проблемах службы. Так же, как и внутренние клиенты, вам не требуется видимость того, как поставщик облачных услуг отслеживает свою платформу, только то, что они соответствуют соглашениям об уровне обслуживания, которые вы контрактируете с ними.

Роли и обязанности

Большинство корпоративных организаций имеют централизованную группу операций, которая отслеживает общую работоспособность и производительность облачной среды.

Обычно эта команда:

  • Задает стратегии для всей компании.
  • Выполняет централизованную конфигурацию среды мониторинга.
  • Делегирует разрешения заинтересованным лицам в организации, которым требуется доступ к данным мониторинга, связанным с их приложениями и службами.

Организации имеют несколько ролей, которые поддерживают среду мониторинга и требуют доступа к данным мониторинга для выполнения своих функций задания. Каждая роль имеет разные требования для мониторинга данных на основе их конкретных обязанностей. В зависимости от размера организации может быть несколько отдельных пользователей, которые заполняют каждую роль, или у вас может быть один человек, который заполняет несколько ролей.

Отдельные организации могут распределять обязанности по-разному. В следующей таблице показан пример ролей и обязанностей для типичной организации.

Роль Description
Архитектор облака Архитектор облака разрабатывает и контролирует облачную инфраструктуру, чтобы обеспечить соответствие бизнес-целям организации. Архитектор облака фокусируется на надежности, безопасности и масштабируемости облачной архитектуры. Им требуется высокоуровневая телеметрия, чтобы получить целостное представление о цифровом активе. Эта телеметрия включает метрики использования ресурсов, метрики APM, аналитические сведения о затратах и выставлении счетов и отчеты о соответствии.
Инженер платформы Инженер платформы создает и управляет платформой, которую разработчики используют для развертывания своих приложений. Инженер платформы может создавать конвейеры непрерывной интеграции и непрерывной доставки (CI/CD), управлять облачной инфраструктурой как кодом (IaC) и обеспечивать масштабируемость и надежность платформы. Инженер платформы требует телеметрии о состоянии работы платформы. Эта телеметрия включает метрики производительности контейнера, журналы оркестрации, проверку IaC и доступность служб.
Системный администратор Системный администратор управляет серверами, операционными системами и другими компонентами инфраструктуры в облаке. Они выполняют резервное копирование, устраняют неполадки и обеспечивают актуальность систем. Системный администратор требует данных телеметрии уровня ОС и сервера, включая ЦП, память и использование дисков, производительность сети и системные журналы.
Инженер по безопасности Инженер по безопасности реализует и управляет мерами безопасности для защиты данных и приложений от угроз. Инженер безопасности обрабатывает все, от управления удостоверениями до обнаружения угроз и реагирования. Они используют данные телеметрии о событиях безопасности, включая журналы доступа, оповещения обнаружения угроз, оценки уязвимостей и метрики соответствия требованиям.
Администратор сети Администратор сети управляет и поддерживает облачную сеть, чтобы обеспечить безопасный и эффективный поток данных между серверами, приложениями и пользователями. Администратор сети обрабатывает конфигурации сети, отслеживает производительность и реализует меры безопасности. Для них требуются сетевые данные телеметрии, включая анализ сетевого трафика, измерения задержки, потери пакетов и журналы брандмауэра.
Администратор базы данных (DBA) DBA управляет базами данных и поддерживает их, чтобы обеспечить целостность данных, производительность и доступность. DBA обрабатывает резервные копии и восстановление базы данных и оптимизирует запросы для повышения эффективности. Они используют данные телеметрии о производительности и целостности базы данных, включая метрики производительности запросов, время отклика базы данных, журналы транзакций и состояние резервного копирования или восстановления.
разработчик. Разработчик разрабатывает, записывает, тестирует и поддерживает программное обеспечение, работающее на облачных платформах. Разработчик создает функции и исправляет ошибки, помогающие обеспечить безопасность приложения и его работу. Для них требуются данные телеметрии для конкретного приложения, включая частоту ошибок, задержку, время отклика, аналитику поведения пользователей и метрики использования функций.

Упрощение функций Azure

В Azure есть множество служб, поддерживающих различные типы мониторинга , необходимые в облачной среде. Каждая служба предназначена для одной или нескольких ролей. Объедините службы для предоставления функций, необходимых для комплексной среды мониторинга.

Служба Описание Тип Роли
Azure Monitor Azure Monitor находится в центре экосистемы мониторинга Azure. Это комплексное решение для мониторинга, которое можно использовать для сбора, анализа и реагирования на данные мониторинга из облачных и локальных сред. Azure Monitor обеспечивает полный мониторинг инфраструктуры, сети и приложений. Она также предоставляет платформу данных и основные функции, такие как анализ данных, визуализация и оповещения для других служб. Инфраструктура
база данных
соответствие
Облачный архитектор,
инженер платформы,
системный администратор,
Администратор баз данных
Application Insights Application Insights — это функция Azure Monitor, которая обеспечивает мониторинг APM для облачных приложений. Агент разработчик.
Наблюдатель за сетями Azure Наблюдатель за сетями предоставляет возможности мониторинга и визуализации сетевых ресурсов в Azure. Эта служба используется для мониторинга, диагностики и просмотра метрик. Вы также можете включить или отключить журналы для ресурсов в виртуальной сети Azure. Network Администратор сети
Microsoft Sentinel Microsoft Sentinel — это решение для управления событиями безопасности (SIEM) и автоматического реагирования системы безопасности (SOAR). Она получает данные телеметрии безопасности из ресурсов Azure и других компонентов, чтобы обеспечить обнаружение кибер-угроз, расследование, реагирование и упреждающую охоту. Безопасность Инженер по безопасности
Microsoft Defender XDR XDR Defender включает решения для безопасности Майкрософт, которые являются собственными для платформы Azure, клиентских и серверных операционных систем Майкрософт, а также приложений, включая Office 365, Exchange Online и SharePoint в Microsoft 365. Каждое решение для обеспечения безопасности использует ИИ и машинное обучение для сопоставления телеметрии и определения необходимости проведения расследований. При обнаружении неприемлемого поведения они принимают меры, чтобы предотвратить нарушение. Безопасность Инженер по безопасности
Управление затратами Microsoft Управление затратами — это набор средств, которые можно использовать для анализа, мониторинга и оптимизации затрат Microsoft Cloud. Управление затратами доступно любому, у кого есть доступ к учетной записи выставления счетов, подписке, группе ресурсов или группе управления. Себестоимость Архитектор облака
Работоспособность служб Azure Работоспособность служб предоставляет состояние работоспособности служб, на которые используются ресурсы Azure. Он может сообщить о любых сбоях служб и предоставить персонализированное представление о работоспособности служб и регионов Azure. Инфраструктура Обязательства поставщика