Мониторинг выделенного HSM-устройства Azure

Выделенная служба HSM Azure предоставляет физическое устройство для использования исключительного клиента с полным административным контролем и ответственностью по управлению. Доступное устройство — это модель Thales Luna 7 HSM A790. Корпорация Майкрософт не имеет административного доступа после предоставления услуг клиентом, за исключением подключения физического последовательного порта для мониторинга. В результате клиенты отвечают за типичные операционные действия, включая комплексный мониторинг и анализ журналов.

Клиенты полностью отвечают за приложения, использующие HSM, и должны работать с Thales для поддержки или консультационной помощи. Из-за степени контроля клиента над оперативной гигиеной, корпорация Майкрософт не может предложить какого-либо гарантированного уровня высокой доступности для этой службы. Ответственность клиента заключается в том, чтобы обеспечить правильность настройки приложений для обеспечения высокой доступности. Корпорация Майкрософт отслеживает и поддерживает работоспособность устройств и сетевое подключение.

Мониторинг Майкрософт

У устройства Thales Luna 7 HSM по умолчанию в качестве параметров мониторинга используются SNMP и последовательный порт. Корпорация Майкрософт использовала последовательный порт в качестве физического средства для подключения к устройству для получения базовых данных телеметрии на работоспособности устройства, включая состояние температуры и компонента (например, питание и вентиляторы).

Для этого корпорация Майкрософт использует неадминистративную роль "monitor", настроенную на устройстве Thales. Эта роль дает возможность получать данные телеметрии, но не предоставляет доступ к устройству с точки зрения административной задачи или каким-либо образом просматривать криптографические сведения. Наши клиенты могут быть уверены, что их устройство действительно самостоятельно управляет, администрирует и используется для хранения конфиденциальных криптографических ключей. Если какой-либо клиент не удовлетворен минимальным доступом для основного мониторинга здоровья, они могут отключить учетную запись для мониторинга. Очевидное следствие этого заключается в том, что корпорация Майкрософт не будет иметь никакой информации и, следовательно, не сможет предоставлять какие-либо упреждающие уведомления о проблемах работоспособности устройств. В этой ситуации клиент несет ответственность за работоспособность устройства.

Сама функция монитора настраивается для опроса устройства каждые 10 минут, чтобы получить данные о работоспособности. Из-за склонности последовательной связи к ошибкам, оповещение будет произведено только после нескольких отрицательных индикаторов состояния в течение одного часа. Это оповещение в конечном итоге приведет к упреждающему уведомлению клиента с уведомлением о проблеме.

В зависимости от характера проблемы будет предпринят соответствующий курс действий, чтобы уменьшить влияние и обеспечить уменьшение риска при исправлении. Например, сбой питания — это процедура горячей замены без последствия событий повреждения, поэтому её можно выполнить с низким воздействием и минимальным риском для работы системы. Другие процедуры могут требовать обнуления и удаления конфигурации устройства, чтобы свести к минимуму риск безопасности для клиента. В этом случае пользователь настроит альтернативное устройство, подсоединится к кластеру высокой доступности, инициируя синхронизацию устройств. Обычная операция возобновляется в минимальное время, с минимальным нарушением и наименьшим риском безопасности.

Избыточность питания

Устройство Thales Luna 7 HSM использует двойной блок питания (PSU) для избыточности. Каждый PSU подключается к независимому каналу питания, что позволяет устройству работать нормально, если один PSU испытывает краткий сбой.

Во время запланированного обслуживания питания центра обработки данных каналы питания обслуживаются по одному за раз, а другой канал остается активным, обеспечивая непрерывную работу с избыточным питанием. В журналах HSM могут отображаться кратковременные сообщения с одним PSU, такие как:

Power supply 1 AC outage
Power supply 1 AC restored

Эти сообщения являются ожидаемым поведением и не указывают на аппаратный сбой— устройство продолжает работать обычно на избыточной PSU.

Это важно

Не открывайте запросы в службу поддержки и не запрашивайте проверку физического оборудования на основе сообщений о состоянии одного блока питания. Корпорация Майкрософт отслеживает работоспособность PSU и упреждает любые фактические сбои оборудования. Ненужное физическое вмешательство может привести к риску операции устройства.

Если наш мониторинг обнаруживает подлинные проблемы с PSU или вентилятором, корпорация Майкрософт заменяет компонент, не требуя действий клиента или уведомлений.

Мониторинг клиентов

Ценность службы выделенного устройства HSM — это управление, которое клиент получает от устройства, особенно учитывая, что это облачное устройство. Следствием этого элемента управления является ответственность за мониторинг работоспособности устройства и управление ими. Устройство Thales Luna 7 HSM поставляется с рекомендациями по реализации SNMP и Syslog. Клиентам службы выделенного HSM рекомендуется использовать это, даже если учетная запись мониторинга Microsoft остается активной, и они должны обязательно использовать ее, если отключают учетную запись мониторинга Microsoft. Любой из доступных методов позволит клиенту определить проблемы и вызвать службу поддержки Майкрософт, чтобы инициировать соответствующую работу по исправлению.

Дальнейшие действия

Рекомендуется, чтобы все ключевые понятия службы, такие как высокий уровень доступности и безопасность, хорошо понятны до подготовки устройств и разработки приложений или развертывания. Дополнительные разделы уровня концепции: