Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье приведены действия по устранению неполадок, которые помогут устранить ошибки резервного копирования, восстановления и управления Служба Azure Kubernetes (AKS).
Устранение ошибок установки расширения резервного копирования AKS
Сценарий 1
Сообщение об ошибке
{Helm installation from path [] for release [azure-aks-backup] failed with the following error: err [release azure-aks-backup failed, and has been uninstalled due to atomic being set: failed post-install: timed out waiting for the condition]} occurred while doing the operation: {Installing the extension} on the config"`
Причина: Расширение установлено успешно, но pods не запускаются, так как необходимые вычислительные ресурсы и память недоступны.
Решение: Для устранения проблемы увеличьте количество узлов в кластере, позволяющее обеспечить достаточные вычислительные ресурсы и память для создания модулей (pods). Чтобы масштабировать пул узлов в портал Azure, выполните следующие действия.
- В портал Azure откройте кластер AKS.
- Перейдите в пулы узлов в разделе Параметры.
- Выберите Масштабировать пул узлов, а затем обновите минимальные и максимальные значения в диапазоне счета узлов.
- Выберите Применить.
Сценарий 2
Сообщение об ошибке
BackupStorageLocation "default" is unavailable: rpc error: code = Unknown desc = azure.BearerAuthorizer#WithAuthorization: Failed to refresh the Token for request to https://management.azure.com/subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/AzureBackupRG_westeurope_1/providers/Microsoft.Storage/storageAccounts/devhayyabackup/listKeys?%24expand=kerb&api-version=2019-06-01: StatusCode=404 -- Original Error: adal: Refresh request failed. Status Code = '404'. Response body: no azure identity found for request clientID 4e95##### REDACTED #####0777`
Endpoint http://169.254.169.254/metadata/identity/oauth2/token?api-version=2018-02-01&client_id=4e95dcc5-a769-4745-b2d9-
Причина. При включении управляемого pod удостоверения в кластере AKS в пространство имен kube-system добавляется azurePodIdentityException с именем aks-addon-exception. AzurePodIdentityException позволяет pod с определенными метками получать доступ к конечной точке службы метаданных экземпляра Azure (IMDS) не перехватывается сервером NMI.
Модули расширения pod не являются исключением, и требуют, чтобы идентификатор pod Microsoft Entra был включен вручную.
Решение: Создание исключения pod-identity в кластере AKS (которое будет применяться только к пространству имен dataprotection-microsoft и не к kube-system). Подробнее.
Выполните следующую команду:
az aks pod-identity exception add --resource-group shracrg --cluster-name shractestcluster --namespace dataprotection-microsoft --pod-labels app.kubernetes.io/name=dataprotection-microsoft-kubernetesЧтобы проверить azurepodidentityexceptions в кластере, выполните следующую команду:
kubectl get Azurepodidentityexceptions --all-namespacesЧтобы назначить роль участника данных BLOB-объектов хранилища удостоверению расширения, выполните следующую команду:
Примечание.
Убедитесь, что используется последняя версия скрипта Terraform. Подробнее.
az role assignment create --assignee-object-id $(az k8s-extension show --name azure-aks-backup --cluster-name aksclustername --resource-group aksclusterresourcegroup --cluster-type managedClusters --query aksAssignedIdentity.principalId --output tsv) --role 'Storage Blob Data Contributor' --scope /subscriptions/subscriptionid/resourceGroups/storageaccountresourcegroup/providers/Microsoft.Storage/storageAccounts/storageaccountname
Сценарий 3
Сообщение об ошибке
{"Message":"Error in the getting the Configurations: error {Post \https://centralus.dp.kubernetesconfiguration.azure.com/subscriptions/ subscriptionid /resourceGroups/ aksclusterresourcegroup /provider/managedclusters/clusters/ aksclustername /configurations/getPendingConfigs?api-version=2021-11-01\: dial tcp: lookup centralus.dp.kubernetesconfiguration.azure.com on 10.63.136.10:53: no such host}","LogType":"ConfigAgentTrace","LogLevel":"Error","Environment":"prod","Role":"ClusterConfigAgent","Location":"centralus","ArmId":"/subscriptions/ subscriptionid /resourceGroups/ aksclusterresourcegroup /providers/Microsoft.ContainerService/managedclusters/ aksclustername ","CorrelationId":"","AgentName":"ConfigAgent","AgentVersion":"1.8.14","AgentTimestamp":"2023/01/19 20:24:16"}`
Причина. Для использования расширений кластера в кластерах AKS требуются определенные правила полного доменного имени или приложения. Подробнее.
Эта ошибка возникает из-за отсутствия правил полного доменного имени, что привело к недоступности информации о конфигурации из службы расширений кластера.
Решение: Чтобы устранить проблему, необходимо создать настраиваемое переопределение CoreDNS для узла DP для передачи через общедоступную сеть.
Получите в кластере пользовательский YAML для coreDNS (сохраните его в локальном каталоге позже):
kubectl get configmap coredns-custom -n kube-system -o yamlПереопределение сопоставления для конечной точки centralus DP с публичным IP-адресом (используйте приведенный ниже YAML):
apiVersion: v1 kind: ConfigMap metadata: name: coredns-custom namespace: kube-system data: aksdp.override: | hosts { 20.40.200.153 centralus.dp.kubernetesconfiguration.azure.com fallthrough }Теперь выполните следующую команду, чтобы применить файл yaml для обновления:
kubectl apply -f corednsms.yamlЧтобы принудительно перезагрузить
corednsподы, выполните следующую команду:kubectl delete pod --namespace kube-system -l k8s-app=kube-dnsЧтобы выполнить
NSlookupиз модуля ExtensionAgent и проверить, работает ли coreDNS-custom, запустите следующую команду:kubectl exec -i -t pod/extension-agent-<pod guid that's there in your cluster> -n kube-system -- nslookup centralus.dp.kubernetesconfiguration.azure.comЧтобы проверить журналы Pod ExtensionAgent, выполните следующую команду:
kubectl logs pod/extension-agent-<pod guid that’s there in your cluster> -n kube-system --tail=200Удалите и переустановите расширение резервного копирования для запуска резервного копирования.
Сценарий 4
Сообщение об ошибке
"message": "Error: [ InnerError: [Helm installation failed : Unable to create/update Kubernetes resources for the extension : Recommendation Please check that there are no policies blocking the resource creation/update for the extension : InnerError [release azure-aks-backup failed, and has been uninstalled due to atomic being set: failed pre-install: job failed: BackoffLimitExceeded]]] occurred while doing the operation : [Create] on the config, For general troubleshooting visit: https://aka.ms/k8s-extensions-TSG, For more application specific troubleshooting visit: Facing trouble? Common errors and potential fixes are detailed in the Kubernetes Backup Troubleshooting Guide, available at https://www.aka.ms/aksclusterbackup",
Задание предварительной установки обновления CRD завершается сбоем в кластере.
Причина: модули pod не могут взаимодействовать с сервером API Kube
Отлаживать
- Проверьте наличие событий в кластере, связанных с проблемой запуска pod.
kubectl events -n dataprotection-microsoft
- Проверьте модули pod для crds защиты данных.
kubectl get pods -A | grep "dataprotection-microsoft-kubernetes-agent-upgrade-crds"
- Проверьте журналы pod.
kubectl logs -f --all-containers=true --timestamps=true -n dataprotection-microsoft <pod-name-from-prev-command>
Пример сообщения журнала:
2024-08-09T06:21:37.712646207Z Unable to connect to the server: dial tcp: lookup aks-test.hcp.westeurope.azmk8s.io: i/o timeout
2024-10-01T11:26:17.498523756Z Unable to connect to the server: dial tcp 10.146.34.10:443: i/o timeout
Решение. В этом случае существует политика Network/Calico или NSG, которая не позволяла модулям pod dataprotection-microsoft взаимодействовать с сервером API. Необходимо разрешить пространство имен dataprotection-microsoft, а затем переустановить расширение.
Сценарий 5
Агент расширения не может взаимодействовать с конечными точками плоскости данных, что приводит к тому, что резервные расширения подов не развертываются.
Сообщение об ошибке: агент расширения в кластере AKS не удалось подключиться к конечным *.dp.kubernetesconfiguration.azure.com точкам уровня данных службы конфигурации Azure Kubernetes в вашем регионе. Этот сбой указывается путем просмотра журналов extension-agent модуля pod. Скорее всего, вы увидите повторяющиеся ошибки 403 для запросов к конечным точкам плоскости данных
Error code: 403
Message: This traffic is not authorized
Обычно это означает, что трафик от агента расширения блокируется или не имеет необходимой авторизации для доступа к службе Azure. Этот агент расширения необходим для установки и запуска расширения резервного копирования в кластере AKS.
Причина Эта ошибка возникает из-за конфликта в частном разрешении DNS, когда kubernetes с поддержкой Azure Arc и управляемым кластером AKS используют одну и ту же виртуальную сеть или частный DNS-сервер:
Общая виртуальная сеть (или частная зона DNS) содержит предсуществующую частную конечную точку для Kubernetes с поддержкой Azure Arc.
В результате конечная точка плоскости данных, используемая агентом расширения AKS (например, *.dp.kubernetesconfiguration.azure.com), разрешает частный IP-адрес (например, 10.x.x.x.x) вместо предполагаемого общедоступного IP-адреса.
Эта ошибка приводит к тому, что агент расширения AKS отправляет трафик в непреднамеренную частную конечную точку, что приводит к ошибкам 403 "Неавторизован". Вы можете проверить разрешенный IP-адрес конечной точки плоскости данных из кластера AKS, выполнив следующую команду:
kubectl exec -it -n kube-system extension-agent-<podGuid> --nslookup <region>.dp.kubernetesconfiguration.azure.com
Замените region определенным регионом Azure (например, eastus, westeurope).
Резолюция Чтобы устранить эту проблему, рассмотрите следующие подходы:
Используйте отдельные виртуальные сети: Если вы используете кластеры Kubernetes с поддержкой Azure Arc и AKS, разверните их в отдельных виртуальных сетях, чтобы избежать конфликтов разрешения DNS, вызванных общими частными конечными точками.
Настройка переопределения CoreDNS: Переопределите параметры CoreDNS в вашем кластере AKS, чтобы явно разрешить конечную точку канала передачи данных расширения на её публичный IP-адрес. См. сценарий 3 в документации для получения подробных шагов по настройке переопределения CoreDNS для расширения.
Проверьте определение общедоступного IP-адреса: С помощью команды nslookup определите корректный общедоступный IP-адрес конечной точки канала данных расширения. Замените регион регионом кластера AKS:
nslookup eastus2euap.dp.kubernetesconfiguration.azure.com
Ошибки, связанные с установкой расширения резервного копирования
Эти коды ошибок появляются из-за проблем с расширением резервного копирования, установленным в кластере AKS.
KubernetesBackupListExtensionsError:
Причина. Резервное хранилище в рамках проверки проверяет, установлен ли кластер с расширением резервного копирования. Для этого службы MSI хранилища требуется разрешение на чтение в кластере AKS, позволяющее ей перечислить все расширения, установленные в кластере.
Рекомендуемое действие: Переназначьте роль Читателя для MSI хранилища (удалите существующее назначение роли и снова назначьте роль Читателя), так как в назначенной роли Читателя отсутствует разрешение list-extension. Если переназначение завершается ошибкой, используйте другое хранилище резервных копий для настройки резервного копирования.
Ошибка пользователя: расширение Kubernetes для резервного копирования не найдено (UserErrorKubernetesBackupExtensionNotFoundError)
Причина: Резервное хранилище в процессе проверки проверяет, установлен ли кластер расширение резервного копирования. Хранилище выполняет операцию для перечисления расширений, установленных в кластере. Если расширение резервного копирования отсутствует в списке, эта ошибка появится.
Рекомендуемое действие: используйте клиент CL или портал Azure для удаления расширения, а затем снова установите расширение.
Ошибка пользователя: у расширения резервного копирования Kubernetes есть ошибки
Причина. Расширение резервного копирования, установленное в кластере, имеет некоторые внутренние ошибки.
Рекомендуемое действие: используйте клиент CL или портал Azure для удаления расширения, а затем снова установите расширение.
Ошибка пользователя: KubernetesBackupExtensionIdentity не найден
Причина. Для резервного копирования AKS требуется расширение резервного копирования, установленное в кластере. Расширение вместе с его установкой создаёт пользовательскую идентификацию с именем расширения MSI. Этот файл MSI создается в группе ресурсов, включающей пулы узлов для кластера AKS. Этот MSI получает необходимые роли, назначенные для доступа к расположению хранилища резервных копий. Код ошибки предполагает, что удостоверение расширения отсутствует.
Рекомендуемое действие. Используйте интерфейс командной строки или клиент портал Azure для удаления расширения, а затем снова установите расширение. Новое удостоверение создается вместе с расширением.
Ошибка истечения времени ожидания при отслеживании пользовательских ресурсов KubernetesBackup
Причина. Azure Backup для AKS требует установки расширения резервного копирования в кластере. Для выполнения операций резервного копирования и восстановления в кластере создаются пользовательские ресурсы. Pods, созданные расширениями, выполняющие операции резервного копирования с использованием этих CR. Эта ошибка возникает, когда расширение не может обновить состояние этих CR.
Рекомендуемое действие. Для проверки работоспособности расширения необходимо выполнить команду kubectl get pods -n dataprotection.microsoft. Если поды находятся не в состоянии выполнения, увеличьте количество узлов в кластере на 1 или увеличьте лимиты вычислений. Затем подождите несколько минут и снова запустите команду, что изменит состояние модулей на в процессе выполнения. Если проблема сохраняется, удалите и переустановите расширение.
UserErrorBackupPluginPodRestartedDuringBackup (Ошибка пользователя: перезапуск плагина резервного копирования Pod во время резервного копирования)
Причина: Azure Backup для AKS использует pods, развернутые в кластере AKS в рамках расширения резервного копирования в пространстве имен dataprotection-microsoft. Для выполнения операций резервного копирования и восстановления эти pod-ы предъявляют определенные требования к ЦП и памяти.
1. Memory: requests - 128Mi, limits - 1280Mi
2. CPU: requests - 500m, limits - 1000m
Однако если количество ресурсов в кластере превышает 1000, поды могут потребовать дополнительный процессор и память сверх резервирования по умолчанию. Если необходимые ресурсы превышают выделенные ограничения, во время операции резервного копирования может возникнуть ошибка UserErrorBackupPluginPodRestartedDuringBackup из-за ошибки OOMKilled (Недостаточно памяти).
Рекомендуемое действие. Чтобы обеспечить успешные операции резервного копирования и восстановления, вручную обновите параметры ресурсов для модулей pod расширения, выполнив следующие действия.
Откройте кластер AKS на портале Azure.
Перейдите к расширениям и приложениям в разделе "Параметры" в области слева.
Щелкните расширение с названием "azure-aks-backup".
Прокрутите вниз, добавьте новое значение в разделе параметров конфигурации и нажмите кнопку "Сохранить".
resources.limits.memory : 4400Mi
После применения изменений дождитесь запуска запланированной резервной копии или запуска резервного копирования по запросу. Если вы по-прежнему сталкиваетесь со сбоем OOMKilled, повторите описанные выше шаги, постепенно увеличивая ограничения памяти, и если проблема все же сохраняется, увеличьте также параметр resources.limits.cpu.
Примечание.
Если узел, на котором подготовлен модуль pod расширения, не имеет требуемого ЦП или памяти, и вы обновили только ограничения ресурсов, модуль pod может быть многократно убит. Чтобы устранить эту проблему, обновите параметры конфигурации с помощью resources.requests.cpu и resources.requests.memory. Это гарантирует, что модуль pod запланирован на узле, который соответствует запрошенным требованиям к ресурсам.
ОшибкаПользователяПлагинПодРезервногоКопированияПерезапущенВоВремяВосстановления
Причина: Azure Backup для AKS использует pods, развернутые в кластере AKS в рамках расширения резервного копирования в пространстве имен dataprotection-microsoft. Для выполнения операций резервного копирования и восстановления эти pod-ы предъявляют определенные требования к ЦП и памяти.
1. Memory: requests - 128Mi, limits - 1280Mi
2. CPU: requests - 500m, limits - 1000m
Однако если количество ресурсов в кластере превышает 1000, поды могут потребовать дополнительный процессор и память сверх резервирования по умолчанию. Если необходимые ресурсы превышают выделенные ограничения, во время операции восстановления может возникнуть ошибка UserErrorBackupPluginPodRestartedDuringRestore из-за ошибки OOMKilled (вне памяти).
Рекомендуемое действие. Чтобы обеспечить успешные операции резервного копирования и восстановления, вручную обновите параметры ресурсов для модулей pod расширения, выполнив следующие действия.
Откройте кластер AKS на портале Azure.
Перейдите к расширениям и приложениям в разделе "Параметры" в области слева.
Щелкните расширение с названием "azure-aks-backup".
Прокрутите вниз, добавьте новое значение в разделе параметров конфигурации и нажмите кнопку "Сохранить".
resources.limits.memory : 4400Mi
После применения изменений дождитесь запуска запланированной резервной копии или запуска резервного копирования по запросу. Если вы по-прежнему сталкиваетесь со сбоем OOMKilled, повторите описанные выше шаги, постепенно увеличивая ограничения памяти, и если проблема все же сохраняется, увеличьте также параметр resources.limits.cpu.
Примечание.
Если узел, на котором подготовлен модуль pod расширения, не имеет требуемого ЦП или памяти, и вы обновили только ограничения ресурсов, модуль pod может быть многократно убит. Чтобы устранить эту проблему, обновите параметры конфигурации с помощью resources.requests.cpu и resources.requests.memory. Это гарантирует, что модуль pod запланирован на узле, который соответствует запрошенным требованиям к ресурсам.
Ошибка удаления резервной копии плагина
Причина: расширение резервного копирования должно быть запущено для удаления резервных копий.
Рекомендуемое действие. Если кластер запущен, проверьте, работает ли расширение в работоспособном состоянии. Проверьте, создаются ли pods расширения, в противном случае увеличьте количество узлов. Если это не удается, попробуйте удалить и переустановить расширение. Если бэкап кластера будет удалён, вручную удалите снэпшоты и метаданные.
Время ожидания расширения на синхронизацию элемента резервной копии истекло
Причина. Расширение резервного копирования ожидает синхронизации элементов резервного копирования с учетной записью хранения.
Рекомендуемое действие. Если появится этот код ошибки, повторите операцию резервного копирования или переустановите расширение.
Ошибки, связанные с расположением хранилища резервных копий
Эти коды ошибок появляются из-за проблем, связанных с расширением резервного копирования, установленным в кластере AKS.
Ошибка пользователя: не удалось удалить резервную копию, местоположение хранилища резервной копии только для чтения
Причина. Учетная запись хранения, предоставляемая в качестве входных данных во время установки расширения резервного копирования, находится в состоянии только для чтения, что не позволяет удалять данные резервной копии из контейнера BLOB-объектов.
Рекомендуемое действие. Измените состояние учетной записи хранения только для чтения на запись.
Ошибка пользователя: не удалось удалить резервную копию — местоположение хранилища резервных копий не найдено.
Причина: Во время установки расширения необходимо указать расположение хранилища резервных копий, которое включает в себя учетную запись хранилища и контейнер BLOB. Эта ошибка возникает, если расположение удаляется или неправильно добавляется во время установки расширения.
Рекомендуемое действие. Удалите расширение резервного копирования, а затем переустановите его с правильной учетной записью хранения и контейнером BLOB-объектов в качестве входных данных.
Ошибка пользователя: не удалось выполнить резервное копирование, местоположение хранилища резервных копий только для чтения
Причина: Учетная запись хранения, предоставленная в качестве входных данных во время установки расширения резервного копирования, находится в режиме только для чтения, что не позволяет записывать данные резервного копирования в контейнер BLOB.
Рекомендуемое действие. Измените состояние учетной записи хранения только для чтения на запись.
Ошибка пользователя: Не найдено место для хранения резервных копий по умолчанию
Причина. Во время установки расширения расположение хранилища резервных копий должно быть предоставлено в качестве входных данных, включающее учетную запись хранения и контейнер BLOB-объектов. Ошибка появляется, если расположение удаляется или неправильно введено во время установки расширения.
Рекомендуемое действие. Удалите расширение резервного копирования, а затем переустановите его с правильной учетной записью хранения и контейнером BLOB-объектов в качестве входных данных.
Ошибка пользователя: недостающие разрешения для хранения резервной копии на выбранной локации
Причина. Расширение резервного копирования должно иметь роль участника данных BLOB-объектов хранилища в расположении хранилища резервных копий (учетная запись хранения). Идентификатор расширения назначается на эту роль.
Рекомендуемое действие. Если эта роль отсутствует, используйте портал Azure или CLI для переназначения этого отсутствующих разрешений в учетной записи хранения.
ОшибкаПользователяМестоРезервногоХраненияНеГотово
Причина: Во время установки расширения должно быть указано расположение хранилища резервных копий, включая учетную запись хранения и контейнер BLOB. Расширение резервного копирования должно иметь роль Storage Blob Data Contributor в расположении резервного хранилища (учетная запись хранения). Идентификатор расширения назначается на эту роль.
Рекомендуемое действие. Ошибка появляется, если удостоверение расширения не имеет правильных разрешений для доступа к учетной записи хранения. Эта ошибка возникает при первом установке расширения резервного копирования AKS при настройке операции защиты. Это происходит в течение времени, необходимого для распространения предоставленных разрешений до расширения резервного копирования AKS. В качестве обходного решения подождите час и повторите настройку защиты. В противном случае используйте портал Azure или интерфейс командной строки (CLI), чтобы снова назначить отсутствующее разрешение на учетной записи хранения.
ОшибкаПользователяГруппаРесурсовСнимкаЗаблокирована
Причина: Этот код ошибки появляется при применении блокировки удаления или чтения в группе ресурсов моментальных снимков, используемой в качестве входных данных для расширения резервного копирования.
Рекомендуемое действие. Если вы настраиваете новый экземпляр резервного копирования, используйте группу ресурсов без блокировки удаления или чтения. Если резервный экземпляр уже настроен, удалите блокировку из группы ресурсов моментальных снимков.
KubernetesBackupGenericWarning
Причина. Этот код ошибки указывает, что ресурс Kubernetes не удалось создать резервную копию или восстановить, как правило, из-за проблем с проверкой или зависимостью в кластере.
Одним из часто наблюдаемых сценариев является сбой во время восстановления Ingress-ресурсов из-за проблем с проверкой вебхуков. Отсутствует требуемая служба (например, fabp-ingress-nginx-controller-admission), предотвращающая правильное выполнение веб-перехватчика validate.nginx.ingress.kubernetes.io. Конфигурация веб-перехватчика проверки существует, но ссылается на несуществующую или неправильно настроенную службу. Проблемы с разрешением DNS не позволяют веб-перехватчику достичь предполагаемой конечной точки. В кластере используются пользовательские веб-перехватчики допуска, которые не были созданы резервными копиями или повторно созданы до восстановления. Конфигурация веб-перехватчика устарела или не нужна для восстановленного состояния кластера.
Рекомендуемое действие.
Проверьте, существует ли служба fabp-ingress-nginx-controller-admission, которую вы считаете отсутствующей.
kubectl get svc -n ingress-basicЕсли служба отсутствует, проверьте конфигурации развертывания и повторно создайте ее при необходимости.
Изучите потенциальные проблемы с разрешением DNS, выполнив:
kubectl get endpoints -n ingress-basic nslookup fabp-ingress-nginx-controller-admission.ingress-basic.svc.cluster.localЕсли проверка веб-перехватчика не требуется, рассмотрите возможность удаления его с помощью:
kubectl delete validatingwebhookconfigurationПеречислите все конфигурации вебхука с помощью:
kubectl get validatingwebhookconfigurationsЕсли проблема устранена, вручную восстановите входящий трафик, применив резервную копию YAML:
kubectl apply -f
Примечание.
Это предупреждение может возникать из нескольких причин. Если описанные выше действия не устраняют проблему, обратитесь к журналам контроллера Kubernetes и конфигурации веб-перехватчика для получения более конкретных сообщений об ошибках.
Ошибки, связанные с архивными резервными копиями
Эти коды ошибок могут отображаться при включении функции резервного копирования для AKS с целью сохранения резервных копий в хранилище стандартного типа.
Ошибка пользователя: политика уровня хранилища не поддерживается
Причина: Этот код ошибки возникает при создании политики резервного копирования с правилом хранения, определённым для хранилища данных уровня «Стандартный» для хранилища резервных копий в регионе, в котором это хранилище данных не поддерживается.
Рекомендуемое действие: Обновите правило хранения с использованием стандартной длительности хранилища, определенной на портале Azure.
Щелкните значок "Изменить" рядом с правилом.
Снимите флажок рядом с Vault-стандарт и затем выберите Обновить.
Создайте политику резервного копирования для операционного уровня резервного копирования (только моментальные снимки для кластера AKS).
Задания резервного копирования и восстановления AKS, завершенные с предупреждениями
ОшибкаПользователяСнимокPVЗапрещенПолитикой
Код ошибки: "UserErrorPVSnapshotDisallowedByPolicy"
Причина. Политика Azure назначается по подписке, которая перестает драйвер CSI принимать моментальный снимок тома.
Рекомендуемое действие: Удалите политику Azure, приостанавливающую операцию создания моментального снимка диска, а затем выполните резервное копирование по запросу.
ОшибкаПользователяДостигнутПределСнапшотовPV
Код ошибки: UserErrorPVSnapshotLimitReached
Причина. Существует ограниченное количество моментальных снимков для постоянного тома, которое может существовать в определенный момент времени. Для постоянных томов на основе дисков Azure ограничение составляет 500 моментальных снимков. Эта ошибка возникает, когда моментальные снимки для определенных постоянных томов не принимаются из-за наличия моментальных снимков выше поддерживаемых ограничений.
Рекомендуемое действие. Обновите политику резервного копирования, чтобы уменьшить продолжительность хранения и дождаться удаления старых точек восстановления.
Тайм-аут создания снимка CSI
Код ошибки: CSISnapshottingTimedOut
Причина: сбой моментального снимка, так как драйвер CSI получает время ожидания, чтобы получить дескриптор моментального снимка.
Рекомендуемое действие. Просмотрите журналы и повторите операцию, чтобы получить успешные моментальные снимки, выполнив резервную копию по запросу или дождитесь следующего запланированного резервного копирования.
Ошибка: не удалось выполнить крючок исполнения
Код ошибки: UserErrorHookExecutionFailed
Причина: Когда перехватчики, предназначенные для работы вместе с резервными копиями и восстановлением, столкнулись с ошибкой и не были успешно применены.
Рекомендуемое действие: просмотрите журналы, обновите хуки и затем повторите операцию по резервному копированию и восстановлению.
ОшибкаПользователяПространствоИменНеНайдено
Код ошибки: UserErrorNamespaceNotFound
Причина. Пространства имен, предоставляемые в конфигурации резервного копирования, отсутствуют при выполнении резервных копий. Либо пространство имен было неправильно предоставлено или удалено.
Рекомендуемое действие. Проверьте правильность предоставления резервных копий пространств имен.
ОшибкаПользователяPVCHasNoVolume
Код ошибки: UserErrorPVCHasNoVolume
Причина. Утверждение постоянного тома (ПВХ) в контексте не имеет постоянного тома, подключенного к нему. Таким образом, ПВХ не будет поддержан.
Рекомендуемое действие: присоединение тома к ПВХ, если требуется создать резервную копию.
ОшибкаПользователяPVCНеПривязанКТомуОбъему
Код ошибки: UserErrorPVCNotBoundToVolume
Причина: ПВХ в контексте находится в состоянии ожидания и не имеет постоянного тома, подключенного к нему. Таким образом, ПВХ не будет поддержан.
Рекомендуемое действие: присоединение тома к ПВХ, если требуется создать резервную копию.
ОшибкаПользователяPVНеНайдена
Код ошибки: UserErrorPVNotFound
Причина: Отсутствует базовый носитель хранилища для постоянного тома.
Рекомендуемое действие: Проверьте и подключите новый постоянный том с фактически подключённым носителем хранилища.
Ошибка пользователя: Отсутствует класс хранилища для PVC
Код ошибки: UserErrorStorageClassMissingForPVC
Причина: При резервном копировании AKS производится проверка используемого класса хранилища, и постоянный том не создаёт моментальные снимки из-за недоступности класса.
Рекомендуемое действие: обновите спецификации ПВХ с используемым классом хранения.
Ошибка пользователя: несоответствие версии CRD источника и целевого кластера
Код ошибки: UserErrorSourceandTargetClusterCRDVersionMismatch
Причина. Исходный кластер AKS и целевой кластер AKS во время восстановления имеют разные версии FlowSchema и PriorityLevelConfigurations CR. Некоторые ресурсы Kubernetes не восстанавливаются из-за несоответствия в версиях кластера.
Рекомендуемое действие. Используйте ту же версию кластера для целевого кластера, что и исходный кластер, или вручную примените ЦС.
Ошибка в связанной авторизации
Код ошибки: LinkedAuthorizationFailed
Причина. Чтобы выполнить операцию восстановления, пользователю необходимо иметь разрешение на чтение в кластере AKS резервного копирования.
Рекомендуемое действие: назначьте роль читателя в исходном кластере AKS, а затем перейдите к выполнению операции восстановления.