AksServiceDeploymentConfiguration Класс
Представляет сведения о конфигурации развертывания для службы, развернутой в службе Azure Kubernetes.
Создайте объект AksServiceDeploymentConfiguration с помощью deploy_configuration метода AksWebservice класса.
Инициализировать объект конфигурации для развертывания в целевом объекте вычислений AKS.
Конструктор
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Параметры
| Имя | Описание |
|---|---|
|
cpu_cores_limit
Обязательно
|
Максимальное количество ядер ЦП, которые могут использоваться веб-службой. Может быть десятичным. |
|
memory_gb_limit
Обязательно
|
Максимальный объем памяти (в ГБ) этой веб-службы разрешено использовать. Может быть десятичным. |
|
autoscale_enabled
Обязательно
|
Указывает, следует ли включить автомасштабирование для этой веб-службы.
По умолчанию значение True, если |
|
autoscale_min_replicas
Обязательно
|
Минимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1. |
|
autoscale_max_replicas
Обязательно
|
Максимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. Значение по умолчанию — 10 |
|
autoscale_refresh_seconds
Обязательно
|
Как часто автомасштабирование должно пытаться масштабировать эту веб-службу. По умолчанию равен 1. |
|
autoscale_target_utilization
Обязательно
|
Целевое использование (в процентах от 100) автомасштабирование должно попытаться сохранить для этой веб-службы. Значение по умолчанию — 70. |
|
collect_model_data
Обязательно
|
Следует ли включить сбор данных модели для этой веб-службы. По умолчанию False. |
|
auth_enabled
Обязательно
|
Следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True. |
|
cpu_cores
Обязательно
|
Количество ядер ЦП, выделяемых для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.1 |
|
memory_gb
Обязательно
|
Объем памяти (в ГБ) для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.5 |
|
enable_app_insights
Обязательно
|
Следует ли включить ведение журнала Application Insights для этой веб-службы. Значение по умолчанию — False. |
|
scoring_timeout_ms
Обязательно
|
Время ожидания для принудительного применения вызовов оценки для этой веб-службы. По умолчанию — 60000. |
|
replica_max_concurrent_requests
Обязательно
|
Максимальное число одновременных запросов на реплику для этой веб-службы. По умолчанию равен 1. Не изменяйте этот параметр с значения по умолчанию 1, если не указано технической поддержкой Майкрософт или членом группы машинного обучения Azure. |
|
max_request_wait_time
Обязательно
|
Максимальное время, когда запрос останется в очереди (в миллисекундах), прежде чем возвращать ошибку 503. Значение по умолчанию — 500. |
|
num_replicas
Обязательно
|
Количество контейнеров, выделяемых для этой веб-службы. Значение по умолчанию, если этот параметр не задан, автомасштабирование включается по умолчанию. |
|
primary_key
Обязательно
|
Первичный ключ проверки подлинности, используемый для этой веб-службы. |
|
secondary_key
Обязательно
|
Дополнительный ключ проверки подлинности, используемый для этой веб-службы. |
|
tags
Обязательно
|
Словарь тегов значений ключа для предоставления этой веб-службы. |
|
properties
Обязательно
|
Словарь свойств значений ключа для предоставления этой веб-службы. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары значений ключей. |
|
description
Обязательно
|
Описание для предоставления этой веб-службы. |
|
gpu_cores
Обязательно
|
Количество ядер GPU, выделяемых для этой веб-службы. Значение по умолчанию — 0. |
|
period_seconds
Обязательно
|
Частота (в секундах) выполнения пробы активности. По умолчанию — 10 секунд. Минимальное значение равно 1. |
|
initial_delay_seconds
Обязательно
|
Количество секунд после запуска контейнера до запуска проб активности. Значение по умолчанию — 310. |
|
timeout_seconds
Обязательно
|
Количество секунд, после которого время ожидания пробы активности истекает. Значение по умолчанию — 2 секунды. Минимальное значение равно 1. |
|
success_threshold
Обязательно
|
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение равно 1. |
|
failure_threshold
Обязательно
|
Когда модуль Pod запускается и проба активности завершается ошибкой, Kubernetes попытается попробовать |
|
namespace
Обязательно
|
Пространство имен Kubernetes, в котором развертывается эта веб-служба: до 63 строчных буквенно-цифровых символов ('a'-'z", '0'-'9') и дефиса ('-') символов. Первые и последние символы не могут быть дефисами. |
|
token_auth_enabled
Обязательно
|
Следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если это включено, пользователи могут получить доступ к этой веб-службе, извлекая маркер доступа с помощью учетных данных Azure Active Directory. По умолчанию False. |
|
cpu_cores_limit
Обязательно
|
Максимальное количество ядер ЦП, которые могут использоваться веб-службой. Может быть десятичным. |
|
memory_gb_limit
Обязательно
|
Максимальный объем памяти (в ГБ) этой веб-службы разрешено использовать. Может быть десятичным. |
|
blobfuse_enabled
|
Следует ли включить blobfuse для загрузки модели для этой веб-службы. Значение True по умолчанию Default value: None
|
|
autoscale_enabled
Обязательно
|
Указывает, следует ли включить автомасштабирование для этой веб-службы.
По умолчанию значение True, если |
|
autoscale_min_replicas
Обязательно
|
Минимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1. |
|
autoscale_max_replicas
Обязательно
|
Максимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. Значение по умолчанию — 10 |
|
autoscale_refresh_seconds
Обязательно
|
Как часто автомасштабирование должно пытаться масштабировать эту веб-службу. По умолчанию равен 1. |
|
autoscale_target_utilization
Обязательно
|
Целевое использование (в процентах от 100) автомасштабирование должно попытаться сохранить для этой веб-службы. Значение по умолчанию — 70. |
|
collect_model_data
Обязательно
|
Следует ли включить сбор данных модели для этой веб-службы. По умолчанию False. |
|
auth_enabled
Обязательно
|
Следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True. |
|
cpu_cores
Обязательно
|
Количество ядер ЦП, выделяемых для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.1 |
|
memory_gb
Обязательно
|
Объем памяти (в ГБ) для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.5 |
|
enable_app_insights
Обязательно
|
Следует ли включить ведение журнала Application Insights для этой веб-службы. Значение по умолчанию — False. |
|
scoring_timeout_ms
Обязательно
|
Время ожидания для принудительного применения вызовов оценки для этой веб-службы. По умолчанию — 60000. |
|
replica_max_concurrent_requests
Обязательно
|
Максимальное число одновременных запросов на реплику для этой веб-службы. По умолчанию равен 1. Не изменяйте этот параметр с значения по умолчанию 1, если не указано технической поддержкой Майкрософт или членом группы машинного обучения Azure. |
|
max_request_wait_time
Обязательно
|
Максимальное время, когда запрос останется в очереди (в миллисекундах), прежде чем возвращать ошибку 503. Значение по умолчанию — 500. |
|
num_replicas
Обязательно
|
Количество контейнеров, выделяемых для этой веб-службы. Значение по умолчанию, если этот параметр не задан, автомасштабирование включается по умолчанию. |
|
primary_key
Обязательно
|
Первичный ключ проверки подлинности, используемый для этой веб-службы. |
|
secondary_key
Обязательно
|
Дополнительный ключ проверки подлинности, используемый для этой веб-службы. |
|
tags
Обязательно
|
Словарь тегов значений ключа для предоставления этой веб-службы. |
|
properties
Обязательно
|
Словарь свойств значений ключа для предоставления этой веб-службы. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары значений ключей. |
|
description
Обязательно
|
Описание для предоставления этой веб-службы. |
|
gpu_cores
Обязательно
|
Количество ядер GPU, выделяемых для этой веб-службы. Значение по умолчанию — 0. |
|
period_seconds
Обязательно
|
Частота (в секундах) выполнения пробы активности. По умолчанию — 10 секунд. Минимальное значение равно 1. |
|
initial_delay_seconds
Обязательно
|
Количество секунд после запуска контейнера до запуска проб активности. Значение по умолчанию — 310. |
|
timeout_seconds
Обязательно
|
Количество секунд, после которого время ожидания пробы активности истекает. Значение по умолчанию — 2 секунды. Минимальное значение равно 1. |
|
success_threshold
Обязательно
|
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение равно 1. |
|
failure_threshold
Обязательно
|
Когда модуль Pod запускается и проба активности завершается ошибкой, Kubernetes попытается попробовать |
|
namespace
Обязательно
|
Пространство имен Kubernetes, в котором развертывается эта веб-служба: до 63 строчных буквенно-цифровых символов ('a'-'z", '0'-'9') и дефиса ('-') символов. Первые и последние символы не могут быть дефисами. |
|
token_auth_enabled
Обязательно
|
Следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если это включено, пользователи могут получить доступ к этой веб-службе, извлекая маркер доступа с помощью учетных данных Azure Active Directory. По умолчанию False. |
|
compute_target_name
Обязательно
|
Имя целевого объекта вычислений для развертывания в |
|
cpu_cores_limit
Обязательно
|
Максимальное количество ядер ЦП, которые могут использоваться веб-службой. Может быть десятичным. |
|
memory_gb_limit
Обязательно
|
Максимальный объем памяти (в ГБ) этой веб-службы разрешено использовать. Может быть десятичным. |
|
blobfuse_enabled
Обязательно
|
Следует ли включить blobfuse для загрузки модели для этой веб-службы. Значение True по умолчанию |
Переменные
| Имя | Описание |
|---|---|
|
autoscale_enabled
|
Указывает, следует ли включить автомасштабирование для этой веб-службы.
По умолчанию значение True, если |
|
autoscale_min_replicas
|
Минимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1. |
|
autoscale_max_replicas
|
Максимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. Значение по умолчанию — 10 |
|
autoscale_refresh_seconds
|
Как часто автомасштабирование должно пытаться масштабировать эту веб-службу. По умолчанию равен 1. |
|
autoscale_target_utilization
|
Целевое использование (в процентах от 100) автомасштабирование должно попытаться сохранить для этой веб-службы. Значение по умолчанию — 70. |
|
collect_model_data
|
Следует ли включить сбор данных модели для этой веб-службы. По умолчанию False. |
|
auth_enabled
|
Следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True. |
|
cpu_cores
|
Количество ядер ЦП, выделяемых для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.1 |
|
memory_gb
|
Объем памяти (в ГБ) для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.5 |
|
enable_app_insights
|
Следует ли включить ведение журнала Application Insights для этой веб-службы. Значение по умолчанию — False. |
|
scoring_timeout_ms
|
Время ожидания для принудительного применения вызовов оценки для этой веб-службы. По умолчанию — 60000. |
|
replica_max_concurrent_requests
|
Максимальное число одновременных запросов на реплику для этой веб-службы. По умолчанию равен 1. Не изменяйте этот параметр с значения по умолчанию 1, если не указано технической поддержкой Майкрософт или членом группы машинного обучения Azure. |
|
max_request_wait_time
|
Максимальное время, когда запрос останется в очереди (в миллисекундах), прежде чем возвращать ошибку 503. Значение по умолчанию — 500. |
|
num_replicas
|
Количество контейнеров, выделяемых для этой веб-службы. Значение по умолчанию, если этот параметр не задан, автомасштабирование включается по умолчанию. |
|
primary_key
|
Первичный ключ проверки подлинности, используемый для этой веб-службы. |
|
secondary_key
|
Дополнительный ключ проверки подлинности, используемый для этой веб-службы. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Словарь тегов значений ключа для предоставления этой веб-службы. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Словарь свойств значений ключа для предоставления этой веб-службы. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары значений ключей. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Описание для предоставления этой веб-службы. |
|
gpu_cores
|
Количество ядер GPU, выделяемых для этой веб-службы. Значение по умолчанию — 0. |
|
period_seconds
|
Частота (в секундах) выполнения пробы активности. По умолчанию — 10 секунд. Минимальное значение равно 1. |
|
initial_delay_seconds
|
Количество секунд после запуска контейнера до запуска проб активности. Значение по умолчанию — 310. |
|
timeout_seconds
|
Количество секунд, после которого время ожидания пробы активности истекает. Значение по умолчанию — 2 секунды. Минимальное значение равно 1. |
|
success_threshold
|
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение равно 1. |
|
failure_threshold
|
Когда модуль Pod запускается и проба активности завершается ошибкой, Kubernetes попытается попробовать |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
Пространство имен Kubernetes, в котором развертывается эта веб-служба: до 63 строчных буквенно-цифровых символов ('a'-'z", '0'-'9') и дефиса ('-') символов. Первые и последние символы не могут быть дефисами. |
|
token_auth_enabled
|
Следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если это включено, пользователи могут получить доступ к этой веб-службе, извлекая маркер доступа с помощью учетных данных Azure Active Directory. По умолчанию False. |
Методы
| print_deploy_configuration |
Печать конфигурации развертывания. |
| validate_configuration |
Убедитесь, что указанные значения конфигурации допустимы. Вызовет webserviceException, если проверка завершается ошибкой. |
print_deploy_configuration
Печать конфигурации развертывания.
print_deploy_configuration()
validate_configuration
Убедитесь, что указанные значения конфигурации допустимы.
Вызовет webserviceException, если проверка завершается ошибкой.
validate_configuration()
Исключения
| Тип | Описание |
|---|---|