AksServiceDeploymentConfiguration Класс

Представляет сведения о конфигурации развертывания для службы, развернутой в службе Azure Kubernetes.

Создайте объект AksServiceDeploymentConfiguration с помощью deploy_configuration метода AksWebservice класса.

Инициализировать объект конфигурации для развертывания в целевом объекте вычислений AKS.

Конструктор

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Параметры

Имя Описание
cpu_cores_limit
Обязательно

Максимальное количество ядер ЦП, которые могут использоваться веб-службой. Может быть десятичным.

memory_gb_limit
Обязательно

Максимальный объем памяти (в ГБ) этой веб-службы разрешено использовать. Может быть десятичным.

autoscale_enabled
Обязательно

Указывает, следует ли включить автомасштабирование для этой веб-службы. По умолчанию значение True, если num_replicas значение None.

autoscale_min_replicas
Обязательно
int

Минимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.

autoscale_max_replicas
Обязательно
int

Максимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. Значение по умолчанию — 10

autoscale_refresh_seconds
Обязательно
int

Как часто автомасштабирование должно пытаться масштабировать эту веб-службу. По умолчанию равен 1.

autoscale_target_utilization
Обязательно
int

Целевое использование (в процентах от 100) автомасштабирование должно попытаться сохранить для этой веб-службы. Значение по умолчанию — 70.

collect_model_data
Обязательно

Следует ли включить сбор данных модели для этой веб-службы. По умолчанию False.

auth_enabled
Обязательно

Следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
Обязательно

Количество ядер ЦП, выделяемых для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.1

memory_gb
Обязательно

Объем памяти (в ГБ) для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.5

enable_app_insights
Обязательно

Следует ли включить ведение журнала Application Insights для этой веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
Обязательно
int

Время ожидания для принудительного применения вызовов оценки для этой веб-службы. По умолчанию — 60000.

replica_max_concurrent_requests
Обязательно
int

Максимальное число одновременных запросов на реплику для этой веб-службы. По умолчанию равен 1. Не изменяйте этот параметр с значения по умолчанию 1, если не указано технической поддержкой Майкрософт или членом группы машинного обучения Azure.

max_request_wait_time
Обязательно
int

Максимальное время, когда запрос останется в очереди (в миллисекундах), прежде чем возвращать ошибку 503. Значение по умолчанию — 500.

num_replicas
Обязательно
int

Количество контейнеров, выделяемых для этой веб-службы. Значение по умолчанию, если этот параметр не задан, автомасштабирование включается по умолчанию.

primary_key
Обязательно
str

Первичный ключ проверки подлинности, используемый для этой веб-службы.

secondary_key
Обязательно
str

Дополнительный ключ проверки подлинности, используемый для этой веб-службы.

tags
Обязательно

Словарь тегов значений ключа для предоставления этой веб-службы.

properties
Обязательно

Словарь свойств значений ключа для предоставления этой веб-службы. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары значений ключей.

description
Обязательно
str

Описание для предоставления этой веб-службы.

gpu_cores
Обязательно
int

Количество ядер GPU, выделяемых для этой веб-службы. Значение по умолчанию — 0.

period_seconds
Обязательно
int

Частота (в секундах) выполнения пробы активности. По умолчанию — 10 секунд. Минимальное значение равно 1.

initial_delay_seconds
Обязательно
int

Количество секунд после запуска контейнера до запуска проб активности. Значение по умолчанию — 310.

timeout_seconds
Обязательно
int

Количество секунд, после которого время ожидания пробы активности истекает. Значение по умолчанию — 2 секунды. Минимальное значение равно 1.

success_threshold
Обязательно
int

Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение равно 1.

failure_threshold
Обязательно
int

Когда модуль Pod запускается и проба активности завершается ошибкой, Kubernetes попытается попробовать failureThreshold время, прежде чем отказаться. Значение по умолчанию — 3. Минимальное значение равно 1.

namespace
Обязательно
str

Пространство имен Kubernetes, в котором развертывается эта веб-служба: до 63 строчных буквенно-цифровых символов ('a'-'z", '0'-'9') и дефиса ('-') символов. Первые и последние символы не могут быть дефисами.

token_auth_enabled
Обязательно

Следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если это включено, пользователи могут получить доступ к этой веб-службе, извлекая маркер доступа с помощью учетных данных Azure Active Directory. По умолчанию False.

cpu_cores_limit
Обязательно

Максимальное количество ядер ЦП, которые могут использоваться веб-службой. Может быть десятичным.

memory_gb_limit
Обязательно

Максимальный объем памяти (в ГБ) этой веб-службы разрешено использовать. Может быть десятичным.

blobfuse_enabled

Следует ли включить blobfuse для загрузки модели для этой веб-службы. Значение True по умолчанию

Default value: None
autoscale_enabled
Обязательно

Указывает, следует ли включить автомасштабирование для этой веб-службы. По умолчанию значение True, если num_replicas значение None.

autoscale_min_replicas
Обязательно
int

Минимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.

autoscale_max_replicas
Обязательно
int

Максимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. Значение по умолчанию — 10

autoscale_refresh_seconds
Обязательно
int

Как часто автомасштабирование должно пытаться масштабировать эту веб-службу. По умолчанию равен 1.

autoscale_target_utilization
Обязательно
int

Целевое использование (в процентах от 100) автомасштабирование должно попытаться сохранить для этой веб-службы. Значение по умолчанию — 70.

collect_model_data
Обязательно

Следует ли включить сбор данных модели для этой веб-службы. По умолчанию False.

auth_enabled
Обязательно

Следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
Обязательно

Количество ядер ЦП, выделяемых для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.1

memory_gb
Обязательно

Объем памяти (в ГБ) для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.5

enable_app_insights
Обязательно

Следует ли включить ведение журнала Application Insights для этой веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
Обязательно
int

Время ожидания для принудительного применения вызовов оценки для этой веб-службы. По умолчанию — 60000.

replica_max_concurrent_requests
Обязательно
int

Максимальное число одновременных запросов на реплику для этой веб-службы. По умолчанию равен 1. Не изменяйте этот параметр с значения по умолчанию 1, если не указано технической поддержкой Майкрософт или членом группы машинного обучения Azure.

max_request_wait_time
Обязательно
int

Максимальное время, когда запрос останется в очереди (в миллисекундах), прежде чем возвращать ошибку 503. Значение по умолчанию — 500.

num_replicas
Обязательно
int

Количество контейнеров, выделяемых для этой веб-службы. Значение по умолчанию, если этот параметр не задан, автомасштабирование включается по умолчанию.

primary_key
Обязательно
str

Первичный ключ проверки подлинности, используемый для этой веб-службы.

secondary_key
Обязательно
str

Дополнительный ключ проверки подлинности, используемый для этой веб-службы.

tags
Обязательно

Словарь тегов значений ключа для предоставления этой веб-службы.

properties
Обязательно

Словарь свойств значений ключа для предоставления этой веб-службы. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары значений ключей.

description
Обязательно
str

Описание для предоставления этой веб-службы.

gpu_cores
Обязательно
int

Количество ядер GPU, выделяемых для этой веб-службы. Значение по умолчанию — 0.

period_seconds
Обязательно
int

Частота (в секундах) выполнения пробы активности. По умолчанию — 10 секунд. Минимальное значение равно 1.

initial_delay_seconds
Обязательно
int

Количество секунд после запуска контейнера до запуска проб активности. Значение по умолчанию — 310.

timeout_seconds
Обязательно
int

Количество секунд, после которого время ожидания пробы активности истекает. Значение по умолчанию — 2 секунды. Минимальное значение равно 1.

success_threshold
Обязательно
int

Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение равно 1.

failure_threshold
Обязательно
int

Когда модуль Pod запускается и проба активности завершается ошибкой, Kubernetes попытается попробовать failureThreshold время, прежде чем отказаться. Значение по умолчанию — 3. Минимальное значение равно 1.

namespace
Обязательно
str

Пространство имен Kubernetes, в котором развертывается эта веб-служба: до 63 строчных буквенно-цифровых символов ('a'-'z", '0'-'9') и дефиса ('-') символов. Первые и последние символы не могут быть дефисами.

token_auth_enabled
Обязательно

Следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если это включено, пользователи могут получить доступ к этой веб-службе, извлекая маркер доступа с помощью учетных данных Azure Active Directory. По умолчанию False.

compute_target_name
Обязательно
str

Имя целевого объекта вычислений для развертывания в

cpu_cores_limit
Обязательно

Максимальное количество ядер ЦП, которые могут использоваться веб-службой. Может быть десятичным.

memory_gb_limit
Обязательно

Максимальный объем памяти (в ГБ) этой веб-службы разрешено использовать. Может быть десятичным.

blobfuse_enabled
Обязательно

Следует ли включить blobfuse для загрузки модели для этой веб-службы. Значение True по умолчанию

Переменные

Имя Описание
autoscale_enabled

Указывает, следует ли включить автомасштабирование для этой веб-службы. По умолчанию значение True, если num_replicas значение None.

autoscale_min_replicas
int

Минимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.

autoscale_max_replicas
int

Максимальное количество контейнеров, используемых при автомасштабировании этой веб-службы. Значение по умолчанию — 10

autoscale_refresh_seconds
int

Как часто автомасштабирование должно пытаться масштабировать эту веб-службу. По умолчанию равен 1.

autoscale_target_utilization
int

Целевое использование (в процентах от 100) автомасштабирование должно попытаться сохранить для этой веб-службы. Значение по умолчанию — 70.

collect_model_data

Следует ли включить сбор данных модели для этой веб-службы. По умолчанию False.

auth_enabled

Следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores

Количество ядер ЦП, выделяемых для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.1

memory_gb

Объем памяти (в ГБ) для этой веб-службы. Может быть десятичным. Значение по умолчанию — 0.5

enable_app_insights

Следует ли включить ведение журнала Application Insights для этой веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
int

Время ожидания для принудительного применения вызовов оценки для этой веб-службы. По умолчанию — 60000.

replica_max_concurrent_requests
int

Максимальное число одновременных запросов на реплику для этой веб-службы. По умолчанию равен 1. Не изменяйте этот параметр с значения по умолчанию 1, если не указано технической поддержкой Майкрософт или членом группы машинного обучения Azure.

max_request_wait_time
int

Максимальное время, когда запрос останется в очереди (в миллисекундах), прежде чем возвращать ошибку 503. Значение по умолчанию — 500.

num_replicas
int

Количество контейнеров, выделяемых для этой веб-службы. Значение по умолчанию, если этот параметр не задан, автомасштабирование включается по умолчанию.

primary_key
str

Первичный ключ проверки подлинности, используемый для этой веб-службы.

secondary_key
str

Дополнительный ключ проверки подлинности, используемый для этой веб-службы.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Словарь тегов значений ключа для предоставления этой веб-службы.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Словарь свойств значений ключа для предоставления этой веб-службы. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары значений ключей.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Описание для предоставления этой веб-службы.

gpu_cores
int

Количество ядер GPU, выделяемых для этой веб-службы. Значение по умолчанию — 0.

period_seconds
int

Частота (в секундах) выполнения пробы активности. По умолчанию — 10 секунд. Минимальное значение равно 1.

initial_delay_seconds
int

Количество секунд после запуска контейнера до запуска проб активности. Значение по умолчанию — 310.

timeout_seconds
int

Количество секунд, после которого время ожидания пробы активности истекает. Значение по умолчанию — 2 секунды. Минимальное значение равно 1.

success_threshold
int

Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение равно 1.

failure_threshold
int

Когда модуль Pod запускается и проба активности завершается ошибкой, Kubernetes попытается попробовать failureThreshold время, прежде чем отказаться. Значение по умолчанию — 3. Минимальное значение равно 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Пространство имен Kubernetes, в котором развертывается эта веб-служба: до 63 строчных буквенно-цифровых символов ('a'-'z", '0'-'9') и дефиса ('-') символов. Первые и последние символы не могут быть дефисами.

token_auth_enabled

Следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если это включено, пользователи могут получить доступ к этой веб-службе, извлекая маркер доступа с помощью учетных данных Azure Active Directory. По умолчанию False.

Методы

print_deploy_configuration

Печать конфигурации развертывания.

validate_configuration

Убедитесь, что указанные значения конфигурации допустимы.

Вызовет webserviceException, если проверка завершается ошибкой.

print_deploy_configuration

Печать конфигурации развертывания.

print_deploy_configuration()

validate_configuration

Убедитесь, что указанные значения конфигурации допустимы.

Вызовет webserviceException, если проверка завершается ошибкой.

validate_configuration()

Исключения

Тип Описание