AksEndpointDeploymentConfiguration Classe

Remarque

Il s’agit d’une classe expérimentale et peut changer à tout moment. Pour plus d’informations, consultez https://aka.ms/azuremlexperimental.

Représente les informations de configuration de déploiement d’un service déployé sur Azure Kubernetes Service.

Créez un objet AksEndpointDeploymentConfiguration à l’aide de la deploy_configuration méthode de la AksEndpoint classe.

Initialisez un objet de configuration pour le déploiement d’un point de terminaison sur une cible de calcul AKS.

Constructeur

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Paramètres

Nom Description
autoscale_enabled
Obligatoire

Indique s’il faut activer la mise à l’échelle automatique pour ce service Web. La valeur par défaut est True si num_replicas aucune.

autoscale_min_replicas
Obligatoire
int

Nombre minimal de conteneurs à utiliser lors de la mise à l’échelle automatique de ce service Web. La valeur par défaut est de 1.

autoscale_max_replicas
Obligatoire
int

Nombre maximal de conteneurs à utiliser lors de la mise à l’échelle automatique de ce service Web. La valeur par défaut est 10.

autoscale_refresh_seconds
Obligatoire
int

Fréquence à laquelle le générateur de mise à l’échelle automatique doit tenter de mettre à l’échelle ce service Web. La valeur par défaut est de 1.

autoscale_target_utilization
Obligatoire
int

L’utilisation cible (en pourcentage sur 100) de la mise à l’échelle automatique doit tenter de maintenir pour ce service Web. La valeur par défaut est 70.

collect_model_data
Obligatoire

Indique s’il faut activer ou non la collecte de données de modèle pour ce service Web. Valeur par défaut False.

auth_enabled
Obligatoire

Indique s’il faut activer l’authentification pour ce service Web. La valeur par défaut est True.

cpu_cores
Obligatoire

Nombre de cœurs de processeur à allouer pour ce service Web. Peut être une décimale. Valeur par défaut 0.1

memory_gb
Obligatoire

Quantité de mémoire (en Go) à allouer pour ce service Web. Peut être une décimale. La valeur par défaut est 0.5

enable_app_insights
Obligatoire

Indique s’il faut activer ou non la journalisation Application Insights pour ce service Web. Valeur par défaut False.

scoring_timeout_ms
Obligatoire
int

Délai d’expiration à appliquer pour les appels de scoring à ce service Web. La valeur par défaut est 6 0000.

replica_max_concurrent_requests
Obligatoire
int

Nombre maximal de requêtes simultanées par réplica à autoriser pour ce service Web. La valeur par défaut est de 1. Ne modifiez pas ce paramètre de la valeur par défaut de 1, sauf indication du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.

max_request_wait_time
Obligatoire
int

Durée maximale pendant laquelle une demande reste dans la file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.

num_replicas
Obligatoire
int

Nombre de conteneurs à allouer pour ce service Web. Aucune valeur par défaut, si ce paramètre n’est pas défini, le générateur de mise à l’échelle automatique est activé par défaut.

primary_key
Obligatoire
str

Clé d’authentification principale à utiliser pour ce service web

secondary_key
Obligatoire
str

Clé d’authentification secondaire à utiliser pour ce service web

tags
Obligatoire

Dictionnaire de balises de valeur clé pour donner à ce service Webservice

properties
Obligatoire

Dictionnaire des propriétés de valeur de clé pour donner à ce service Web. Ces propriétés ne peuvent pas être modifiées après le déploiement, mais de nouvelles paires clé-valeur peuvent être ajoutées.

description
Obligatoire
str

Description pour donner à ce service Web.

gpu_cores
Obligatoire
int

Nombre de cœurs GPU à allouer pour ce service Web. La valeur par défaut est 0.

period_seconds
Obligatoire
int

Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est de 10 secondes. La valeur minimale est 1.

initial_delay_seconds
Obligatoire
int

Nombre de secondes après le démarrage du conteneur avant l’initialisation des sondes liveness. La valeur par défaut est 310.

timeout_seconds
Obligatoire
int

Nombre de secondes après lesquelles la sonde liveness expire. La valeur par défaut est de 2 secondes. La valeur minimale est 1.

success_threshold
Obligatoire
int

Les réussites consécutives minimales pour la sonde liveness doivent être considérées comme réussies après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.

failure_threshold
Obligatoire
int

Quand un pod démarre et que la sonde liveness échoue, Kubernetes essaie failureThreshold des heures avant de renoncer. La valeur par défaut est 3. La valeur minimale est 1.

namespace
Obligatoire
str

Espace de noms Kubernetes dans lequel déployer ce service Web : jusqu’à 63 caractères alphanumériques minuscules ('a'-'z', '0'-'9') et trait d’union ('-'). Les premiers et derniers caractères ne peuvent pas être des traits d’union.

token_auth_enabled
Obligatoire

Indique s’il faut activer l’authentification Azure Active Directory pour ce service Web. Si cette option est activée, les utilisateurs peuvent accéder à ce service Web en récupérant le jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.

version_name
Obligatoire
str

Nom de la version dans un point de terminaison.

traffic_percentile
Obligatoire

Quantité de trafic que la version prend dans un point de terminaison.

cpu_cores_limit
Obligatoire

Le nombre maximal de cœurs d’uc que ce service Web est autorisé à utiliser. Peut être une décimale.

memory_gb_limit
Obligatoire

La quantité maximale de mémoire (en Go) que ce service Web est autorisé à utiliser. Peut être une décimale.

autoscale_enabled
Obligatoire

Indique s’il faut activer la mise à l’échelle automatique pour ce service Web. La valeur par défaut est True si num_replicas aucune.

autoscale_min_replicas
Obligatoire
int

Nombre minimal de conteneurs à utiliser lors de la mise à l’échelle automatique de ce service Web. La valeur par défaut est de 1.

autoscale_max_replicas
Obligatoire
int

Nombre maximal de conteneurs à utiliser lors de la mise à l’échelle automatique de ce service Web. La valeur par défaut est 10.

autoscale_refresh_seconds
Obligatoire
int

Fréquence à laquelle le générateur de mise à l’échelle automatique doit tenter de mettre à l’échelle ce service Web. La valeur par défaut est de 1.

autoscale_target_utilization
Obligatoire
int

L’utilisation cible (en pourcentage sur 100) de la mise à l’échelle automatique doit tenter de maintenir pour ce service Web. La valeur par défaut est 70.

collect_model_data
Obligatoire

Indique s’il faut activer ou non la collecte de données de modèle pour ce service Web. Valeur par défaut False.

auth_enabled
Obligatoire

Indique s’il faut activer l’authentification pour ce service Web. La valeur par défaut est True.

cpu_cores
Obligatoire

Nombre de cœurs de processeur à allouer pour ce service Web. Peut être une décimale. Valeur par défaut 0.1

memory_gb
Obligatoire

Quantité de mémoire (en Go) à allouer pour ce service Web. Peut être une décimale. La valeur par défaut est 0.5

enable_app_insights
Obligatoire

Indique s’il faut activer ou non la journalisation Application Insights pour ce service Web. Valeur par défaut False.

scoring_timeout_ms
Obligatoire
int

Délai d’expiration à appliquer pour les appels de scoring à ce service Web. La valeur par défaut est 6 0000.

replica_max_concurrent_requests
Obligatoire
int

Nombre maximal de requêtes simultanées par réplica à autoriser pour ce service Web. La valeur par défaut est de 1. Ne modifiez pas ce paramètre de la valeur par défaut de 1, sauf indication du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.

max_request_wait_time
Obligatoire
int

Durée maximale pendant laquelle une demande reste dans la file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.

num_replicas
Obligatoire
int

Nombre de conteneurs à allouer pour ce service Web. Aucune valeur par défaut, si ce paramètre n’est pas défini, le générateur de mise à l’échelle automatique est activé par défaut.

primary_key
Obligatoire
str

Clé d’authentification principale à utiliser pour ce service web

secondary_key
Obligatoire
str

Clé d’authentification secondaire à utiliser pour ce service web

tags
Obligatoire

Dictionnaire de balises de valeur clé pour donner à ce service Webservice

properties
Obligatoire

Dictionnaire des propriétés de valeur de clé pour donner à ce service Web. Ces propriétés ne peuvent pas être modifiées après le déploiement, mais de nouvelles paires clé-valeur peuvent être ajoutées.

description
Obligatoire
str

Description pour donner à ce service Web.

gpu_cores
Obligatoire
int

Nombre de cœurs GPU à allouer pour ce service Web. La valeur par défaut est 0.

period_seconds
Obligatoire
int

Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est de 10 secondes. La valeur minimale est 1.

initial_delay_seconds
Obligatoire
int

Nombre de secondes après le démarrage du conteneur avant l’initialisation des sondes liveness. La valeur par défaut est 310.

timeout_seconds
Obligatoire
int

Nombre de secondes après lesquelles la sonde liveness expire. La valeur par défaut est de 2 secondes. La valeur minimale est 1.

success_threshold
Obligatoire
int

Les réussites consécutives minimales pour la sonde liveness doivent être considérées comme réussies après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.

failure_threshold
Obligatoire
int

Quand un pod démarre et que la sonde liveness échoue, Kubernetes essaie failureThreshold des heures avant de renoncer. La valeur par défaut est 3. La valeur minimale est 1.

namespace
Obligatoire
str

Espace de noms Kubernetes dans lequel déployer ce service Web : jusqu’à 63 caractères alphanumériques minuscules ('a'-'z', '0'-'9') et trait d’union ('-'). Les premiers et derniers caractères ne peuvent pas être des traits d’union.

token_auth_enabled
Obligatoire

Indique s’il faut activer l’authentification Azure Active Directory pour ce service Web. Si cette option est activée, les utilisateurs peuvent accéder à ce service Web en récupérant le jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.

version_name
Obligatoire
str

Nom de la version dans un point de terminaison.

traffic_percentile
Obligatoire

Quantité de trafic que la version prend dans un point de terminaison.

compute_target_name
Obligatoire
str

Nom de la cible de calcul à déployer sur

cpu_cores_limit
Obligatoire

Le nombre maximal de cœurs d’uc que ce service Web est autorisé à utiliser. Peut être une décimale.

memory_gb_limit
Obligatoire

La quantité maximale de mémoire (en Go) que ce service Web est autorisé à utiliser. Peut être une décimale.

Variables

Nom Description
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Indique s’il faut activer la mise à l’échelle automatique pour ce service Web. La valeur par défaut est True si num_replicas aucune.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Nombre minimal de conteneurs à utiliser lors de la mise à l’échelle automatique de ce service Web. La valeur par défaut est de 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Nombre maximal de conteneurs à utiliser lors de la mise à l’échelle automatique de ce service Web. La valeur par défaut est 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Fréquence à laquelle le générateur de mise à l’échelle automatique doit tenter de mettre à l’échelle ce service Web. La valeur par défaut est de 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

L’utilisation cible (en pourcentage sur 100) de la mise à l’échelle automatique doit tenter de maintenir pour ce service Web. La valeur par défaut est 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Indique s’il faut activer ou non la collecte de données de modèle pour ce service Web. Valeur par défaut False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Indique s’il faut activer l’authentification pour ce service Web. La valeur par défaut est True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Nombre de cœurs de processeur à allouer pour ce service Web. Peut être une décimale. Valeur par défaut 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Quantité de mémoire (en Go) à allouer pour ce service Web. Peut être une décimale. La valeur par défaut est 0.5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Indique s’il faut activer ou non la journalisation Application Insights pour ce service Web. Valeur par défaut False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Délai d’expiration à appliquer pour les appels de scoring à ce service Web. La valeur par défaut est 6 0000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Nombre maximal de requêtes simultanées par réplica à autoriser pour ce service Web. La valeur par défaut est de 1. Ne modifiez pas ce paramètre de la valeur par défaut de 1, sauf indication du support technique Microsoft ou d’un membre de l’équipe Azure Machine Learning.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Durée maximale pendant laquelle une demande reste dans la file d’attente (en millisecondes) avant de retourner une erreur 503. La valeur par défaut est 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Nombre de conteneurs à allouer pour ce service Web. Aucune valeur par défaut, si ce paramètre n’est pas défini, le générateur de mise à l’échelle automatique est activé par défaut.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Clé d’authentification principale à utiliser pour ce service web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Clé d’authentification secondaire à utiliser pour ce service web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Dictionnaire de balises de valeur clé pour donner à ce service Webservice

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Dictionnaire des propriétés de valeur de clé pour donner à ce service Web. Ces propriétés ne peuvent pas être modifiées après le déploiement, mais de nouvelles paires clé-valeur peuvent être ajoutées.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Description pour donner à ce service Web.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Nombre de cœurs GPU à allouer pour ce service Web. La valeur par défaut est 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Fréquence (en secondes) d’exécution de probe liveness. La valeur par défaut est de 10 secondes. La valeur minimale est 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Nombre de secondes après le démarrage du conteneur avant l’initialisation des sondes liveness. La valeur par défaut est 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Nombre de secondes après lesquelles la sonde liveness expire. La valeur par défaut est de 2 secondes. La valeur minimale est 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Les réussites consécutives minimales pour la sonde liveness doivent être considérées comme réussies après avoir échoué. La valeur par défaut est de 1. La valeur minimale est 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Quand un pod démarre et que la sonde liveness échoue, Kubernetes essaie failureThreshold des heures avant de renoncer. La valeur par défaut est 3. La valeur minimale est 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Espace de noms Kubernetes dans lequel déployer ce service Web : jusqu’à 63 caractères alphanumériques minuscules ('a'-'z', '0'-'9') et trait d’union ('-'). Les premiers et derniers caractères ne peuvent pas être des traits d’union.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Indique s’il faut activer l’authentification Azure Active Directory pour ce service Web. Si cette option est activée, les utilisateurs peuvent accéder à ce service Web en récupérant le jeton d’accès à l’aide de leurs informations d’identification Azure Active Directory. Valeur par défaut False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Nom de la version dans un point de terminaison.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Quantité de trafic que la version prend dans un point de terminaison.

Méthodes

validate_endpoint_configuration

Vérifiez que les valeurs de configuration spécifiées sont valides.

Déclenche une exception WebserviceException en cas d’échec de la validation.

validate_endpoint_configuration

Vérifiez que les valeurs de configuration spécifiées sont valides.

Déclenche une exception WebserviceException en cas d’échec de la validation.

validate_endpoint_configuration()

Exceptions

Type Description