AksEndpointDeploymentConfiguration Klas
Opmerking
Dit is een experimentele klasse en kan op elk gewenst moment worden gewijzigd. Zie https://aka.ms/acr/connected-registry voor meer informatie.
Vertegenwoordigt informatie over de implementatieconfiguratie voor een service die is geïmplementeerd in Azure Kubernetes Service.
Maak een AksEndpointDeploymentConfiguration-object met behulp van de deploy_configuration methode van de AksEndpoint klasse.
Initialiseer een configuratieobject voor het implementeren van een eindpunt op een AKS-rekendoel.
Constructor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parameters
| Name | Description |
|---|---|
|
autoscale_enabled
Vereist
|
Hiermee wordt aangegeven of automatisch schalen voor deze webservice al dan niet moet worden ingeschakeld.
De standaardwaarde is Waar als |
|
autoscale_min_replicas
Vereist
|
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 1. |
|
autoscale_max_replicas
Vereist
|
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10. |
|
autoscale_refresh_seconds
Vereist
|
Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. De standaardwaarde is 1. |
|
autoscale_target_utilization
Vereist
|
Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze webservice. De standaardwaarde is 70. |
|
collect_model_data
Vereist
|
Het al dan niet inschakelen van modelgegevensverzameling voor deze webservice. De standaardwaarde is False. |
|
auth_enabled
Vereist
|
Hiermee wordt aangegeven of verificatie voor deze webservice al dan niet moet worden ingeschakeld. De standaardwaarde is Waar. |
|
cpu_cores
Vereist
|
Het aantal cpu-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1 |
|
memory_gb
Vereist
|
De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0,5 |
|
enable_app_insights
Vereist
|
Of u Application Insights-logboekregistratie voor deze webservice al dan niet wilt inschakelen. De standaardwaarde is False. |
|
scoring_timeout_ms
Vereist
|
Een time-out voor het afdwingen van score-aanroepen naar deze webservice. De standaardwaarde is 60000. |
|
replica_max_concurrent_requests
Vereist
|
Het aantal maximaal gelijktijdige aanvragen per replica dat deze webservice toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team. |
|
max_request_wait_time
Vereist
|
De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500. |
|
num_replicas
Vereist
|
Het aantal containers dat moet worden toegewezen voor deze webservice. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld. |
|
primary_key
Vereist
|
Een primaire verificatiesleutel die voor deze webservice kan worden gebruikt |
|
secondary_key
Vereist
|
Een secundaire verificatiesleutel die voor deze webservice kan worden gebruikt |
|
tags
Vereist
|
Woordenlijst met sleutelwaardetags om deze webservice te geven |
|
properties
Vereist
|
Woordenlijst met sleutelwaarde-eigenschappen om deze webservice te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd. |
|
description
Vereist
|
Een beschrijving om deze webservice te geven. |
|
gpu_cores
Vereist
|
Het aantal GPU-kernen dat moet worden toegewezen voor deze webservice. De standaardwaarde is 0. |
|
period_seconds
Vereist
|
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1. |
|
initial_delay_seconds
Vereist
|
Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310. |
|
timeout_seconds
Vereist
|
Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1. |
|
success_threshold
Vereist
|
De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1. |
|
failure_threshold
Vereist
|
Wanneer een pod wordt gestart en de livenesstest mislukt, zal |
|
namespace
Vereist
|
De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn. |
|
token_auth_enabled
Vereist
|
Of u Azure Active Directory-verificatie voor deze webservice al dan niet wilt inschakelen. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False. |
|
version_name
Vereist
|
De naam van de versie in een eindpunt. |
|
traffic_percentile
Vereist
|
De hoeveelheid verkeer dat de versie in een eindpunt opneemt. |
|
cpu_cores_limit
Vereist
|
Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn. |
|
memory_gb_limit
Vereist
|
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn. |
|
autoscale_enabled
Vereist
|
Hiermee wordt aangegeven of automatisch schalen voor deze webservice al dan niet moet worden ingeschakeld.
De standaardwaarde is Waar als |
|
autoscale_min_replicas
Vereist
|
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 1. |
|
autoscale_max_replicas
Vereist
|
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10. |
|
autoscale_refresh_seconds
Vereist
|
Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. De standaardwaarde is 1. |
|
autoscale_target_utilization
Vereist
|
Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze webservice. De standaardwaarde is 70. |
|
collect_model_data
Vereist
|
Het al dan niet inschakelen van modelgegevensverzameling voor deze webservice. De standaardwaarde is False. |
|
auth_enabled
Vereist
|
Hiermee wordt aangegeven of verificatie voor deze webservice al dan niet moet worden ingeschakeld. De standaardwaarde is Waar. |
|
cpu_cores
Vereist
|
Het aantal cpu-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1 |
|
memory_gb
Vereist
|
De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0,5 |
|
enable_app_insights
Vereist
|
Of u Application Insights-logboekregistratie voor deze webservice al dan niet wilt inschakelen. De standaardwaarde is False. |
|
scoring_timeout_ms
Vereist
|
Een time-out voor het afdwingen van score-aanroepen naar deze webservice. De standaardwaarde is 60000. |
|
replica_max_concurrent_requests
Vereist
|
Het aantal maximaal gelijktijdige aanvragen per replica dat deze webservice toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team. |
|
max_request_wait_time
Vereist
|
De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500. |
|
num_replicas
Vereist
|
Het aantal containers dat moet worden toegewezen voor deze webservice. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld. |
|
primary_key
Vereist
|
Een primaire verificatiesleutel die voor deze webservice kan worden gebruikt |
|
secondary_key
Vereist
|
Een secundaire verificatiesleutel die voor deze webservice kan worden gebruikt |
|
tags
Vereist
|
Woordenlijst met sleutelwaardetags om deze webservice te geven |
|
properties
Vereist
|
Woordenlijst met sleutelwaarde-eigenschappen om deze webservice te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd. |
|
description
Vereist
|
Een beschrijving om deze webservice te geven. |
|
gpu_cores
Vereist
|
Het aantal GPU-kernen dat moet worden toegewezen voor deze webservice. De standaardwaarde is 0. |
|
period_seconds
Vereist
|
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1. |
|
initial_delay_seconds
Vereist
|
Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310. |
|
timeout_seconds
Vereist
|
Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1. |
|
success_threshold
Vereist
|
De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1. |
|
failure_threshold
Vereist
|
Wanneer een pod wordt gestart en de livenesstest mislukt, zal |
|
namespace
Vereist
|
De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn. |
|
token_auth_enabled
Vereist
|
Of u Azure Active Directory-verificatie voor deze webservice al dan niet wilt inschakelen. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False. |
|
version_name
Vereist
|
De naam van de versie in een eindpunt. |
|
traffic_percentile
Vereist
|
De hoeveelheid verkeer dat de versie in een eindpunt opneemt. |
|
compute_target_name
Vereist
|
De naam van het rekendoel dat moet worden geïmplementeerd in |
|
cpu_cores_limit
Vereist
|
Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn. |
|
memory_gb_limit
Vereist
|
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn. |
Variabelen
| Name | Description |
|---|---|
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
Hiermee wordt aangegeven of automatisch schalen voor deze webservice al dan niet moet worden ingeschakeld. De standaardwaarde is Waar als |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. De standaardwaarde is 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze webservice. De standaardwaarde is 70. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
Het al dan niet inschakelen van modelgegevensverzameling voor deze webservice. De standaardwaarde is False. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
Hiermee wordt aangegeven of verificatie voor deze webservice al dan niet moet worden ingeschakeld. De standaardwaarde is Waar. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
Het aantal cpu-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1 |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0,5 |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
Of u Application Insights-logboekregistratie voor deze webservice al dan niet wilt inschakelen. De standaardwaarde is False. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
Een time-out voor het afdwingen van score-aanroepen naar deze webservice. De standaardwaarde is 60000. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
Het aantal maximaal gelijktijdige aanvragen per replica dat deze webservice toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
Het aantal containers dat moet worden toegewezen voor deze webservice. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
Een primaire verificatiesleutel die voor deze webservice kan worden gebruikt |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
Een secundaire verificatiesleutel die voor deze webservice kan worden gebruikt |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
Woordenlijst met sleutelwaardetags om deze webservice te geven |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
Woordenlijst met sleutelwaarde-eigenschappen om deze webservice te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
Een beschrijving om deze webservice te geven. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
Het aantal GPU-kernen dat moet worden toegewezen voor deze webservice. De standaardwaarde is 0. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Wanneer een pod wordt gestart en de livenesstest mislukt, zal |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
Of u Azure Active Directory-verificatie voor deze webservice al dan niet wilt inschakelen. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
De naam van de versie in een eindpunt. |
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
De hoeveelheid verkeer dat de versie in een eindpunt opneemt. |
Methoden
| validate_endpoint_configuration |
Controleer of de opgegeven configuratiewaarden geldig zijn. Er wordt een WebserviceException weergegeven als de validatie mislukt. |
validate_endpoint_configuration
Controleer of de opgegeven configuratiewaarden geldig zijn.
Er wordt een WebserviceException weergegeven als de validatie mislukt.
validate_endpoint_configuration()
Uitzonderingen
| Type | Description |
|---|---|