AksEndpoint Klas
Opmerking
Dit is een experimentele klasse en kan op elk gewenst moment worden gewijzigd. Zie https://aka.ms/acr/connected-registry voor meer informatie.
Vertegenwoordigt een verzameling webserviceversies achter hetzelfde eindpunt dat wordt uitgevoerd in Azure Kubernetes Service.
Terwijl één AksWebservice service met één score-eindpunt wordt geïmplementeerd, kunt u met de klasse AksEndpoint meerdere webserviceversies achter hetzelfde score-eindpunt implementeren. Elke webserviceversie kan worden geconfigureerd voor een percentage van het verkeer, zodat u modellen op een gecontroleerde manier kunt implementeren, bijvoorbeeld voor A/B-tests. Het AksEndpoint staat implementatie toe vanuit een modelobject dat vergelijkbaar is met AksWebservice.
Initialiseer het webservice-exemplaar.
De webserviceconstructor haalt een cloudweergave op van een webserviceobject dat is gekoppeld aan de opgegeven werkruimte. Er wordt een exemplaar van een onderliggende klasse geretourneerd dat overeenkomt met het specifieke type van het opgehaalde webserviceobject.
Constructor
AksEndpoint(workspace, name)
Parameters
| Name | Description |
|---|---|
|
workspace
Vereist
|
Het werkruimteobject met het webserviceobject dat moet worden opgehaald. |
|
name
Vereist
|
De naam van het webserviceobject dat moet worden opgehaald. |
Variabelen
| Name | Description |
|---|---|
|
versions
|
Een woordenlijst met versienaam naar versieobject. Bevat alle versies die zijn geïmplementeerd als onderdeel van dit eindpunt. |
Methoden
| create_version |
Voeg een nieuwe versie toe aan een eindpunt met opgegeven eigenschappen. |
| delete_version |
Een versie in een eindpunt verwijderen. |
| deploy_configuration |
Maak een configuratieobject voor implementatie naar een AKS-rekendoel. |
| serialize |
Converteer deze webservice naar een geserialiseerde JSON-woordenlijst. |
| update |
Werk het eindpunt bij met de opgegeven eigenschappen. Waarden links omdat Geen ongewijzigd blijft in dit eindpunt |
| update_version |
Werk een bestaande versie in een eindpunt bij met opgegeven eigenschappen. De waarden blijven ongewijzigd in deze versie. |
create_version
Voeg een nieuwe versie toe aan een eindpunt met opgegeven eigenschappen.
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parameters
| Name | Description |
|---|---|
|
version_name
Vereist
|
De naam van de versie die moet worden toegevoegd aan een eindpunt. |
|
autoscale_enabled
|
Of u automatische schaalaanpassing voor deze versie in een eindpunt al dan niet wilt inschakelen.
De standaardwaarde is Waar als Default value: None
|
|
autoscale_min_replicas
|
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. Standaard ingesteld op 1 Default value: None
|
|
autoscale_max_replicas
|
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. Standaard ingesteld op 10 Default value: None
|
|
autoscale_refresh_seconds
|
Hoe vaak de automatische schaalaanpassing moet proberen om deze versie in een eindpunt te schalen. Standaard ingesteld op 1 Default value: None
|
|
autoscale_target_utilization
|
Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze versie in een eindpunt. Standaard ingesteld op 70 Default value: None
|
|
collect_model_data
|
Of u modelgegevensverzameling voor deze versie in een eindpunt al dan niet wilt inschakelen. Standaard ingesteld op False. Default value: None
|
|
cpu_cores
|
Het aantal CPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0.1 Default value: None
|
|
memory_gb
|
De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0,5 Default value: None
|
|
scoring_timeout_ms
|
Een time-out voor het afdwingen van scoreaanroepen naar deze versie in een eindpunt. De standaardwaarde is 60000. Default value: None
|
|
replica_max_concurrent_requests
|
Het aantal maximaal gelijktijdige aanvragen per replica dat deze versie in een eindpunt toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team. Default value: None
|
|
max_request_wait_time
|
De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500. Default value: None
|
|
num_replicas
|
Het aantal containers dat moet worden toegewezen voor deze versie in een eindpunt. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld. Default value: None
|
|
tags
|
Woordenlijst met sleutelwaardetags om dit eindpunt te geven. Default value: None
|
|
properties
|
Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd. Default value: None
|
|
description
|
Een beschrijving om dit eindpunt te geven. Default value: None
|
|
models
|
Een lijst met modelobjecten die moeten worden verpakt met de bijgewerkte service. Default value: None
|
|
inference_config
|
Een InferenceConfig-object dat wordt gebruikt om de vereiste modelimplementatie-eigenschappen op te geven. Default value: None
|
|
gpu_cores
|
Het aantal GPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. De standaardwaarde is 0. Default value: None
|
|
period_seconds
|
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1. Default value: None
|
|
initial_delay_seconds
|
Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310. Default value: None
|
|
timeout_seconds
|
Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1. Default value: None
|
|
success_threshold
|
De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1. Default value: None
|
|
failure_threshold
|
Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert Kubernetes failureThreshold keer voordat hij stopt. Standaardwaarde is 3. Minimumwaarde is 1. Default value: None
|
|
traffic_percentile
|
De hoeveelheid verkeer dat de versie in een eindpunt opneemt. Default value: None
|
|
is_default
|
Of u deze versie al dan niet als standaardversie in een eindpunt wilt maken. De standaardwaarde is False. Default value: None
|
|
is_control_version_type
|
Of u deze versie al dan niet als besturingselementversie in een eindpunt wilt maken. De standaardwaarde is False. Default value: None
|
|
cpu_cores_limit
|
Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn. Default value: None
|
|
memory_gb_limit
|
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn. Default value: None
|
Uitzonderingen
| Type | Description |
|---|---|
delete_version
Een versie in een eindpunt verwijderen.
delete_version(version_name)
Parameters
| Name | Description |
|---|---|
|
version_name
Vereist
|
De naam van de versie in een eindpunt die u wilt verwijderen. |
Uitzonderingen
| Type | Description |
|---|---|
deploy_configuration
Maak een configuratieobject voor implementatie naar een AKS-rekendoel.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
Parameters
| Name | Description |
|---|---|
|
autoscale_enabled
|
Of u automatische schaalaanpassing voor deze versie in een eindpunt al dan niet wilt inschakelen.
De standaardwaarde is Waar als Default value: None
|
|
autoscale_min_replicas
|
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 1. Default value: None
|
|
autoscale_max_replicas
|
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 10. Default value: None
|
|
autoscale_refresh_seconds
|
Hoe vaak de automatische schaalaanpassing moet proberen om deze versie in een eindpunt te schalen. De standaardwaarde is 1. Default value: None
|
|
autoscale_target_utilization
|
Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze versie in een eindpunt. De standaardwaarde is 70. Default value: None
|
|
collect_model_data
|
Of u modelgegevensverzameling voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is False. Default value: None
|
|
auth_enabled
|
Of u sleutelverificatie voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar. Default value: None
|
|
cpu_cores
|
Het aantal cpu-kernen dat moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0.1 Default value: None
|
|
memory_gb
|
De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0,5 Default value: None
|
|
enable_app_insights
|
Of u ApplicationInsights-logboekregistratie voor deze versie al dan niet wilt inschakelen in een eindpunt. De standaardwaarde is False. Default value: None
|
|
scoring_timeout_ms
|
Een time-out voor het afdwingen van scoreaanroepen naar deze versie in een eindpunt. Standaard ingesteld op 60000 Default value: None
|
|
replica_max_concurrent_requests
|
Het aantal maximaal gelijktijdige aanvragen per replica dat deze versie in een eindpunt toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team. Default value: None
|
|
max_request_wait_time
|
De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500. Default value: None
|
|
num_replicas
|
Het aantal containers dat moet worden toegewezen voor deze versie in een eindpunt. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld. Default value: None
|
|
primary_key
|
Een primaire verificatiesleutel die voor dit eindpunt moet worden gebruikt. Default value: None
|
|
secondary_key
|
Een secundaire verificatiesleutel die voor dit eindpunt moet worden gebruikt. Default value: None
|
|
tags
|
Woordenlijst met sleutelwaardetags om dit eindpunt te geven. Default value: None
|
|
properties
|
Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen nieuwe sleutelwaardeparen worden toegevoegd Default value: None
|
|
description
|
Een beschrijving om dit eindpunt te geven. Default value: None
|
|
gpu_cores
|
Het aantal GPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. De standaardwaarde is 0. Default value: None
|
|
period_seconds
|
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1. Default value: None
|
|
initial_delay_seconds
|
Aantal seconden nadat de container is gestart voordat de liveness-tests worden gestart. De standaardwaarde is 310. Default value: None
|
|
timeout_seconds
|
Aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1. Default value: None
|
|
success_threshold
|
De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. De standaardwaarde is 1. Minimumwaarde is 1. Default value: None
|
|
failure_threshold
|
Wanneer een pod wordt gestart en de livenesstest mislukt, zal Default value: None
|
|
namespace
|
De Kubernetes-naamruimte waarin dit eindpunt moet worden geïmplementeerd: maximaal 63 alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn. Default value: None
|
|
token_auth_enabled
|
Hiermee wordt aangegeven of tokenverificatie voor dit eindpunt al dan niet moet worden ingeschakeld. Als dit is ingeschakeld, hebben gebruikers toegang tot dit eindpunt door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False. Default value: None
|
|
version_name
|
De naam van de versie in een eindpunt. Default value: None
|
|
traffic_percentile
|
de hoeveelheid verkeer dat de versie in een eindpunt opneemt. Default value: None
|
|
compute_target_name
|
De naam van het rekendoel dat moet worden geïmplementeerd in Default value: None
|
|
cpu_cores_limit
|
Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn. Default value: None
|
|
memory_gb_limit
|
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn. Default value: None
|
Retouren
| Type | Description |
|---|---|
Uitzonderingen
| Type | Description |
|---|---|
serialize
Converteer deze webservice naar een geserialiseerde JSON-woordenlijst.
serialize()
Retouren
| Type | Description |
|---|---|
|
De JSON-weergave van deze webservice. |
update
Werk het eindpunt bij met de opgegeven eigenschappen.
Waarden links omdat Geen ongewijzigd blijft in dit eindpunt
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
Parameters
| Name | Description |
|---|---|
|
auth_enabled
|
Of u sleutelverificatie voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar. Default value: None
|
|
token_auth_enabled
|
Hiermee wordt aangegeven of tokenverificatie voor dit eindpunt al dan niet moet worden ingeschakeld. Als dit is ingeschakeld, hebben gebruikers toegang tot dit eindpunt door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False. Default value: None
|
|
enable_app_insights
|
Of u Application Insights-logboekregistratie voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is False. Default value: None
|
|
description
|
Een beschrijving om dit eindpunt te geven. Default value: None
|
|
tags
|
Woordenlijst met sleutelwaardetags om dit eindpunt te geven. Default value: None
|
|
properties
|
Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd. Default value: None
|
Uitzonderingen
| Type | Description |
|---|---|
update_version
Werk een bestaande versie in een eindpunt bij met opgegeven eigenschappen.
De waarden blijven ongewijzigd in deze versie.
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parameters
| Name | Description |
|---|---|
|
version_name
Vereist
|
De naam van de versie in een eindpunt. |
|
autoscale_enabled
|
Of u automatische schaalaanpassing voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar als num_replicas geen is. Default value: None
|
|
autoscale_min_replicas
|
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 1. Default value: None
|
|
autoscale_max_replicas
|
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 10. Default value: None
|
|
autoscale_refresh_seconds
|
Hoe vaak de automatische schaalaanpassing moet proberen om deze versie in een eindpunt te schalen. Standaard ingesteld op 1 Default value: None
|
|
autoscale_target_utilization
|
Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze versie in een eindpunt. De standaardwaarde is 70. Default value: None
|
|
collect_model_data
|
Of u modelgegevensverzameling voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is False. Default value: None
|
|
cpu_cores
|
Het aantal cpu-kernen dat moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0.1 Default value: None
|
|
memory_gb
|
De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0,5 Default value: None
|
|
scoring_timeout_ms
|
Een time-out voor het afdwingen van scoreaanroepen naar deze versie in een eindpunt. De standaardwaarde is 60000. Default value: None
|
|
replica_max_concurrent_requests
|
Het aantal maximaal gelijktijdige aanvragen per replica dat deze versie in een eindpunt toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team. Default value: None
|
|
max_request_wait_time
|
De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500. Default value: None
|
|
num_replicas
|
Het aantal containers dat moet worden toegewezen voor deze versie in een eindpunt. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld. Default value: None
|
|
tags
|
Woordenlijst met sleutelwaardetags om dit eindpunt te geven. Default value: None
|
|
properties
|
Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd. Default value: None
|
|
description
|
Een beschrijving om dit eindpunt te geven Default value: None
|
|
models
|
Een lijst met modelobjecten die moeten worden verpakt met de bijgewerkte service Default value: None
|
|
inference_config
|
Een InferenceConfig-object dat wordt gebruikt om de vereiste modelimplementatie-eigenschappen op te geven. Default value: None
|
|
gpu_cores
|
Het aantal GPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. De standaardwaarde is 0. Default value: None
|
|
period_seconds
|
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1. Default value: None
|
|
initial_delay_seconds
|
Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310. Default value: None
|
|
timeout_seconds
|
Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1. Default value: None
|
|
success_threshold
|
De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1. Default value: None
|
|
failure_threshold
|
Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert Kubernetes failureThreshold keer voordat hij stopt. Standaardwaarde is 3. Minimumwaarde is 1. Default value: None
|
|
traffic_percentile
|
De hoeveelheid verkeer dat de versie in een eindpunt opneemt. Default value: None
|
|
is_default
|
Of u deze versie al dan niet als standaardversie in een eindpunt wilt maken. De standaardwaarde is False. Default value: None
|
|
is_control_version_type
|
Of u deze versie al dan niet als besturingselementversie in een eindpunt wilt maken. De standaardwaarde is False. Default value: None
|
|
cpu_cores_limit
|
Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn. Default value: None
|
|
memory_gb_limit
|
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn. Default value: None
|
Uitzonderingen
| Type | Description |
|---|---|