AksEndpoint Klas

Opmerking

Dit is een experimentele klasse en kan op elk gewenst moment worden gewijzigd. Zie https://aka.ms/acr/connected-registry voor meer informatie.

Vertegenwoordigt een verzameling webserviceversies achter hetzelfde eindpunt dat wordt uitgevoerd in Azure Kubernetes Service.

Terwijl één AksWebservice service met één score-eindpunt wordt geïmplementeerd, kunt u met de klasse AksEndpoint meerdere webserviceversies achter hetzelfde score-eindpunt implementeren. Elke webserviceversie kan worden geconfigureerd voor een percentage van het verkeer, zodat u modellen op een gecontroleerde manier kunt implementeren, bijvoorbeeld voor A/B-tests. Het AksEndpoint staat implementatie toe vanuit een modelobject dat vergelijkbaar is met AksWebservice.

Initialiseer het webservice-exemplaar.

De webserviceconstructor haalt een cloudweergave op van een webserviceobject dat is gekoppeld aan de opgegeven werkruimte. Er wordt een exemplaar van een onderliggende klasse geretourneerd dat overeenkomt met het specifieke type van het opgehaalde webserviceobject.

Constructor

AksEndpoint(workspace, name)

Parameters

Name Description
workspace
Vereist

Het werkruimteobject met het webserviceobject dat moet worden opgehaald.

name
Vereist
str

De naam van het webserviceobject dat moet worden opgehaald.

Variabelen

Name Description
versions

Een woordenlijst met versienaam naar versieobject. Bevat alle versies die zijn geïmplementeerd als onderdeel van dit eindpunt.

Methoden

create_version

Voeg een nieuwe versie toe aan een eindpunt met opgegeven eigenschappen.

delete_version

Een versie in een eindpunt verwijderen.

deploy_configuration

Maak een configuratieobject voor implementatie naar een AKS-rekendoel.

serialize

Converteer deze webservice naar een geserialiseerde JSON-woordenlijst.

update

Werk het eindpunt bij met de opgegeven eigenschappen.

Waarden links omdat Geen ongewijzigd blijft in dit eindpunt

update_version

Werk een bestaande versie in een eindpunt bij met opgegeven eigenschappen.

De waarden blijven ongewijzigd in deze versie.

create_version

Voeg een nieuwe versie toe aan een eindpunt met opgegeven eigenschappen.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parameters

Name Description
version_name
Vereist
str

De naam van de versie die moet worden toegevoegd aan een eindpunt.

autoscale_enabled

Of u automatische schaalaanpassing voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar als num_replicas dit Geen is.

Default value: None
autoscale_min_replicas
int

Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. Standaard ingesteld op 1

Default value: None
autoscale_max_replicas
int

Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. Standaard ingesteld op 10

Default value: None
autoscale_refresh_seconds
int

Hoe vaak de automatische schaalaanpassing moet proberen om deze versie in een eindpunt te schalen. Standaard ingesteld op 1

Default value: None
autoscale_target_utilization
int

Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze versie in een eindpunt. Standaard ingesteld op 70

Default value: None
collect_model_data

Of u modelgegevensverzameling voor deze versie in een eindpunt al dan niet wilt inschakelen. Standaard ingesteld op False.

Default value: None
cpu_cores

Het aantal CPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0.1

Default value: None
memory_gb

De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0,5

Default value: None
scoring_timeout_ms
int

Een time-out voor het afdwingen van scoreaanroepen naar deze versie in een eindpunt. De standaardwaarde is 60000.

Default value: None
replica_max_concurrent_requests
int

Het aantal maximaal gelijktijdige aanvragen per replica dat deze versie in een eindpunt toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.

Default value: None
max_request_wait_time
int

De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500.

Default value: None
num_replicas
int

Het aantal containers dat moet worden toegewezen voor deze versie in een eindpunt. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld.

Default value: None
tags

Woordenlijst met sleutelwaardetags om dit eindpunt te geven.

Default value: None
properties

Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd.

Default value: None
description
str

Een beschrijving om dit eindpunt te geven.

Default value: None
models

Een lijst met modelobjecten die moeten worden verpakt met de bijgewerkte service.

Default value: None
inference_config

Een InferenceConfig-object dat wordt gebruikt om de vereiste modelimplementatie-eigenschappen op te geven.

Default value: None
gpu_cores
int

Het aantal GPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. De standaardwaarde is 0.

Default value: None
period_seconds
int

Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.

Default value: None
initial_delay_seconds
int

Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310.

Default value: None
timeout_seconds
int

Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1.

Default value: None
success_threshold
int

De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1.

Default value: None
failure_threshold
int

Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert Kubernetes failureThreshold keer voordat hij stopt. Standaardwaarde is 3. Minimumwaarde is 1.

Default value: None
traffic_percentile

De hoeveelheid verkeer dat de versie in een eindpunt opneemt.

Default value: None
is_default

Of u deze versie al dan niet als standaardversie in een eindpunt wilt maken. De standaardwaarde is False.

Default value: None
is_control_version_type

Of u deze versie al dan niet als besturingselementversie in een eindpunt wilt maken. De standaardwaarde is False.

Default value: None
cpu_cores_limit

Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.

Default value: None
memory_gb_limit

De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.

Default value: None

Uitzonderingen

Type Description

delete_version

Een versie in een eindpunt verwijderen.

delete_version(version_name)

Parameters

Name Description
version_name
Vereist
str

De naam van de versie in een eindpunt die u wilt verwijderen.

Uitzonderingen

Type Description

deploy_configuration

Maak een configuratieobject voor implementatie naar een AKS-rekendoel.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

Parameters

Name Description
autoscale_enabled

Of u automatische schaalaanpassing voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar als num_replicas dit Geen is.

Default value: None
autoscale_min_replicas
int

Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 1.

Default value: None
autoscale_max_replicas
int

Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 10.

Default value: None
autoscale_refresh_seconds
int

Hoe vaak de automatische schaalaanpassing moet proberen om deze versie in een eindpunt te schalen. De standaardwaarde is 1.

Default value: None
autoscale_target_utilization
int

Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze versie in een eindpunt. De standaardwaarde is 70.

Default value: None
collect_model_data

Of u modelgegevensverzameling voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is False.

Default value: None
auth_enabled

Of u sleutelverificatie voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar.

Default value: None
cpu_cores

Het aantal cpu-kernen dat moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0.1

Default value: None
memory_gb

De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0,5

Default value: None
enable_app_insights

Of u ApplicationInsights-logboekregistratie voor deze versie al dan niet wilt inschakelen in een eindpunt. De standaardwaarde is False.

Default value: None
scoring_timeout_ms
int

Een time-out voor het afdwingen van scoreaanroepen naar deze versie in een eindpunt. Standaard ingesteld op 60000

Default value: None
replica_max_concurrent_requests
int

Het aantal maximaal gelijktijdige aanvragen per replica dat deze versie in een eindpunt toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.

Default value: None
max_request_wait_time
int

De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500.

Default value: None
num_replicas
int

Het aantal containers dat moet worden toegewezen voor deze versie in een eindpunt. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld.

Default value: None
primary_key
str

Een primaire verificatiesleutel die voor dit eindpunt moet worden gebruikt.

Default value: None
secondary_key
str

Een secundaire verificatiesleutel die voor dit eindpunt moet worden gebruikt.

Default value: None
tags

Woordenlijst met sleutelwaardetags om dit eindpunt te geven.

Default value: None
properties

Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen nieuwe sleutelwaardeparen worden toegevoegd

Default value: None
description
str

Een beschrijving om dit eindpunt te geven.

Default value: None
gpu_cores
int

Het aantal GPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. De standaardwaarde is 0.

Default value: None
period_seconds
int

Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.

Default value: None
initial_delay_seconds
int

Aantal seconden nadat de container is gestart voordat de liveness-tests worden gestart. De standaardwaarde is 310.

Default value: None
timeout_seconds
int

Aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1.

Default value: None
success_threshold
int

De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. De standaardwaarde is 1. Minimumwaarde is 1.

Default value: None
failure_threshold
int

Wanneer een pod wordt gestart en de livenesstest mislukt, zal failureThreshold Kubernetes het proberen voordat hij opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.

Default value: None
namespace
str

De Kubernetes-naamruimte waarin dit eindpunt moet worden geïmplementeerd: maximaal 63 alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.

Default value: None
token_auth_enabled

Hiermee wordt aangegeven of tokenverificatie voor dit eindpunt al dan niet moet worden ingeschakeld. Als dit is ingeschakeld, hebben gebruikers toegang tot dit eindpunt door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False.

Default value: None
version_name
str

De naam van de versie in een eindpunt.

Default value: None
traffic_percentile

de hoeveelheid verkeer dat de versie in een eindpunt opneemt.

Default value: None
compute_target_name
str

De naam van het rekendoel dat moet worden geïmplementeerd in

Default value: None
cpu_cores_limit

Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.

Default value: None
memory_gb_limit

De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.

Default value: None

Retouren

Type Description

Uitzonderingen

Type Description

serialize

Converteer deze webservice naar een geserialiseerde JSON-woordenlijst.

serialize()

Retouren

Type Description

De JSON-weergave van deze webservice.

update

Werk het eindpunt bij met de opgegeven eigenschappen.

Waarden links omdat Geen ongewijzigd blijft in dit eindpunt

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

Parameters

Name Description
auth_enabled

Of u sleutelverificatie voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar.

Default value: None
token_auth_enabled

Hiermee wordt aangegeven of tokenverificatie voor dit eindpunt al dan niet moet worden ingeschakeld. Als dit is ingeschakeld, hebben gebruikers toegang tot dit eindpunt door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. De standaardwaarde is False.

Default value: None
enable_app_insights

Of u Application Insights-logboekregistratie voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is False.

Default value: None
description
str

Een beschrijving om dit eindpunt te geven.

Default value: None
tags

Woordenlijst met sleutelwaardetags om dit eindpunt te geven.

Default value: None
properties

Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd.

Default value: None

Uitzonderingen

Type Description

update_version

Werk een bestaande versie in een eindpunt bij met opgegeven eigenschappen.

De waarden blijven ongewijzigd in deze versie.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parameters

Name Description
version_name
Vereist
str

De naam van de versie in een eindpunt.

autoscale_enabled

Of u automatische schaalaanpassing voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is Waar als num_replicas geen is.

Default value: None
autoscale_min_replicas
int

Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 1.

Default value: None
autoscale_max_replicas
int

Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze versie in een eindpunt. De standaardwaarde is 10.

Default value: None
autoscale_refresh_seconds
int

Hoe vaak de automatische schaalaanpassing moet proberen om deze versie in een eindpunt te schalen. Standaard ingesteld op 1

Default value: None
autoscale_target_utilization
int

Het doelgebruik (in procent van de 100) moet de automatische schaalaanpassing proberen te onderhouden voor deze versie in een eindpunt. De standaardwaarde is 70.

Default value: None
collect_model_data

Of u modelgegevensverzameling voor deze versie in een eindpunt al dan niet wilt inschakelen. De standaardwaarde is False.

Default value: None
cpu_cores

Het aantal cpu-kernen dat moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0.1

Default value: None
memory_gb

De hoeveelheid geheugen (in GB) die moet worden toegewezen voor deze versie in een eindpunt. Kan een decimaal getal zijn. Standaard ingesteld op 0,5

Default value: None
scoring_timeout_ms
int

Een time-out voor het afdwingen van scoreaanroepen naar deze versie in een eindpunt. De standaardwaarde is 60000.

Default value: None
replica_max_concurrent_requests
int

Het aantal maximaal gelijktijdige aanvragen per replica dat deze versie in een eindpunt toestaat. De standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij dit wordt aangegeven door de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.

Default value: None
max_request_wait_time
int

De maximale tijdsduur die een aanvraag in de wachtrij blijft (in milliseconden) voordat een 503-fout wordt geretourneerd. De standaardwaarde is 500.

Default value: None
num_replicas
int

Het aantal containers dat moet worden toegewezen voor deze versie in een eindpunt. Geen standaardwaarde, als deze parameter niet is ingesteld, is de automatische schaalaanpassing standaard ingeschakeld.

Default value: None
tags

Woordenlijst met sleutelwaardetags om dit eindpunt te geven.

Default value: None
properties

Woordenlijst met sleutelwaarde-eigenschappen om dit eindpunt te geven. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar nieuwe sleutelwaardeparen kunnen worden toegevoegd.

Default value: None
description
str

Een beschrijving om dit eindpunt te geven

Default value: None
models

Een lijst met modelobjecten die moeten worden verpakt met de bijgewerkte service

Default value: None
inference_config

Een InferenceConfig-object dat wordt gebruikt om de vereiste modelimplementatie-eigenschappen op te geven.

Default value: None
gpu_cores
int

Het aantal GPU-kernen dat moet worden toegewezen voor deze versie in een eindpunt. De standaardwaarde is 0.

Default value: None
period_seconds
int

Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.

Default value: None
initial_delay_seconds
int

Het aantal seconden nadat de container is gestart voordat liveness-tests worden gestart. De standaardwaarde is 310.

Default value: None
timeout_seconds
int

Het aantal seconden waarna er een time-out optreedt voor de livenesstest. De standaardwaarde is 2 seconde. Minimumwaarde is 1.

Default value: None
success_threshold
int

De minimale opeenvolgende successen voor de liveness-test worden beschouwd als geslaagd nadat deze is mislukt. De standaardwaarde is 1. Minimumwaarde is 1.

Default value: None
failure_threshold
int

Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert Kubernetes failureThreshold keer voordat hij stopt. Standaardwaarde is 3. Minimumwaarde is 1.

Default value: None
traffic_percentile

De hoeveelheid verkeer dat de versie in een eindpunt opneemt.

Default value: None
is_default

Of u deze versie al dan niet als standaardversie in een eindpunt wilt maken. De standaardwaarde is False.

Default value: None
is_control_version_type

Of u deze versie al dan niet als besturingselementversie in een eindpunt wilt maken. De standaardwaarde is False.

Default value: None
cpu_cores_limit

Het maximum aantal cpu-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.

Default value: None
memory_gb_limit

De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.

Default value: None

Uitzonderingen

Type Description