Modellen trainen met Azure Machine Learning (v1)

VAN TOEPASSING OP:Azure Machine Learning SDK v1 voor Python

Belangrijk

Dit artikel biedt informatie over het gebruik van de Azure Machine Learning SDK v1. SDK v1 is vanaf 31 maart 2025 afgeschaft. Ondersteuning voor het zal eindigen op 30 juni 2026. U kunt SDK v1 tot die datum installeren en gebruiken. Uw bestaande werkstromen met SDK v1 blijven werken na de einddatum van de ondersteuning. Ze kunnen echter worden blootgesteld aan beveiligingsrisico's of incompatibiliteit door wijzigingen in de architectuur van het product.

We raden aan dat u overstapt naar SDK v2 vóór 30 juni 2026. Zie Wat is Azure Machine Learning CLI en Python SDK v2? en de SDK v2-verwijzing voor meer informatie over SDK v2.

Azure Machine Learning biedt meerdere manieren om modellen te trainen, waaronder code-first-oplossingen met de SDK en opties voor weinig code, zoals geautomatiseerde machine learning en de visuele ontwerpfunctie. Gebruik de volgende lijst om te bepalen welke trainingsmethode aan uw behoeften voldoet:

  • Azure Machine Learning SDK voor Python: de Python SDK biedt verschillende manieren om modellen te trainen, elk met verschillende mogelijkheden.

    Trainingsmethode Beschrijving
    Configuratie uitvoeren Een veelgebruikte manier om modellen te trainen , is door een trainingsscript en taakconfiguratie te gebruiken. De taakconfiguratie definieert de trainingsomgeving, met inbegrip van uw script, rekendoel en Azure Machine Learning-omgeving. U kunt een trainingstaak uitvoeren door deze details op te geven.
    Geautomatiseerde machine learning Met geautomatiseerde machine learning kunt u modellen trainen zonder deep data science of programmeerexpertise. Voor ervaren gebruikers bespaart het tijd door algoritmeselectie en hyperparameterafstemming te automatiseren. Taakconfiguratie is niet vereist bij het gebruik van geautomatiseerde machine learning.
    Machine learning-pijplijn Pijplijnen zijn geen afzonderlijke trainingsmethode, maar een manier om werkstromen te definiëren met behulp van modulaire, herbruikbare stappen die training kunnen bevatten. Pijplijnen ondersteunen zowel geautomatiseerde machine learning als het uitvoeren van configuraties. Gebruik een pijplijn als u het volgende wilt doen:
    * Plan onbeheerde processen , zoals langlopende trainingstaken of gegevensvoorbereiding.
    * Coördineer meerdere stappen voor verschillende rekenresources en opslaglocaties.
    * Maak een herbruikbare sjabloon voor scenario's zoals opnieuw trainen of batchgewijs scoren.
    * Gegevensbronnen, invoer en uitvoer voor uw werkstroom bijhouden en versien.
    * Verschillende teams in staat stellen om onafhankelijk van elkaar aan specifieke stappen te werken en deze in een pijplijn te combineren.
  • Ontwerpfunctie: Azure Machine Learning Designer is een eenvoudig toegangspunt voor het bouwen van concepten of voor gebruikers met een beperkte coderingservaring. Modellen trainen met behulp van een webinterface met slepen-en-neerzetten-functionaliteit. U kunt Python-code opnemen of modellen trainen zonder code te schrijven.

  • Azure CLI: De Machine Learning CLI biedt opdrachten voor algemene Azure Machine Learning-taken en wordt vaak gebruikt voor het uitvoeren van scripts en automatisering. Nadat u bijvoorbeeld een trainingsscript of pijplijn hebt gemaakt, kunt u de CLI gebruiken om een trainingstaak te starten volgens een planning of wanneer trainingsgegevens worden bijgewerkt. De CLI kan taken verzenden met behulp van uitvoeringsconfiguraties of pijplijnen.

Elke trainingsmethode kan verschillende typen rekenresources gebruiken, ook wel rekendoelen genoemd. Een berekeningsdoel kan een lokale machine of een cloudresource zijn, zoals Azure Machine Learning Compute, Azure HDInsight of een externe virtuele machine.

Python SDK

Met de Azure Machine Learning SDK voor Python kunt u machine learning-werkstromen bouwen en uitvoeren. U kunt communiceren met de service vanuit een interactieve Python-sessie, Jupyter Notebooks, Visual Studio Code of andere IDE.

Configuratie uitvoeren

Een typische trainingstaak in Azure Machine Learning wordt gedefinieerd met behulp van ScriptRunConfig. De scriptuitvoeringsconfiguratie wordt, samen met uw trainingsscripts, gebruikt om een model op een computedoel te trainen.

U kunt beginnen met een uitvoeringsconfiguratie voor uw lokale computer en zo nodig overschakelen naar een rekendoel in de cloud. Om het computedoel te wijzigen, werk de uitvoeringsconfiguratie bij. Elke uitvoering registreert informatie over de trainingstaak, inclusief invoer, uitvoer en logboeken.

Geautomatiseerde machine learning

Iteraties, hyperparameterinstellingen, featurization en andere opties definiëren. Tijdens de training test Azure Machine Learning verschillende algoritmen en parameters parallel. Training stopt wanneer deze voldoet aan de afsluitcriteria die u instelt.

Aanbeveling

U kunt Geautomatiseerde ML ook gebruiken via Azure Machine Learning Studio, naast de Python SDK.

Machine learning-pijplijn

Machine learning-pijplijnen kunnen gebruikmaken van de hierboven beschreven trainingsmethoden. Pijplijnen richten zich op het maken van werkstromen, dus ze hebben betrekking op meer dan alleen modeltraining. In een pijplijn kunt u een model trainen met behulp van geautomatiseerde machine learning of configuraties uitvoeren.

Begrijpen wat er gebeurt wanneer u een trainingstaak indient

De levenscyclus van Azure-training omvat:

  1. De bestanden in uw projectmap zippen, waarbij de bestanden die zijn opgegeven in .amlignore of .gitignore worden genegeerd
  2. Uw rekencluster omhoog schalen
  3. De Docker-images bouwen of downloaden op het rekenknooppunt
    1. Het systeem berekent een hash van:
    2. Het systeem gebruikt deze hash om de werkruimte Azure Container Registry (ACR) op te zoeken
    3. Als dit niet wordt gevonden, wordt de globale ACR gecontroleerd
    4. Als er nog steeds geen afbeelding is gevonden, bouwt het systeem een nieuwe afbeelding (die in de cache wordt opgeslagen en geregistreerd bij de ACR van de werkruimte)
  4. Het zip-projectbestand downloaden naar tijdelijke opslag op het rekenknooppunt
  5. Het projectbestand opheffen
  6. Het rekenknooppunt voert python <entry script> <arguments> uit
  7. Logboeken, modelbestanden en andere bestanden opslaan die zijn geschreven naar het opslagaccount dat is gekoppeld aan ./outputs de werkruimte
  8. Rekenkracht omlaag schalen, inclusief het verwijderen van tijdelijke opslag

Als u traint op uw lokale computer (configureren als lokale uitvoering), is Docker niet vereist. U kunt Docker lokaal gebruiken als u wilt (zie ML-pijplijn configureren voor een voorbeeld).

Azure Machine Learning-ontwerpprogramma

Met de ontwerptool kunt u modellen trainen met behulp van een interface voor slepen en neerzetten in uw webbrowser.

Azure-CLI

De Machine Learning CLI is een extensie voor de Azure CLI. Het biedt platformoverschrijdende opdrachten voor het werken met Azure Machine Learning. Normaal gesproken gebruikt u de CLI om taken te automatiseren, zoals het trainen van een machine learning-model.

Volgende stappen

Meer informatie over het configureren van een trainingsuitvoering.