GitHub Actions gebruiken met Azure Machine Learning

Van toepassing op:Azure CLI ml extensie v2 (huidige versie)Python SDK azure-ai-ml v2 (huidige versie)

Ga aan de slag met GitHub Actions om een model te trainen in Azure Machine Learning.

In dit artikel leert u hoe u een GitHub Actions-werkstroom maakt die een machine learning-model bouwt en implementeert in Azure Machine Learning. U traint een lineair regressiemodel voor scikit-learn op de NYC Taxi-gegevensset.

GitHub Actions gebruikt een workflow YAML-bestand (.yml) in het /.github/workflows/ pad van uw repository. Deze definitie bevat de verschillende stappen en parameters die deel uitmaken van de werkstroom.

Vereisten

Een Azure Machine Learning-werkruimte. Zie De werkruimte maken voor stappen voor het maken van een werkruimte.
De Azure Machine Learning SDK voor Python v2. Gebruik de volgende opdracht om de SDK te installeren:
```
pip install azure-ai-ml azure-identity
```
Gebruik de volgende opdracht om een bestaande installatie van de SDK bij te werken naar de nieuwste versie:
```
pip install --upgrade azure-ai-ml azure-identity
```
Zie de Clientbibliotheek van Het Azure Machine Learning-pakket voor Python voor meer informatie.

Een GitHub-account. Als je er geen hebt, maak een gratis account aan.

Stap 1: De code ophalen

Fork de volgende opslagplaats op GitHub:

https://github.com/azure/azureml-examples

Kloon uw geforkte repository lokaal.

git clone https://github.com/YOUR-USERNAME/azureml-examples

Stap 2: Verifiëren met Azure

Definieer eerst hoe u zich verifieert met Azure. De aanbevolen, veiligere optie is om u aan te melden met behulp van OpenID Connect met een Microsoft Entra-toepassing of een door de gebruiker toegewezen beheerde identiteit. Indien nodig kunt u zich ook aanmelden met behulp van een service-principal en een wachtwoord. Deze methode is minder veilig en wordt niet aanbevolen.

Als u de Azure Login action met OIDC wilt gebruiken, moet u een federatieve identiteitcredentie configureren in een Microsoft Entra-applicatie of een gebruikers toegewezen beheerde identiteit.

Optie 1: Microsoft Entra toepassing

Maak een Microsoft Entra-toepassing met een service-principal via Azure Portal, Azure CLI of Azure PowerShell.
Kopieer de waarden voor client-id, abonnements-id en directory-id (tenant) voor later gebruik in uw GitHub Actions-werkstroom.
Wijs een geschikte rol toe aan uw service-principal via Azure Portal, Azure CLI of Azure PowerShell.
Configureer een federatieve identiteitsreferentie in een Microsoft Entra-toepassing om tokens te vertrouwen die door GitHub Actions zijn uitgegeven aan uw GitHub-opslagplaats.

Optie 2: Door de gebruiker toegewezen beheerde identiteit

Een door een gebruiker toegewezen beheerde identiteit maken.
Kopieer de waarden voor client-id, abonnements-id en directory-id (tenant) voor later gebruik in uw GitHub Actions-werkstroom.
Wijs een geschikte rol toe aan uw door de gebruiker toegewezen beheerde identiteit.
Configureer een federatieve identiteitsreferentie op een door de gebruiker toegewezen beheerde identiteit om tokens te vertrouwen die zijn uitgegeven door GitHub Actions aan uw GitHub-opslagplaats.

Geheimen maken

OpenID Connect
Service-principal

U moet de client-id, directory-id (tenant-id) en abonnements-id van uw toepassing opgeven voor de aanmeldingsactie. Deze waarden kunnen rechtstreeks in de werkstroom worden opgegeven of kunnen worden opgeslagen in GitHub-geheimen en waarnaar wordt verwezen in uw werkstroom. Het opslaan van de waarden als GitHub-geheimen is de veiligere optie.

Ga in GitHub naar uw opslagplaats.
Selecteer Beveiliging > Geheimen en variabelen > Acties.
Selecteer Nieuw opslagplaatsgeheim.

Notitie

Als u de werkstroombeveiliging in openbare opslagplaatsen wilt verbeteren, gebruikt u omgevingsgeheimen in plaats van opslagplaatsgeheimen. Als voor de omgeving goedkeuring is vereist, heeft een taak geen toegang tot omgevingsgeheimen totdat een van de vereiste revisoren deze goedkeurt.

Geheimen maken voor AZURE_CLIENT_ID, AZURE_TENANT_IDen AZURE_SUBSCRIPTION_ID. Kopieer deze waarden uit uw Microsoft Entra-toepassing of door de gebruiker toegewezen beheerde identiteit voor uw GitHub-geheimen:

GitHub-geheim	Microsoft Entra-toepassing of door de gebruiker toegewezen beheerde identiteit
AZURE_CLIENT_ID	Klant-ID
AZURE_SUBSCRIPTION_ID	Abonnements-id
AZURE_TENANT_ID	Id van directory (tenant)

Notitie

Om veiligheidsredenen raden we u aan GitHub Secrets te gebruiken in plaats van waarden rechtstreeks door te geven aan de werkstroom.

Ga in GitHub naar uw opslagplaats.
Ga naar Instellingen in het navigatiemenu.
Selecteer Beveiliging > Geheimen en variabelen > Acties.
Selecteer Nieuw opslagplaatsgeheim.
Plak de volledige JSON-uitvoer van de Azure CLI-opdracht in het waardeveld van het geheim. Geef het geheim de naam AZURE_CREDENTIALS.
Selecteer Geheim toevoegen.

Stap 3: Bijwerken `setup.sh` om verbinding te maken met uw Azure Machine Learning-werkruimte

Werk de CLI-installatiebestandsvariabelen bij zodat deze overeenkomen met uw werkruimte.

Ga in uw geforkte opslagplaats naar azureml-examples/cli/.
Bewerk en werk setup.sh deze variabelen in het bestand bij.

Variabele Beschrijving

GROUP Naam van resourcegroep

LOCATION Locatie van uw werkruimte (voorbeeld: eastus2)

WORKSPACE Naam van Azure Machine Learning-werkruimte

Variabele	Beschrijving
`GROUP`	Naam van resourcegroep
`LOCATION`	Locatie van uw werkruimte (voorbeeld: `eastus2`)
`WORKSPACE`	Naam van Azure Machine Learning-werkruimte

Stap 4: Bijwerken `pipeline.yml` met de naam van uw rekencluster

Gebruik een pipeline.yml bestand om uw Azure Machine Learning-pijplijn te implementeren. De pijplijn is een machine learning-pijplijn en niet een DevOps-pijplijn. U hoeft deze update alleen te maken als u een andere naam gebruikt dan cpu-cluster voor de naam van het rekencluster.

Ga in uw geforkte opslagplaats naar azureml-examples/cli/jobs/pipelines/nyc-taxi/pipeline.yml.
Telkens wanneer u compute: azureml:cpu-cluster ziet, werkt u de waarde van cpu-cluster bij met uw rekenclusternaam. Als uw cluster bijvoorbeeld de naam my-clusterheeft, is azureml:my-clusteruw nieuwe waarde. Er zijn vijf updates.

Stap 5: Uw GitHub Actions-werkstroom uitvoeren

Uw werkstroom wordt geverifieerd met Azure, stelt de Azure Machine Learning CLI in en gebruikt de CLI om een model te trainen in Azure Machine Learning.

OpenID Connect
Service-principal

Uw werkstroombestand bestaat uit een triggersectie en taken:

Met een trigger wordt de werkstroom in de on sectie gestart. De werkstroom wordt standaard uitgevoerd volgens een cron-schema en wanneer een pull-aanvraag wordt gedaan vanuit overeenkomende vertakkingen en paden. Meer informatie over gebeurtenissen die werkstromen activeren.
In de sectie Taken van de werkstroom checkt u code uit en meldt u zich aan bij Azure met de aanmeldingsactie van Azure met behulp van OpenID Connect.
De sectie Taken bevat ook een installatieactie waarmee de Machine Learning CLI (v2) wordt geïnstalleerd en ingesteld. Zodra de CLI is geïnstalleerd, wordt de uitvoeractie van de taak uitgevoerd op uw Azure Machine Learning-bestand pipeline.yml om een model te trainen met NYC-taxigegevens.

Uw werkstroom inschakelen

Open .github/workflows/cli-jobs-pipelines-nyc-taxi-pipeline.yml en controleer in uw geforkte opslagplaats of uw werkstroom er ongeveer als volgt uitziet.

Notitie

Het werkstroombestand in de opslagplaats kan extra stappen (zoals bootstrapping en validatie) bevatten die hier niet worden weergegeven. In het volgende voorbeeld ziet u de kernstappen.

name: cli-jobs-pipelines-nyc-taxi-pipeline
on:
  workflow_dispatch:
  schedule:
    - cron: "0 0/4 * * *"
  pull_request:
    branches:
      - main
    paths:
      - cli/jobs/pipelines/nyc-taxi/**
      - .github/workflows/cli-jobs-pipelines-nyc-taxi-pipeline.yml
      - cli/run-pipeline-jobs.sh
      - cli/setup.sh
permissions:
  id-token: write
jobs:
  build:
    runs-on: ubuntu-latest
    steps:
    - name: check out repo
      uses: actions/checkout@v4
    - name: azure login
      uses: azure/login@v2
      with:
          client-id: ${{ secrets.AZURE_CLIENT_ID }}
          tenant-id: ${{ secrets.AZURE_TENANT_ID }}
          subscription-id: ${{ secrets.AZURE_SUBSCRIPTION_ID }}
    - name: setup
      run: bash setup.sh
      working-directory: cli
      continue-on-error: true
    - name: run job
      run: bash -x ../../../run-job.sh pipeline.yml
      working-directory: cli/jobs/pipelines/nyc-taxi

Selecteer Uitvoeringen weergeven.
Schakel werkstromen in door ik begrijp mijn werkstromen, ga door en schakel ze in te selecteren.
Selecteer de cli-jobs-pipelines-nyc-taxi-pipeline-workflow en kies ervoor om de workflow inschakelen.
Selecteer Werkstroom starten en kies om nu de optie Werkstroom starten te kiezen.

Uw werkstroombestand bestaat uit een triggersectie en taken:

Met een trigger wordt de werkstroom in de on sectie gestart. De werkstroom wordt standaard uitgevoerd volgens een cron-schema en wanneer een pull-aanvraag wordt gedaan vanuit overeenkomende vertakkingen en paden. Meer informatie over gebeurtenissen die werkstromen activeren.
In de sectie Taken van de werkstroom checkt u code uit en meldt u zich aan bij Azure met uw service-principalgeheim.
De sectie Taken bevat ook een installatieactie waarmee de Machine Learning CLI (v2) wordt geïnstalleerd en ingesteld. Zodra de CLI is geïnstalleerd, wordt de uitvoeractie van de taak uitgevoerd op uw Azure Machine Learning-bestand pipeline.yml om een model te trainen met NYC-taxigegevens.

Uw werkstroom inschakelen

Open .github/workflows/cli-jobs-pipelines-nyc-taxi-pipeline.yml en controleer in uw geforkte opslagplaats of uw werkstroom er ongeveer als volgt uitziet.

Notitie

Het werkstroombestand in de opslagplaats kan aanvullende stappen bevatten die hier niet worden weergegeven. In het volgende voorbeeld ziet u de kernstappen.

name: cli-jobs-pipelines-nyc-taxi-pipeline
on:
  workflow_dispatch:
  schedule:
    - cron: "0 0/4 * * *"
  pull_request:
    branches:
      - main
    paths:
      - cli/jobs/pipelines/nyc-taxi/**
      - .github/workflows/cli-jobs-pipelines-nyc-taxi-pipeline.yml
      - cli/run-pipeline-jobs.sh
      - cli/setup.sh
jobs:
  build:
    runs-on: ubuntu-latest
    steps:
    - name: check out repo
      uses: actions/checkout@v4
    - name: azure login
      uses: azure/login@v2
      with:
        creds: ${{secrets.AZURE_CREDENTIALS}}
    - name: setup
      run: bash setup.sh
      working-directory: cli
      continue-on-error: true
    - name: run job
      run: bash -x ../../../run-job.sh pipeline.yml
      working-directory: cli/jobs/pipelines/nyc-taxi

Selecteer Uitvoeringen weergeven.
Schakel werkstromen in door ik begrijp mijn werkstromen, ga door en schakel ze in te selecteren.
Selecteer de cli-jobs-pipelines-nyc-taxi-pipeline-workflow en kies ervoor om de workflow inschakelen.
Selecteer Werkstroom starten en kies om nu de optie Werkstroom starten te kiezen.

Stap 6: Controleer of uw werkstroom wordt uitgevoerd

Open de voltooide werkstroomuitvoering en controleer of de build-taak succesvol is uitgevoerd. U ziet een groen vinkje naast de taak.
Open Azure Machine Learning Studio en ga naar nyc-taxi-pipeline-example. Controleer of elk deel van uw taak (voorbereiding, transformatie, trainen, voorspellen, score) is voltooid en of u een groen vinkje ziet.

Het opruimen van resources

Wanneer u uw resourcegroep en opslagplaats niet meer nodig hebt, schoont u de resources op die u hebt geïmplementeerd door de resourcegroep en uw GitHub-opslagplaats te verwijderen.

Volgende stappen

ML-pijplijnen voor productie maken met Python SDK

Feedback

Is deze pagina nuttig?

Last updated on 2026-03-20

GitHub Actions gebruiken met Azure Machine Learning

Vereisten

Stap 1: De code ophalen

Stap 2: Verifiëren met Azure

Genereer implementatiereferenties

Geheimen maken

Stap 3: Bijwerken setup.sh om verbinding te maken met uw Azure Machine Learning-werkruimte

Stap 4: Bijwerken pipeline.yml met de naam van uw rekencluster

Stap 5: Uw GitHub Actions-werkstroom uitvoeren

Uw werkstroom inschakelen

Stap 6: Controleer of uw werkstroom wordt uitgevoerd

Het opruimen van resources

Volgende stappen

Feedback

Aanvullende resources

Stap 3: Bijwerken `setup.sh` om verbinding te maken met uw Azure Machine Learning-werkruimte

Stap 4: Bijwerken `pipeline.yml` met de naam van uw rekencluster