Condividi tramite


CI/CD per l'attività di copia in Data Factory di Microsoft Fabric

Per eseguire con successo progetti di analisi dei dati con il Copy job, è importante utilizzare il controllo del codice sorgente, l'integrazione continua, la distribuzione continua e un ambiente collaborativo.

In Microsoft Fabric sono disponibili due strumenti principali: l'integrazione git e le pipeline di distribuzione. In questo modo è possibile gestire le risorse dell'area di lavoro e aggiornarle in base alle esigenze.

Con l'integrazione git e le pipeline di distribuzione, è possibile connettere i propri repository Git in Azure DevOps o GitHub e usare gli strumenti di distribuzione predefiniti di Fabric. In questo modo è facile configurare flussi di lavoro CI/CD uniformi, in modo da poter compilare, testare e distribuire i progetti di dati con sicurezza.

Inoltre, con il supporto della libreria di variabili, è possibile parametrizzare le connessioni nel processo di copia. Questa potente funzionalità semplifica CI/CD esternalizzando i valori di connessione, consentendo di distribuire lo stesso processo di copia in più ambienti, mentre la libreria variabili inserisce la connessione corretta per ogni fase.

Integrazione git per il processo di copia

Seguire questa procedura per connettere il processo di copia in Data Factory a Git. In questo modo è possibile tenere traccia delle modifiche, collaborare con il team e mantenere al sicuro il lavoro:

  1. Prerequisiti
  2. Connettersi a un repository Git
  3. Connettersi a un'area di lavoro
  4. Eseguire il commit delle modifiche in Git

Prerequisiti per l'integrazione di Git

Passaggio 1: Connettersi a un repository Git

Per usare l'integrazione git con il processo di copia in Fabric, è prima necessario connettersi a un repository Git:

  1. Accedi a Fabric e vai all'area di lavoro che vuoi connettere a Git.

  2. Selezionare Impostazioni area di lavoro.

    Screenshot che mostra come selezionare Impostazioni dell'area di lavoro nell'interfaccia utente di Fabric.

  3. Selezionare Integrazione con Git.

  4. Scegliere il provider Git: Azure DevOps o GitHub. Se si sceglie GitHub, selezionare Aggiungi account per connettere l'account GitHub. Dopo aver eseguito l'accesso, selezionare Connetti in modo che Fabric possa accedere all'account GitHub.

    Screenshot che mostra dove aggiungere un account GitHub per un'integrazione Git dell'area di lavoro fabric.

Passaggio 2: Connettersi a un'area di lavoro

Dopo aver eseguito la connessione a un repository Git, è necessario connettersi all'area di lavoro.

  1. Nel menu a discesa immettere i dettagli relativi all'area di lavoro e al ramo da usare:

    • Per Azure DevOps:

      • Nome organizzazione
      • Nome progetto
      • Nome repository
      • Nome ramo
      • Nome cartella
    • Per GitHub:

      • URL del repository
      • Nome ramo
      • Nome cartella
  2. Selezionare Connettersi e sincronizzare.

  3. Dopo la connessione, selezionare Controllo del codice sorgente per informazioni sul ramo collegato, sullo stato di ogni elemento e sull'ultima sincronizzazione.

    Screenshot che mostra l'area di lavoro di Fabric con lo stato di Git e altri dettagli riportati per il lavoro di copia.

Passaggio 3: Eseguire il commit delle modifiche in Git

È possibile eseguire il commit delle modifiche in Git seguendo questa procedura:

  1. Passa all'area di lavoro.
  2. Selezionare l'icona Controllo del codice sorgente. Viene visualizzato un numero che mostra il numero di modifiche non ancora sottoposte a commit.
  3. Nel pannello di controllo Origine selezionare la scheda Modifiche . Viene visualizzato un elenco di tutti gli elementi modificati, insieme alle icone di stato.
  4. Scegli gli elementi da confermare. Per selezionare tutti gli elementi, selezionare la casella nella parte superiore.
  5. (Facoltativo) Aggiungi un commento di commit sulle modifiche.
  6. Selezionare Commit.

Dopo il commit, questi elementi scompaiono dall'elenco e l'area di lavoro punta al commit più recente.

Screenshot di un elemento del processo di copia il cui commit è stato completato.

Pipeline di distribuzione per Git

Seguire questa procedura per usare le pipeline di distribuzione Git con l'area di lavoro Fabric:

  1. Prerequisiti
  2. Creare una pipeline di distribuzione
  3. Assegnare un'area di lavoro alla pipeline di distribuzione
  4. Eseguire la distribuzione in una fase vuota
  5. Distribuire il contenuto da una fase a un'altra

Prerequisiti per le pipeline di distribuzione

Prima di iniziare, assicurarsi di configurare i prerequisiti seguenti:

Passaggio 1: Creare una pipeline di distribuzione

  1. Nel menu Aree di lavoro selezionare Pipeline di distribuzione.
  2. Quando viene visualizzata la finestra Crea pipeline di distribuzione , immettere un nome e una descrizione per la pipeline, quindi selezionare Avanti.
  3. Scegliere il numero di fasi desiderate nella pipeline. Per impostazione predefinita, vengono visualizzate tre fasi: Sviluppo, Test e Produzione.

Passaggio 3: Assegnare un'area di lavoro alla pipeline di distribuzione

Dopo aver creato una pipeline, è necessario aggiungere contenuto da gestire alla pipeline. L'aggiunta di contenuto alla pipeline viene eseguita assegnando un'area di lavoro a qualsiasi fase della pipeline:

  1. Aprire la pipeline di distribuzione.

  2. Nella fase a cui si vuole assegnare un'area di lavoro espandere l'elenco a discesa intitolato Aggiungi contenuto a questa fase.

  3. Selezionare l'area di lavoro da assegnare a questa fase.

    Una screenshot che mostra il menu a discesa Assegna area di lavoro in una fase vuota delle pipeline di distribuzione nella nuova interfaccia utente.

  4. Selezionare Assegna.

Eseguire la distribuzione in una fase vuota

Quando si è pronti per spostare il contenuto da una fase della pipeline alla successiva, è possibile distribuirlo usando una di queste opzioni:

  • Distribuzione completa: selezionare questa opzione per distribuire tutti gli elementi nella fase corrente alla fase successiva.
  • Distribuzione selettiva: selezionare solo gli elementi da distribuire.
  • Distribuzione all'indietro: spostare il contenuto da una fase successiva a una fase precedente. Questa operazione può essere eseguita solo se la fase di destinazione è vuota (nessuna area di lavoro assegnata).

Dopo aver scelto l'opzione di distribuzione, è possibile esaminare i dettagli e lasciare una nota sulla distribuzione se si vuole.

Distribuire il contenuto da una fase all'altra

  1. Quando è presente contenuto in una fase della pipeline, è possibile distribuirlo alla fase successiva anche se l'area di lavoro della fase successiva ha del contenuto. Gli elementi associati vengono sovrascritti. Per altre informazioni su questo processo, vedere l'articolo Distribuire contenuto in un'area di lavoro esistente

  2. È anche possibile esaminare la cronologia di distribuzione per visualizzare l'ultima distribuzione del contenuto in ogni fase. Per esaminare le differenze tra le due pipeline prima della distribuzione, vedere Confrontare il contenuto in diverse fasi di distribuzione.

    Screenshot della pipeline di distribuzione per l'attività di copia.

Parametrizzazione della connessione con libreria di variabili per il processo di copia

È possibile eseguire le operazioni seguenti per parametrizzare le connessioni in Copia processo tramite libreria di variabili. Altre informazioni sulla libreria di variabili.

Passaggio 1: Creare una libreria di variabili

  1. Selezionare + Nuovo elemento in Fabric per creare una libreria di variabili.

  2. Quando si apre la finestra Nuova libreria di variabili , immettere un nome per la libreria di variabili e quindi selezionare Crea.

  3. Selezionare + Nuova variabile per creare nuove variabili per le connessioni di origine e di destinazione.

  4. Aggiungere i diversi ID di connessione come set di valori alle variabili per i vari ambienti, come sviluppo, test e produzione. È possibile cercare l'ID per la connessione da Impostazioni | Gestire connessioni e gateway. È possibile trovare l'ID per la connessione facendo clic su Impostazioni accanto al nome della connessione.

    Screenshot della creazione di una libreria di variabili per il processo di copia.

Passaggio 2: Usare la libreria di variabili nel processo di copia

  1. Aprire il processo di copia.

  2. Passare alle connessioni di origine e di destinazione e collegarle alla libreria di variabili creata.

    Screenshot della selezione della libreria di variabili per l'attività di copia.

Passaggio 3: Attivare valori di connessione diversi in ogni area di lavoro

Dopo aver distribuito l'attività di copia dall'area di lavoro di sviluppo all'ambiente di test o di produzione, è possibile attivare un ID di connessione diverso selezionando l'insieme di valori appropriato per ogni area di lavoro.

  1. Passare all'area di lavoro di destinazione e aprire la libreria delle variabili.

  2. Attivare l'ID di connessione corrispondente per l'area di lavoro nella libreria Variabili.

    Screenshot della configurazione della libreria di variabili per l'operazione di copia.

Limitazioni note

Ecco alcune delle limitazioni correnti quando si usa CI/CD per il processo di copia in Data Factory in Microsoft Fabric:

  • Variabili dell'area di lavoro: CI/CD attualmente non supporta le variabili dell'area di lavoro.
  • Supporto limitato per l'integrazione git: Attualmente Fabric supporta solo l'integrazione git con Azure DevOps e GitHub. L'integrazione git di Azure DevOps è consigliata perché l'integrazione git di GitHub presenta più limitazioni.