Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questa pagina consente di comprendere il flusso di lavoro di inserimento di SQL Server, inclusi i fattori che determinano l'approccio alla configurazione e i passaggi necessari per utenti diversi.
CDC standard e CDC integrato
SQL Server supporta due architetture di inserimento. La tabella seguente li confronta:
| Feature | CDC standard (basato su gateway) | CDC integrato (beta) |
|---|---|---|
| Numero di pipeline | Due (gateway di inserimento e pipeline di inserimento) | Uno (pipeline unificata) |
| Configurazione | Creare un gateway, quindi creare una pipeline di inserimento che faccia riferimento all'ID gateway | Creare una singola pipeline che faccia riferimento a una connessione al catalogo Unity |
| La modalità gateway | Il gateway è in esecuzione continua | La pipeline integra l'estrazione in ogni aggiornamento |
| Informazioni di riferimento sulla connessione | ingestion_gateway_id |
connection_name (una connessione al catalogo Unity) |
| Tipo di connettore | Implicito | Esplicito: connector_type: CDC |
| Volume di gestione temporanea | Il gateway gestisce internamente il volume di staging | Si configura il volume di staging tramite data_staging_options. Se non specificato, la pipeline ne crea automaticamente uno. |
La stessa configurazione del database di origine si applica a entrambe le architetture. Vedere Configurare Microsoft SQL Server per l'inserimento in Azure Databricks. Per altre informazioni, vedere Creare una pipeline CDC integrata per SQL Server.
Disponibilità della funzionalità
| Feature | Availability |
|---|---|
| Creazione di pipeline basate sull'interfaccia utente |
|
| Creazione di pipeline basate su API |
|
| Pacchetti di automazione dichiarativa |
|
| Inserimento incrementale |
|
| Governance del catalogo Unity |
|
| Orchestrazione mediante job Lakeflow |
|
| SCD di tipo 2 |
|
| Selezione e deselezionazione delle colonne basate su API |
|
| Filtro delle righe basato su API |
|
| Evoluzione automatizzata dello schema: colonne nuove ed eliminate |
|
| Evoluzione automatizzata dello schema: modifiche al tipo di dati |
|
| Evoluzione automatizzata dello schema: ridenominazione delle colonne |
Richiede un aggiornamento completo. |
| Evoluzione automatizzata dello schema: nuove tabelle |
Se si ingerisce l'intero schema. Consulta le limitazioni relative al numero di tabelle per ciascuna pipeline. |
| Numero massimo di tabelle per pipeline | 250 |
Metodi di autenticazione
| Metodo di autenticazione | Availability |
|---|---|
| OAuth U2M |
|
| OAuth M2M |
|
| OAuth (token di aggiornamento manuale) |
|
| Autenticazione di base (nome utente/password) |
|
| Autenticazione di base (chiave API) |
|
| Autenticazione di base (chiave JSON dell'account del servizio) |
|
Cosa sapere prima di iniziare
| Argomento | Perché è importante |
|---|---|
| Persona utente di Azure Databricks | Il flusso di lavoro dipende dalla tipologia di utente di Azure Databricks:
|
| Variante del database | La configurazione del database di origine dipende dall'ambiente di distribuzione di SQL Server. |
| Metodo di rilevamento delle modifiche | La configurazione del database di origine dipende dal modo in cui si sceglie di tenere traccia delle modifiche nell'origine. |
| Metodo di autenticazione | I passaggi per creare una connessione dipendono dal metodo di autenticazione scelto. |
| Interfaccia | I passaggi per creare una connessione, un gateway e una pipeline dipendono dall'interfaccia . |
| Frequenza di ingestione | La pianificazione della pipeline dipende dai requisiti di latenza e di costi. |
| Modelli comuni | A seconda delle esigenze di inserimento, la pipeline potrebbe usare configurazioni come il rilevamento della cronologia, la selezione delle colonne e il filtro delle righe. Le configurazioni supportate variano in base al connettore. Vedere Disponibilità delle funzionalità. |
Iniziare l'acquisizione da SQL Server
La tabella seguente offre una panoramica del flusso di lavoro di inserimento end-to-end di SQL Server, in base al tipo di utente:
| User | Steps |
|---|---|
| Admin |
|
| Non amministratore | Usare qualsiasi interfaccia supportata per creare un gateway e una pipeline. Vedere Inserire dati da SQL Server. |