Impostazioni delle funzionalità del driver per il driver JDBC di Databricks (Simba)

Annotazioni

Questa pagina si applica alle versioni di Simba JDBC Driver (Legacy), precedenti alla versione 3. Databricks consiglia vivamente di eseguire la migrazione al driver JDBC di Databricks per la connettività JDBC . Include miglioramenti, ad esempio il supporto per le visualizzazioni delle metriche del catalogo Unity, le transazioni che si estendono su più istruzioni SQL, stored procedure, recupero di risultati di grandi dimensioni e dati di telemetria client predefiniti.

Questa pagina descrive come configurare impostazioni speciali e avanzate delle funzionalità del driver per il driver JDBC di Databricks.

Il driver JDBC di Databricks offre le impostazioni speciali e avanzate seguenti per le funzionalità del driver.

Supporto delle interrogazioni ANSI SQL-92 in JDBC

I driver JDBC Spark legacy accettano query SQL in dialetto ANSI SQL-92 e le traducono in Databricks SQL prima di inviarle al server.

Se l'applicazione genera direttamente Databricks SQL o usa una sintassi sql-92 non ANSI specifica per Azure Databricks, impostare UseNativeQuery=1 nella configurazione della connessione. Questa impostazione passa le query SQL verbatim a Azure Databricks senza traduzione.

Catalogo e schema predefiniti

Per specificare il catalogo e lo schema predefiniti, aggiungere ConnCatalog=<catalog-name>;ConnSchema=<schema-name> all'URL di connessione JDBC.

Tag di ricerca per monitoraggio

Importante

Questa funzionalità si trova in anteprima privata. Per richiedere l'accesso, contattare il team di account.

Allegare tag chiave-valore alle query SQL per scopi di rilevamento e analisi. I tag di query vengono visualizzati nella system.query.history tabella per l'identificazione e l'analisi delle query.

Per aggiungere etichette di query alla connessione, includere il parametro ssp_query_tags nell'URL di connessione JDBC:

jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2

Definire i tag di query come coppie chiave-valore delimitate da virgole, in cui ogni chiave e valore è separato da due punti. Ad esempio: key1:value1,key2:value2.

Estrarre risultati di query di grandi dimensioni in JDBC

Per ottenere prestazioni ottimali quando si estraggono risultati di query di grandi dimensioni, usare la versione più recente del driver JDBC, che include le ottimizzazioni seguenti.

Serializzazione freccia in JDBC

Il driver JDBC versione 2.6.16 e successive supporta un formato di serializzazione dei risultati delle query ottimizzato che usa Apache Arrow.

Recupero dati dal cloud in JDBC

Il driver JDBC versione 2.6.19 e successive supporta Cloud Fetch, una funzionalità che recupera i risultati delle query tramite l'archiviazione cloud configurata nella distribuzione Azure Databricks.

Quando si esegue una query, Azure Databricks archivia i risultati nell'archiviazione cloud dell'area di lavoro come file serializzati con freccia fino a 20 MB. Al termine della query, il driver invia richieste di recupero e Azure Databricks restituisce URL della firma di accesso condiviso ai file di risultato. Il driver usa quindi questi URL per scaricare i risultati direttamente dalla risorsa di archiviazione Azure.

Il recupero cloud si applica solo ai risultati delle query superiori a 1 MB. Il driver recupera risultati più piccoli direttamente da Azure Databricks.

Azure Databricks garbage collect raccoglie automaticamente i file accumulati contrassegnandoli per l'eliminazione dopo 24 ore e rimuovendoli definitivamente 24 ore dopo.

Prerequisiti di rete

Se la rete è privata, è necessario configurare le impostazioni seguenti per il funzionamento di Cloud Fetch:

Consentire *.blob.core.windows.net e *.store.core.windows.net nell'ambiente di rete.
Aggiungere i download e le revoche di certificati necessari all'elenco elementi consentiti.
Se il supporto del firewall è abilitato nell'account di archiviazione dell'area di lavoro Azure Databricks, configurare un gateway dati di rete virtuale o un gateway dati on-premises per consentire l'accesso privato all'account di archiviazione.

Per disabilitare Cloud Fetch, impostare EnableQueryResultDownload=0 nella configurazione della connessione.

Diagnosticare i download lenti

Impostare LogLevel su 4 (INFO) e LogPath sul percorso completo di una cartella di log per visualizzare le metriche di velocità di download di Recupero cloud. Il driver registra la velocità di download per blocco, quindi set di risultati di grandi dimensioni generano più righe di log. Il driver registra anche un avviso quando la velocità scende al di sotto di circa 1 MB/s. Questa funzionalità è disponibile nelle versioni del driver JDBC (Simba) rilasciate dopo dicembre 2025.

Se i download sono lenti o bloccati, i token di firma di accesso condiviso possono scadere prima che il driver termini il download di tutti i file di risultato. Verificare la limitazione della larghezza di banda o la congestione della rete tra il client e Archiviazione BLOB di Azure.

Abilitazione della registrazione

Per abilitare la registrazione nel driver JDBC, impostare la LogLevel proprietà su un valore compreso tra 1 (solo eventi gravi) e 6 (tutte le attività del driver). Impostare la LogPath proprietà sul percorso completo della cartella in cui si desidera salvare i file di log.

Per altre informazioni, vedere Configuring Logging in the Databricks JDBC Driver Guide (Configurazione della registrazione in Databricks JDBC Driver Guide).

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-05-03