Creare destinatari dei dati per Delta Sharing (condivisione da Databricks a Databricks)

Questa pagina illustra come creare destinatari in Condivisione delta quando i destinatari si trovano in un'area di lavoro di Databricks abilitata per Unity Catalog. Per visualizzare, aggiornare, eliminare, concedere l'accesso alla condivisione, gestire le proprietà o limitare l'accesso con liste IP per un destinatario esistente, consulta Gestire i destinatari di dati per Delta Sharing.

Un destinatario è l'oggetto denominato che rappresenta l'identità di un utente o di un gruppo di utenti che utilizzano dati condivisi. La modalità di creazione dei destinatari varia a seconda che il destinatario abbia o meno accesso a un'area di lavoro di Databricks abilitata per Unity Catalog:

Per ulteriori informazioni su queste due modalità di condivisione e su quando scegliere quale, consultare Condivisione aperta rispetto a condivisione Databricks-a-Databricks.

Requisiti

Per creare un destinatario:

  • È necessario avere il CREATE RECIPIENT privilegio per il metastore del catalogo Unity in cui sono registrati i dati da condividere.
  • È necessario creare il destinatario usando un'area di lavoro di Azure Databricks con il metastore di Unity Catalog collegato.
  • Se si usa un notebook di Databricks per creare il destinatario, il calcolo deve usare Databricks Runtime 11.3 LTS o versione successiva e la modalità di accesso standard o dedicata (in precedenza modalità di accesso condiviso e singolo utente).

Per le autorizzazioni richieste per altre operazioni sui destinatari (visualizzare, aggiornare, eliminare, concedere l'accesso alla condivisione, gestire le proprietà), vedi Gestire i destinatari dei dati per Delta Sharing.

Creare un oggetto destinatario per gli utenti che hanno accesso a Databricks (condivisione da Databricks a Databricks)

Se il destinatario dei dati ha accesso a un'area di lavoro di Databricks abilitata per Unity Catalog, è possibile creare un oggetto destinatario con un tipo di autenticazione DATABRICKS.

Un oggetto destinatario con il tipo di autenticazione di DATABRICKS rappresenta un destinatario di dati in un particolare metastore del catalogo Unity, identificato nella definizione dell'oggetto destinatario da una stringa di identificatore di condivisione costituita dal cloud, dall'area e dall'UUID del metastore. È possibile accedere ai dati condivisi con questo destinatario solo in tale metastore.

Passaggio 1: Richiedere l'identificatore di condivisione del destinatario

Chiedere a un utente destinatario di inviare l'identificatore di condivisione per il metastore del catalogo Unity collegato alle aree di lavoro in cui l'utente o il gruppo di utenti destinatario funzionerà con i dati condivisi.

L'identificatore di condivisione è una stringa costituita dal cloud, dall'area e dall'UUID del metastore (identificatore univoco per il metastore), nel formato <cloud>:<region>:<uuid>.

Nello screenshot seguente, ad esempio, la stringa dell'identificatore di condivisione completa è aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

esempio di CURRENT_METASTORE

Il destinatario può trovare l'identificatore usando Esplora cataloghi, l'interfaccia della riga di comando di Databricks Unity Catalog o la funzione SQL predefinita CURRENT_METASTORE in un notebook di Databricks o una query SQL di Databricks eseguita in un ambiente di calcolo compatibile con Unity-Catalog nell'area di lavoro che intende usare.

Esploratore di cataloghi

Per ottenere l'identificatore di condivisione tramite Esplora cataloghi:

  1. Nell'area di lavoro di Azure Databricks fare clic sull'icona Dati.Catalogo.

  2. Nella parte superiore del riquadro Catalogo, fare clic su sull'icona a forma di ingranaggio. e selezionare Delta Sharing.

    In alternativa, nell'angolo superiore destro, fare clic su Delta Sharing > Condividi.

  3. Nella scheda Condivisi con me, fare clic sul nome dell'organizzazione di condivisione Databricks in alto a destra e selezionare Copia identificatore di condivisione.

SQL

Eseguire il comando seguente in un notebook o nell'editor di query SQL di Databricks:

SELECT CURRENT_METASTORE();

Interfaccia a riga di comando (CLI)

Eseguire il comando seguente usando la CLI di Databricks. L'identificatore di condivisione viene restituito come global_metastore_id.

databricks metastores summary

È possibile inviare al destinatario le informazioni contenute in questo passaggio oppure indirizzarli a Ottenere l'accesso nel modello Databricks-a-Databricks.

Passaggio 2: Creare il destinatario

Per creare un destinatario per la condivisione Databricks-to-Databricks, è possibile usare Catalog Explorer, il CLI di Databricks Unity Catalog o il CREATE RECIPIENT comando SQL in un notebook di Azure Databricks o nell'editor di query SQL di Databricks.

Autorizzazioni necessarie: amministratore o utente metastore con il privilegio per il CREATE RECIPIENT metastore di Unity Catalog in cui sono registrati i dati da condividere.

Esploratore di cataloghi

  1. Nell'area di lavoro di Azure Databricks fare clic sull'icona Dati.Catalogo.

  2. Nella parte superiore del riquadro Catalogo, fare clic su sull'icona a forma di ingranaggio. e selezionare Delta Sharing.

    In alternativa, nell'angolo superiore destro, fare clic su Delta Sharing > Condividi.

  3. Nella scheda Condivisi da me fare clic su Nuovo destinatario.

  4. Immettere il nome del destinatario .

  5. Per Tipo di destinatario, selezionare Databricks.

  6. Immettere l'identificatore di condivisione del destinatario.

    Usare l'intera stringa di identificatore di condivisione nel formato <cloud>:<region>:<uuid>. Ad esempio: aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

  7. (Facoltativo) Immettere un commento.

  8. Cliccare su Crea.

  9. (Facoltativo) Creare proprietà del destinatario personalizzate.

    Nella scheda Panoramica del destinatario, fare clic sull'icona di modifica Icona Modifica accanto a Proprietà del destinatario. Aggiungere quindi un nome di proprietà (chiave) e un valore. Per informazioni dettagliate, vedere Gestire le proprietà dei destinatari.

SQL

Eseguire il comando seguente in un notebook o nell'editor di query SQL di Databricks:

CREATE RECIPIENT [IF NOT EXISTS] <recipient-name>
USING ID '<sharing-identifier>'
[COMMENT "<comment>"];

Usare l'intera stringa di identificatore di condivisione nel formato <cloud>:<region>:<uuid>. Ad esempio: aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.

È anche possibile aggiungere proprietà personalizzate per il destinatario. Per informazioni dettagliate, vedere Gestire le proprietà dei destinatari.

Interfaccia a riga di comando (CLI)

Eseguire il comando seguente usando la CLI di Databricks. Sostituire i valori dei segnaposto.

  • <recipient-name>: nome del destinatario.
  • <sharing-identifier>: l'intera stringa di identificatore di condivisione nel formato <cloud>:<region>:<uuid>. Ad esempio: aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.
  • <authentication-type>: impostato su DATABRICKS quando viene fornita una stringa di identificatore di condivisione nel formato <cloud>:<region>:<uuid> per <sharing-identifier>.
databricks recipients create <recipient-name> <authentication-type> --sharing-code <sharing-identifier>

È anche possibile aggiungere proprietà personalizzate per il destinatario. Per informazioni dettagliate, vedere Gestire le proprietà dei destinatari.

Il destinatario viene creato con authentication_type di DATABRICKS.

Passaggi successivi