Créer des destinataires de données pour OpenSharing (partage Databricks-to-Databricks)

Cette page explique comment créer des destinataires dans OpenSharing lorsque les destinataires se trouvent sur un espace de travail Databricks activé pour le catalogue Unity. Pour afficher, mettre à jour, supprimer, accorder l’accès au partage, gérer les propriétés ou restreindre l’accès avec des listes IP pour un destinataire existant, consultez Gérer les destinataires de données pour OpenSharing.

Un destinataire est l’objet nommé qui représente l’identité d’un utilisateur ou d’un groupe d’utilisateurs qui consomment des données partagées. La façon dont vous créez des destinataires diffère selon que votre destinataire a ou non accès à un espace de travail Databricks activé pour le catalogue Unity :

Pour plus d’informations sur ces deux modes de partage et dans quels cas choisir l’un ou l’autre, consultez Partage Databricks vers Open ou partage Databricks vers Databricks.

Exigences

Pour créer un destinataire :

  • Vous devez disposer du privilège CREATE RECIPIENT pour le metastore Unity Catalog où les données que vous souhaitez partager sont enregistrées.
  • Vous devez créer le destinataire à l’aide d’un espace de travail Azure Databricks dont le metastore Unity Catalog est attaché.
  • Si vous utilisez un notebook Databricks pour créer le destinataire, votre calcul doit utiliser Databricks Runtime 11.3 LTS ou version ultérieure, et soit le mode d’accès standard ou dédié (anciennement les modes d’accès partagé et mono-utilisateur).

Pour obtenir les autorisations requises pour d’autres opérations de destinataire (affichage, mise à jour, suppression, octroi d’accès au partage, gestion des propriétés), consultez Gérer les destinataires des données pour OpenSharing.

Créer un objet destinataire pour les utilisateurs qui ont accès à Databricks (partage Databricks à Databricks)

Si votre destinataire de données a accès à un espace de travail Databricks activé pour Unity Catalog, vous pouvez créer un objet destinataire avec un type d’authentification .DATABRICKS

Un objet destinataire avec le type d'authentification de DATABRICKS représente un destinataire de données sur un metastore particulier de Unity Catalog, identifié dans la définition de l'objet destinataire par une chaîne d’identification de partage sharing identifier composée du cloud, de la région et de l’UUID du metastore. Les données partagées avec ce destinataire ne sont accessibles que sur ce metastore.

Étape 1 : Demander l’identificateur de partage du destinataire

Demandez à un utilisateur destinataire de vous envoyer l’identificateur de partage pour le metastore Unity Catalog attaché aux espaces de travail où l’utilisateur ou le groupe d’utilisateurs destinataire fonctionnera avec les données partagées.

L’identificateur de partage est une chaîne composée du cloud, de la région et de l’UUID du metastore (identificateur unique pour le metastore), au format <cloud>:<region>:<uuid>.

Par exemple, dans la capture d’écran suivante, la chaîne d’identificateur de partage complète est aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

exemple de CURRENT_METASTORE

Le destinataire peut trouver l’identificateur à l’aide de l’Explorateur de catalogues, de l’interface CLI de catalogue Databricks Unity ou de la fonction CURRENT_METASTORE SQL par défaut dans un notebook Databricks ou une requête Databricks SQL qui s’exécute sur un calcul compatible avec Unity-Catalog dans l’espace de travail qu’ils ont l’intention d’utiliser.

Explorateur de catalogues

Pour obtenir l'identifiant de partage à l'aide de l'Explorateur de catalogue :

  1. Dans votre espace de travail Azure Databricks, cliquez sur l’icône Données.Catalogue.

  2. En haut du volet Catalogue, cliquez sur l’icône d’engrenage, puis sélectionnez OpenSharing.

    Sinon, dans le coin supérieur droit, cliquez sur Partager openSharing>.

  3. Sous l’onglet Partagés avec moi, cliquez sur le nom de votre organisation de partage Databricks en haut à droite, puis sélectionnez Copier l’identificateur de partage.

SQL

Exécutez la commande suivante dans un notebook ou dans l’éditeur de requête Databricks SQL :

SELECT CURRENT_METASTORE();

Interface de ligne de commande (CLI)

Exécutez la commande suivante dans l’interface CLI Databricks. L’identificateur de partage est retourné en tant que global_metastore_id.

databricks metastores summary

Vous pouvez envoyer à votre destinataire les informations contenues dans cette étape, ou vous pouvez les pointer vers Obtenir l’accès dans le modèle Databricks-to-Databricks.

Étape 2 : créer le destinataire

Pour créer un destinataire pour le partage Databricks à Databricks, vous pouvez utiliser Catalog Explorer, l’interface CLI Databricks Unity Catalog ou la commande SQL CREATE RECIPIENT dans un notebook Azure Databricks ou l’éditeur de requête Databricks SQL.

Autorisations requises : administrateur de metastore ou utilisateur disposant du CREATE RECIPIENT privilège pour le metastore du catalogue Unity où les données que vous souhaitez partager sont inscrites.

Explorateur de catalogues

  1. Dans votre espace de travail Azure Databricks, cliquez sur l’icône Données.Catalogue.

  2. En haut du volet Catalogue, cliquez sur l’icône d’engrenage, puis sélectionnez OpenSharing.

    Sinon, dans le coin supérieur droit, cliquez sur Partager openSharing>.

  3. Sous l’onglet Partagé par moi, cliquez sur Nouveau destinataire.

  4. Entrez le nom du destinataire.

  5. Pour Type de destinataire, sélectionnez Databricks.

  6. Entrez l’identificateur de partage du destinataire.

    Utilisez la chaîne d’identificateur de partage entière au format <cloud>:<region>:<uuid>. Par exemple : aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

  7. (Facultatif) Entrez un commentaire.

  8. Cliquez sur Créer.

  9. (Facultatif) Créez des propriétés de destinataire personnalisées.

    Sous l’onglet Vue d’ensemble du destinataire, cliquez sur l'icône de modification en regard des propriétés du destinataire. Ajoutez ensuite un nom de propriété (Clé) et une Valeur. Pour plus d’informations, consultez Gérer les propriétés du destinataire.

SQL

Exécutez la commande suivante dans un notebook ou dans l’éditeur de requête Databricks SQL :

CREATE RECIPIENT [IF NOT EXISTS] <recipient-name>
USING ID '<sharing-identifier>'
[COMMENT "<comment>"];

Utilisez la chaîne d’identificateur de partage entière au format <cloud>:<region>:<uuid>. Par exemple : aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.

Vous pouvez également ajouter des propriétés personnalisées pour le destinataire. Pour plus d’informations, consultez Gérer les propriétés du destinataire.

Interface de ligne de commande (CLI)

Exécutez la commande suivante dans l’interface CLI Databricks. Remplacez les valeurs d’espace réservé :

  • <recipient-name> : nom du destinataire.
  • <sharing-identifier>: chaîne d’identificateur de partage entière au format <cloud>:<region>:<uuid>. Par exemple : aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.
  • <authentication-type>: défini sur DATABRICKS lorsqu’une chaîne d’identificateur de partage est fournie au format <cloud>:<region>:<uuid> pour <sharing-identifier>.
databricks recipients create <recipient-name> <authentication-type> --sharing-code <sharing-identifier>

Vous pouvez également ajouter des propriétés personnalisées pour le destinataire. Pour plus d’informations, consultez Gérer les propriétés du destinataire.

Le destinataire est créé avec le authentication_type de DATABRICKS.

Ressources supplémentaires