Configurer OpenSharing pour votre compte (pour les fournisseurs)

Cette page explique comment configurer OpenSharing sur Azure Databricks pour les fournisseurs de données (organisations qui souhaitent utiliser OpenSharing pour partager des données en toute sécurité).

Si vous êtes un destinataire de données (une organisation qui reçoit des données partagées à l’aide d’OpenSharing), consultez Lire les données partagées à l’aide de Databricks-to-Databricks OpenSharing (pour les destinataires).

Importante

OpenSharing nécessite un espace de travail compatible avec le catalogue Unity. Vous pouvez créer un espace de travail avec Unity Catalog pour la gestion des partages. Dans certains comptes, de nouveaux espaces de travail sont activés automatiquement pour Unity Catalog. Consultez Bien démarrer avec Unity Catalog.

Si la création d’un espace de travail compatible catalogue Unity n’est pas une option, vous pouvez utiliser le projet OpenSharing open source pour déployer votre propre serveur OpenSharing pour partager des tables Delta à partir de n’importe quelle plateforme.

La configuration initiale du fournisseur comprend les étapes suivantes :

  1. Activez OpenSharing sur un metastore de catalogue Unity.
  2. (Facultatif) Installer l’interface CLI de Unity Catalog.
  3. Accordez des privilèges pour créer et gérer des partages et des destinataires.
  4. Configurez la durée de vie (TTL) de la matérialisation des données.
  5. Configurer l’accès réseau de stockage.

Exigences

En tant que fournisseur de données qui configure votre compte Azure Databricks pour pouvoir partager des données, vous devez avoir :

Activer OpenSharing sur un metastore

Vous n’avez pas besoin d’activer OpenSharing sur votre metastore si vous envisagez d’utiliser OpenSharing uniquement pour partager des données avec des utilisateurs sur d’autres metastores du catalogue Unity dans votre compte. Le partage metastore-à-metastore au sein d’un compte Azure Databricks unique est activé par défaut.

Dans le cas contraire, suivez ces étapes pour chaque metastore du catalogue Unity qui gère les données que vous envisagez de partager à l’aide d’OpenSharing.

  1. En tant qu’administrateur de compte Azure Databricks, connectez-vous à la console de compte.

  2. Dans la barre latérale, cliquez sur l’icône Données.Catalogue.

  3. Cliquez sur le nom d’un metastore pour ouvrir ses détails.

  4. Cliquez sur la case à cocher en regard de l’option Autoriser le partage openSharing avec des parties extérieures à votre organisation.

  5. Configurez la durée de vie du jeton du destinataire.

    Cette configuration définit la période de temps après laquelle tous les jetons de destinataire expirent et doivent être régénérés. Les jetons destinataire sont utilisés uniquement dans le protocole Databricks-to-Open sharing. Les jetons sont valides pendant un maximum d’un an après la création.

    Note

    La durée de vie du jeton de destinataire pour les destinataires existants n’est pas automatiquement mise à jour lorsque vous modifiez la durée de vie du destinataire par défaut pour un metastore. Pour appliquer une nouvelle durée de vie de jeton à un destinataire donné, vous devez faire pivoter son jeton. Consultez Gérer les jetons de destinataire.

    Pour configurer la durée de vie du jeton de destinataire par défaut :

    1. Vérifiez que Définir l’expiration est activé (il s’agit de la valeur par défaut).
    2. Entrez un nombre de secondes, de minutes, d’heures ou de jours, puis sélectionnez l’unité de mesure. Les jetons sont valides pendant un maximum d’un an après la création.
    3. Cliquez sur Activer.

    Pour plus d’informations, consultez Considérations relatives à la sécurité pour les jetons.

  6. Lorsque vous partagez avec un destinataire Azure Databricks qui n’est pas dans votre compte, entrez un nom d’organisation.

    Note

    La spécification d’un nom d’organisation lisible permet aux destinataires d’identifier leurs fournisseurs de partage et les objets fournisseurs correspondants dans la liste des fournisseurs du destinataire.

  7. Cliquez sur Activer.

(Facultatif) Installer l’interface CLI de Unity Catalog

Pour gérer les partages et les destinataires, vous pouvez utiliser Catalog Explorer, les commandes SQL ou l’interface CLI de Unity Catalog. L’interface CLI s’exécute dans votre environnement local et ne nécessite pas de ressources de calcul Azure Databricks.

Pour installer la CLI, consultez la CLI Databricks.

Accorder l’autorisation de créer et de gérer des partages et des destinataires

Les administrateurs de metastore ont la possibilité de créer et de gérer des partages et des destinataires, y compris l’octroi de partages aux destinataires. De nombreuses tâches de fournisseur peuvent être déléguées par un administrateur de metastore à l’aide des privilèges suivants :

  • CREATE SHARE sur le metastore accorde la possibilité de créer des partages.
  • CREATE RECIPIENT sur le metastore permet de créer des destinataires.
  • USE RECIPIENT accorde la possibilité de répertorier et d’afficher les détails de tous les destinataires dans le metastore.
  • USE SHARE sur le metastore accorde la possibilité de répertorier et d’afficher les détails de tous les partages dans le metastore.
  • USE RECIPIENT, USE SHARE, et SET SHARE PERMISSION combinés donnent à un utilisateur la possibilité d’accorder l’accès au partage aux destinataires.
  • L’administrateur du metastore a la possibilité de transférer la propriété de n’importe quel partage de données.
  • Les propriétaires de partages et de destinataires peuvent mettre à jour ces objets et accorder des partages aux destinataires. Les créateurs d’objets se voient accorder la propriété par défaut, mais la propriété peut être transférée.
  • Les propriétaires de parts peuvent ajouter des tables et des volumes aux parts, tant qu’ils ont un accès SELECT aux tables et un accès READ VOLUME aux volumes.

Pour plus d’informations, consultez la référence des privilèges d’Unity Catalog et les autorisations répertoriées pour les tâches OpenSharing décrites.

Configurer la durée de vie de matérialisation des données.

En tant que compte Azure Databricks ou administrateur de metastore, vous pouvez configurer la durée de vie de la matérialisation des données, qui détermine la durée de mise en cache d’un résultat matérialisé. Les matérialisations se produisent lorsqu’un destinataire interroge des vues dynamiques partagées, des vues matérialisées, des tables de diffusion en continu et des tables étrangères. Par défaut, la durée de vie est de huit heures. Le cache lui-même sera vidé par la matérialisation au bout de trois heures supplémentaires, ce qui laissera un délai supplémentaire aux requêtes en cours pour s'exécuter jusqu'au bout.

Pour modifier cette valeur, procédez comme suit :

  1. Dans votre espace de travail Azure Databricks, cliquez sur l’icône Données.Catalogue pour ouvrir l’Explorateur de catalogues.

  2. En haut du volet Catalogue, cliquez sur l’icône d’engrenage, puis sélectionnez OpenSharing.

    Sinon, dans le coin supérieur droit, cliquez sur Partager openSharing>.

  3. Sous l’onglet Partagé avec moi , cliquez sur le nom de votre organisation dans le coin supérieur droit.

  4. Cliquez sur l’icône d’engrenage en haut à droite. Icône d’engrenage.

  5. Pour la durée de vie de matérialisation, saisissez la valeur de durée de vie que vous souhaitez.

Autoriser l’accès réseau au stockage

Si votre stockage cloud sous-jacent est configuré avec des contrôles d’accès, ajoutez le réseau de votre destinataire à la liste verte pour qu’il puisse lire les tables partagées.

Tip

Au lieu de configurer manuellement des règles de mise en réseau et de pare-feu pour chaque destinataire, utilisez SecureConnect pour répartiter l’accès via un proxy managé.

Pour plus d’informations, consultez Configurer stockage Azure pare-feu et réseaux virtuels et configurer un périmètre de sécurité réseau (NSP) Azure pour les ressources Azure.

Étapes suivantes