Creación de destinatarios de datos para el uso compartido de Delta (uso compartido de Databricks a Databricks)

En esta página se explica cómo crear destinatarios en Delta Sharing, cuando los destinatarios están en un área de trabajo de Databricks habilitada para el catálogo de Unity. Para ver, actualizar, eliminar, conceder acceso a elementos compartidos, administrar propiedades o restringir el acceso con listas de IP para un destinatario existente, consulte Administrar destinatarios de datos para Delta Sharing.

Un destinatario es el objeto con nombre que representa la identidad de un usuario o grupo de usuarios que consumen datos compartidos. La forma de crear destinatarios difiere en función de si el destinatario tiene acceso a un área de trabajo de Databricks habilitada para el catálogo de Unity:

Para obtener más información sobre estos dos modos de uso compartido y cuándo elegir uno u otro, consulte Uso compartido abierto frente a uso compartido de Databricks a Databricks.

Requisitos

Para crear un destinatario:

  • Debe tener el CREATE RECIPIENT privilegio para el metastore del catálogo de Unity donde se registran los datos que desea compartir.
  • Es necesario crear el destinatario mediante un área de trabajo de Azure Databricks que tenga asociado ese metastore de Unity Catalog.
  • Si usa un cuaderno de Databricks para crear el destinatario, su computación debe usar Databricks Runtime 11.3 LTS o superior y el modo de acceso estándar o dedicado (anteriormente modos de acceso compartido y de usuario único).

Para obtener los permisos necesarios para otras operaciones de destinatarios (ver, actualizar, eliminar, conceder acceso a recursos compartidos, administrar propiedades), consulte Administrar destinatarios de datos para el uso compartido delta.

Crear un objeto de destinatario para los usuarios que tienen acceso a Databricks (uso compartido de Databricks a Databricks)

Si su destinatario de datos tiene acceso a un área de trabajo de Databricks que ha sido habilitada para Unity Catalog, puede crear un objeto de destinatario con un tipo de autenticación de DATABRICKS.

Un objeto de destinatario con un tipo de autenticación de DATABRICKS representa un receptor de datos en un metastore determinado del Catálogo de Unity, identificado en la definición del objeto destinatario por una cadena de identificador de uso compartido que consta de la nube, la región y el UUID del metastore. Solo se puede acceder a los datos compartidos con este destinatario en ese metastore.

Paso 1: Solicitar el identificador de uso compartido del destinatario

Pida a un usuario destinatario que le envíe el identificador de uso compartido del metastore de Unity Catalog que se adjunta a las áreas de trabajo en las que el usuario o grupo de usuarios destinatarios trabajarán con los datos compartidos.

El identificador de uso compartido es una cadena que consta de la nube, la región y el UUID de metastore (el identificador único de la metastore), con el formato <cloud>:<region>:<uuid>.

Por ejemplo, en la captura de pantalla siguiente, la cadena de identificador de uso compartido completa es aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

ejemplo de CURRENT_METASTORE

El destinatario puede encontrar el identificador mediante el Explorador de catálogos, la CLI del catálogo de Unity de Databricks o la función CURRENT_METASTORE SQL predeterminada en un cuaderno de Databricks o una consulta sql de Databricks que se ejecuta en un proceso compatible con Unity-Catalog en el área de trabajo que pretende usar.

Explorador de catálogo

Para obtener el identificador de uso compartido mediante Catalog Explorer:

  1. En el área de trabajo de Azure Databricks, haga clic en el icono Datos.Catálogo.

  2. En la parte superior del panel Catálogo, haga clic en el icono de engranaje y seleccione Delta Sharing.

    Como alternativa, en la esquina superior derecha, haga clic en Compartir > Delta Sharing.

  3. En la pestaña Compartidos conmigo, haga clic en el nombre de la organización de uso compartido de Databricks en la zona superior derecha y seleccione Copiar identificador de uso compartido.

SQL

Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:

SELECT CURRENT_METASTORE();

Interfaz de línea de comandos (CLI)

Ejecute el siguiente comando mediante la CLI de Databricks. El identificador de uso compartido se devuelve como global_metastore_id.

databricks metastores summary

Puede enviar la información contenida en este paso al destinatario o bien puede dirigirle a Obtener acceso en el modelo de Databricks a Databricks.

Paso 2: Creación del destinatario

Para crear un destinatario para el uso compartido de Databricks a Databricks, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando de SQL CREATE RECIPIENT en un cuaderno de Azure Databricks o en el editor de consultas de SQL de Databricks.

Permisos requeridos: Administrador del metastore o usuario con el privilegio de CREATE RECIPIENT para el metastore de Unity Catalog donde están registrados los datos que quiere compartir.

Explorador de catálogo

  1. En el área de trabajo de Azure Databricks, haga clic en el icono Datos.Catálogo.

  2. En la parte superior del panel Catálogo, haga clic en el icono de engranaje y seleccione Delta Sharing.

    Como alternativa, en la esquina superior derecha, haga clic en Compartir > Delta Sharing.

  3. En la pestaña Compartido por mí, haga clic en Nuevo destinatario.

  4. Escriba el nombre del destinatario.

  5. En Tipo de destinatario, seleccione Databricks.

  6. Escriba el identificador de uso compartido del destinatario.

    Use toda la cadena de identificador de uso compartido con el formato <cloud>:<region>:<uuid>. Por ejemplo, aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

  7. (Opcional) Escriba un comentario.

  8. Haga clic en Crear.

  9. (Opcional) Cree propiedades de Destinatario personalizadas.

    En la pestaña Información general del destinatario, haga clic en el icono Editar icono de edición situado junto a Propiedades del destinatario. A continuación, agregue un nombre de propiedad (Clave) y un Valor. Para obtener más información, consulte Administrar las propiedades del destinatario.

SQL

Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:

CREATE RECIPIENT [IF NOT EXISTS] <recipient-name>
USING ID '<sharing-identifier>'
[COMMENT "<comment>"];

Use toda la cadena de identificador de uso compartido con el formato <cloud>:<region>:<uuid>. Por ejemplo, aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.

También es posible agregar propiedades personalizadas para el destinatario. Para obtener más información, consulte Administrar las propiedades del destinatario.

Interfaz de línea de comandos (CLI)

Ejecute el siguiente comando mediante la CLI de Databricks. Reemplace los valores de marcador de posición:

  • <recipient-name>: el nombre del destinatario.
  • <sharing-identifier>: La cadena completa del identificador de uso compartido en el formato <cloud>:<region>:<uuid>. Por ejemplo, aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.
  • <authentication-type>: se establece en DATABRICKS cuando se proporciona una cadena de identificador de uso compartido en el formato <cloud>:<region>:<uuid> para <sharing-identifier>.
databricks recipients create <recipient-name> <authentication-type> --sharing-code <sharing-identifier>

También es posible agregar propiedades personalizadas para el destinatario. Para obtener más información, consulte Administrar las propiedades del destinatario.

El destinatario se crea con el authentication_type de DATABRICKS.

Pasos siguientes