Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Cada objeto protegible que se registra en el catálogo de Unity se rige de forma centralizada. Esto significa que Unity Catalog administra los metadatos del objeto, lo que le permite controlar todos los aspectos de la gobernanza, incluido el acceso, la auditoría y el linaje.
Sin embargo, para recursos de datos como tablas y volúmenes, El catálogo de Unity también puede controlar la ubicación de almacenamiento y el ciclo de vida de los archivos de datos subyacentes de la cuenta de nube, lo que incluye cómo se organizan, optimizan y cuándo se eliminan. Esta distinción es lo que separa los recursos de datos externosadministrados.
- Recursos administrados: El catálogo de Unity controla tanto la gobernanza (control de acceso, auditoría, linaje) como el ciclo de vida de almacenamiento de archivos subyacente (optimización de archivos, cómo se organizan y cuándo se eliminan).
- Recursos externos: el catálogo de Unity solo controla la gobernanza. El ciclo de vida de almacenamiento de archivos subyacente se controla por usted o un sistema externo.
Al registrar un recurso administrado en el Catálogo de Unity, se conserva la propiedad total de los datos. Los archivos de datos siempre permanecen en su cuenta en la nube. El Catálogo de Unity determina dónde están almacenados dentro de su cuenta, pero no los transfiere a Azure Databricks o los posee.
La distinción entre gestionados y externos solo se aplica a tablas y volúmenes. Otros objetos protegibles del catálogo de Unity, como vistas, modelos y funciones, no tienen variantes administradas y externas.
Resumen de diferencias
En la tabla siguiente se resumen las diferencias entre los recursos administrados y externos en el catálogo de Unity:
| Propiedad | Volumen o tabla administrada del catálogo de Unity | Tabla o volumen externo |
|---|---|---|
| Ubicación de almacenamiento | Establecido por Unity Catalog (en tu cuenta en la nube) | Establecido por usted |
| Administración del ciclo de vida de los archivos | Administrado por unity Catalog (optimización, organización, eliminación) | Administrado por usted |
| Comportamiento al soltar | Los archivos de datos se eliminan permanentemente después de un período de retención de 8 días | Los archivos de datos permanecen en su lugar |
| Propiedad de los datos | Sí | Sí |
Usos de la palabra "administrar" en el catálogo de Unity
La palabra manage tiene varios usos en el catálogo de Unity. En esta sección se resume el significado de administrar en distintos contextos.
Cuando las personas dicen que un objeto está administrado por el Catálogo de Unity, normalmente significan que Unity Catalog rige el acceso a él. Esto se aplica a todos los objetos de catálogo de Unity registrados, incluidas las tablas y volúmenes externos.
La palabra administrada en "tabla administrada" o "volumen administrado" tiene un significado más específico: Unity Catalog determina dónde se almacenan los archivos de datos subyacentes de la cuenta en la nube y controla el ciclo de vida de los archivos (optimización, organización y eliminación). Esto se conoce como ubicación de almacenamiento administrado. Los datos permanecen en la cuenta en la nube en todo momento. Azure Databricks no posee ni contiene sus datos.
La palabra MANAGE también aparece como un privilegio que puede asignarse a objetos del Catálogo de Unity. Por lo general, MANAGE permite a un usuario asignar o revocar privilegios en, transferir la propiedad de y eliminar un objeto sin ser el propietario. Consulte ADMINISTRAR.
En la tabla siguiente se resumen estos usos comunes de administración:
| Término | Meaning | Se aplica a |
|---|---|---|
| Administrado por Unity Catalog | El Catálogo de Unity rige el acceso, la auditoría y el linaje del objeto. | Todos los objetos de catálogo de Unity registrados, incluidas tablas y volúmenes externos |
| Tabla administrada o volumen administrado | El catálogo de Unity también controla la ubicación de almacenamiento subyacente (ubicación de almacenamiento administrada) y el ciclo de vida de los datos dentro de la cuenta en la nube. | Solo tablas y volúmenes |
| Ubicación de almacenamiento administrado | Ruta de acceso designada dentro de la cuenta en la nube donde Unity Catalog almacena archivos de datos para tablas y volúmenes administrados. Puede configurar una ubicación de almacenamiento administrada en el nivel de metastore, catálogo o esquema. Consulte Especificar una ubicación de almacenamiento administrada en Unity Catalog. | Solo tablas y volúmenes |
Privilegio MANAGE |
Privilegio que permite a un usuario asignar o revocar privilegios en, transferir la propiedad de y eliminar un objeto sin ser el propietario. Consulte ADMINISTRAR. | Todos los objetos protegibles del catálogo de Unity |
Tablas administradas y externas
Una tabla administrada por el catálogo de Unity es una tabla en la que Unity Catalog determina la ubicación de almacenamiento de los archivos de datos subyacentes. El catálogo de Unity almacena tablas administradas en la ubicación de almacenamiento administrada definida en el esquema contenedor, catálogo o metastore. Al quitar una tabla administrada, El catálogo de Unity elimina los archivos de datos subyacentes. Las tablas administradas usan el formato Delta o Apache Iceberg.
Una tabla externa es una tabla donde se especifica la ubicación de almacenamiento para los archivos de datos subyacentes. Al eliminar una tabla externa, el Catálogo de Unity quita los metadatos de la tabla del metastore, pero los archivos de datos subyacentes permanecen en su lugar. Las tablas externas admiten varios formatos, incluidos Delta, CSV, JSON, Avro, Parquet y ORC.
Para obtener más información sobre los tipos de tabla, consulte Tipos de tabla del catálogo de Databricks unity.
Tanto las tablas administradas como las externas admiten acceso para lectura, escritura y creación desde motores externos a través de APIs abiertas, incluida la API REST de Unity y el Catálogo REST de Iceberg (IRC). Esto significa que las tablas administradas no provocan el bloqueo del proveedor. Cualquier motor que admita estas API puede acceder a las tablas administradas. Consulta Acceso a datos de Databricks mediante sistemas externos.
Volúmenes administrados y externos
Un volumen administrado de Catálogo de Unity es un volumen donde Unity Catalog determina la ubicación de almacenamiento. El catálogo de Unity almacena automáticamente los volúmenes administrados en la ubicación de almacenamiento administrado del esquema contenedor dentro de la cuenta en la nube. Al igual que con las tablas administradas, se conserva la propiedad total de los datos subyacentes. Al quitar un volumen administrado, el Catálogo de Unity elimina los archivos de datos subyacentes.
Un volumen externo es un volumen donde se especifica la ubicación de almacenamiento. La ubicación debe ser una ruta de acceso gestionada por una ubicación externa en Unity Catalog. Al quitar un volumen externo, El catálogo de Unity quita la definición de volumen, pero los archivos de datos subyacentes permanecen en su lugar.
Para obtener más información sobre los volúmenes, vea ¿Qué son los volúmenes del Unity Catalog?.