Cos'è Unity Catalog?

Unity Catalog è il livello di governance unificato per i dati e l'intelligenza artificiale incorporati in Azure Databricks. Quando è abilitato per uno spazio di lavoro, Unity Catalog opera automaticamente alla base di ogni interazione con dati e IA nei tuoi spazi di lavoro: applicando i controlli di accesso quando esegui una query su una tabella o richiami un modello, tracciando la lineage man mano che i dati e gli asset di IA vengono utilizzati, registrando l'attività a fini di audit e altro ancora. Gli oggetti di Unity Catalog vengono amministrati tramite Catalog Explorer, SQL, l'interfaccia della riga di comando di Azure Databricks e le API REST.

Il catalogo Unity viene abilitato automaticamente per tutte le aree di lavoro Azure Databricks create dopo il 9 novembre 2023.

Unity Catalog è anche disponibile come implementazione open-source. Consulta il blog dell'annuncio e il pubblico repository GitHub del catalogo di Unity.

Modello a oggetti del Catalogo Unity

Ogni asset gestito in Unity Catalog viene modellato come oggetto a protezione diretta, un oggetto in cui è possibile concedere autorizzazioni a utenti, entità servizio o gruppi. Gli asset di dati e intelligenza artificiale, ad esempio tabelle, viste, volumi, funzioni, modelli e servizi (servizi modello e servizi MCP) seguono uno spazio dei nomi a tre livelli (catalog.schema.object). Le tabelle e i volumi possono essere gestiti, in cui Il catalogo unity gestisce sia la governance che il ciclo di vita di archiviazione dei file sottostanti, o esterno, in cui Il catalogo unity gestisce solo la governance. Altri oggetti, ad esempio credenziali di archiviazione, posizioni esterne, connessioni e condivisioni, si trovano direttamente nel metastore.

Diagramma del modello a oggetti del catalogo Unity

Le pagine seguenti illustrano in modo più dettagliato i concetti e i flussi di lavoro del catalogo Unity di base.

Topic Descrizione
Oggetti proteggibili Informazioni su ogni tipo di oggetto nella gerarchia del catalogo Unity e su come si applicano le autorizzazioni.
Asset gestiti e esterni Comprendere la differenza tra tabelle e volumi gestiti ed esterni e quando usarli.
Requisiti e limitazioni Esaminare i requisiti di calcolo, i formati di file supportati, i vincoli di denominazione e le limitazioni note.

Funzionalità del catalogo Unity

Unity Catalog offre strumenti predefiniti per la governance di ogni dimensione dei dati e dell'ambiente di intelligenza artificiale. Gli argomenti seguenti illustrano le principali aree di funzionalità.

Topic Descrizione
Controllo di accesso Gestisci chi può accedere a cosa tramite privilegi, criteri basati sugli attributi, filtri di riga e di colonna e associazioni dell'area di lavoro.
Scoperta Interagisci con gli oggetti proteggibili usando Catalog Explorer, l'interfaccia utente di Azure Databricks per individuare e gestire le risorse di dati e IA registrate in Unity Catalog.
Lineage Tenere traccia automaticamente del flusso e della connessione degli asset di dati e intelligenza artificiale, dai dati di origine ai modelli, ai servizi e ai dashboard.
Revisione contabile Mantenere un record completo di tutte le attività di accesso ai dati e di sistema usando la tabella di sistema del log di controllo.
Classificazione dei dati Classificare e contrassegnare automaticamente i dati sensibili nel catalogo.
Monitoraggio della qualità dei dati Tenere traccia proattiva dell'integrità dei dati con la profilatura predefinita e gli avvisi che rilevano anomalie prima di raggiungere i consumer downstream.
Condivisione dei dati Condividere in modo sicuro i dati live e gli asset di intelligenza artificiale tra organizzazioni e cloud usando il protocollo OpenSharing aperto.
Governance dell'intelligenza artificiale Gestire gli asset di intelligenza artificiale e il traffico di intelligenza artificiale usando il catalogo unity e il gateway di intelligenza artificiale.

Get started

Le risorse seguenti consentono di iniziare a usare Unity Catalog. Se l'area di lavoro è stata creata dopo il 9 novembre 2023, viene abilitata automaticamente con Unity Catalog.

Topic Descrizione
Introduzione a Unity Catalog Controllare se Unity Catalog è già abilitato per l'area di lavoro e configurare il primo catalogo, lo schema e i controlli di accesso ai dati.
Aggiornare al catalogo Unity Informazioni su come aggiornare un'area di lavoro che non usa ancora Unity Catalog.
Introduzione alla governance dell'intelligenza artificiale Configurare la governance per gli asset di intelligenza artificiale, il traffico di intelligenza artificiale e il comportamento del servizio di intelligenza artificiale.

Risorse aggiuntive