Wat is Unity Catalog?

Unity Catalog is de geïntegreerde governancelaag die is ingebouwd in Azure Databricks. Wanneer Unity Catalog is ingeschakeld voor een werkruimte, werkt Unity Catalog automatisch onder elke gegevensinteractie in uw werkruimten: toegangsbeheer afdwingen wanneer u een query uitvoert op een tabel, herkomst bijhouden als gegevens worden verplaatst, logboekregistratieactiviteit voor controle en meer. U werkt met de objecten die Unity Catalog beheert via Catalog Explorer, SQL, de Azure Databricks CLI en REST API's.

Unity Catalog wordt automatisch ingeschakeld voor alle Azure Databricks werkruimten die na 9 november 2023 zijn gemaakt.

Unity Catalog is ook beschikbaar als een opensource-implementatie. Zie de aankondigingsblog en de openbare GitHub-opslagplaats voor Unity Catalog.

Het Unity Catalog-objectmodel

Elke asset die u in Unity Catalog beheert, wordt gemodelleerd als een beveiligbaar object, een object waarop u machtigingen kunt verlenen aan gebruikers, service-principals of groepen. Gegevensassets zoals tabellen, weergaven, volumes, functies en modellen volgen een naamruimte op drie niveaus (catalog.schema.object). Tabellen en volumes kunnen worden beheerd, waarbij Unity Catalog zowel governance als de onderliggende levenscyclus van bestandsopslag afhandelt, of extern, waarbij Unity Catalog alleen governance afhandelt. Andere objecten, zoals opslagreferenties, externe locaties, verbindingen en shares, bevinden zich rechtstreeks onder de metastore.

Diagram van het Unity Catalog-objectmodel

Op de volgende pagina's worden de belangrijkste concepten en werkstromen van Unity Catalog uitgebreider beschreven.

Onderwerp Description
Beveiligbare objecten Meer informatie over elk objecttype in de Unity Catalog-hiërarchie en hoe machtigingen op deze objecten van toepassing zijn.
Beheerde versus externe assets Inzicht in het verschil tussen beheerde en externe tabellen en volumes, en wanneer u elk wilt gebruiken.
Vereisten en beperkingen Controleer de rekenvereisten, ondersteunde bestandsindelingen, naamgevingsbeperkingen en bekende beperkingen.

Mogelijkheden van Unity Catalog

Unity Catalog biedt ingebouwde hulpprogramma's voor het beheren van elke dimensie van uw gegevens en AI-omgeving. In de volgende onderwerpen worden de belangrijkste mogelijkheden besproken.

Onderwerp Description
Toegangsbeheer Beheren wie toegang heeft tot wat met bevoegdheden, beleid op basis van kenmerken, rij- en kolomfilters en werkruimtebindingen.
Gegevensdetectie Werk met beveiligbare objecten met behulp van Catalog Explorer, de Azure Databricks-gebruikersinterface voor het ontdekken en beheren van data- en AI-assets die zijn geregistreerd in Unity Catalog.
Gegevensherkomst Automatisch bijhouden hoe gegevens stromen en transformeren van bron naar definitieve weergaven en dashboards.
Controle Behoud een volledige record van alle gegevenstoegang en systeemactiviteit met behulp van de systeemtabel van het auditlogboek.
Gegevensclassificatie Gevoelige gegevens automatisch classificeren en taggen in uw catalogus.
Bewaking van gegevenskwaliteit Houd de status van gegevens proactief bij met ingebouwde profilering en waarschuwingen die afwijkingen ondervangen voordat ze downstreamgebruikers bereiken.
Gegevens delen Deel livegegevens en AI-assets veilig in organisaties en clouds met behulp van het open OpenSharing-protocol.
AI-governance Beheer AI-assets en AI-verkeer met behulp van Unity Catalog en AI Gateway.

Get started

De volgende bronnen helpen u aan de slag te gaan met Unity Catalog. Als uw werkruimte na 9 november 2023 is gemaakt, wordt deze automatisch ingeschakeld met Unity Catalog.

Onderwerp Description
Aan de slag met Unity Catalog Controleer of Unity Catalog al is ingeschakeld voor uw werkruimte en configureer uw eerste catalogus, schema en besturingselementen voor gegevenstoegang.
Upgrade uitvoeren naar Unity Catalog Meer informatie over het upgraden van een werkruimte die nog niet gebruikmaakt van Unity Catalog.

Aanvullende bronnen