Vad är Unity Catalog?

Unity Catalog är det enhetliga styrningslagret för data och AI som är inbyggt i Azure Databricks. När den är aktiverad för en arbetsyta fungerar Unity Catalog automatiskt under varje data- och AI-interaktion på dina arbetsytor: framtvinga åtkomstkontroll när du frågar en tabell eller anropar en modell, spårning av ursprung när data och AI-tillgångar används, loggningsaktivitet för granskning med mera. Du arbetar med objekten Unity Catalog styr via Catalog Explorer, SQL, Azure Databricks CLI och REST API:er.

Unity Catalog aktiveras automatiskt för alla Azure Databricks arbetsytor som skapats efter den 9 november 2023.

Unity Catalog är också tillgängligt som en implementering med öppen källkod. Se meddelandebloggen och den offentliga GitHub-lagringsplatsen för Unity Catalog.

Objektmodellen för Unity Catalog

Varje tillgång som du styr i Unity Catalog modelleras som ett skyddsbart objekt, ett objekt där du kan bevilja behörigheter till användare, tjänstens huvudnamn eller grupper. Data och AI-tillgångar som tabeller, vyer, volymer, funktioner, modeller och tjänster (modelltjänster och MCP-tjänster) följer ett namnområde på tre nivåer (catalog.schema.object). Tabeller och volymer kan hanteras, där Unity Catalog hanterar både styrning och den underliggande fillagringslivscykeln, eller extern, där Unity Catalog endast hanterar styrning. Andra objekt, till exempel autentiseringsuppgifter för lagring, externa platser, anslutningar och resurser, ligger direkt under metaarkivet.

Objektmodelldiagram för Unity Catalog

På följande sidor beskrivs grundläggande begrepp och arbetsflöden i Unity-katalogen i detalj.

Topic Description
Skyddsbara objekt Lär dig mer om varje objekttyp i Unity Catalog-hierarkin och hur behörigheter gäller för dem.
Hanterade kontra externa tillgångar Förstå skillnaden mellan hanterade och externa tabeller och volymer och när du ska använda var och en.
Krav och begränsningar Granska beräkningskrav, filformat som stöds, namngivningsbegränsningar och kända begränsningar.

Funktioner i Unity Catalog

Unity Catalog innehåller inbyggda verktyg för att styra varje dimension i din data- och AI-miljö. Följande avsnitt beskriver de viktigaste kapacitetsområdena.

Topic Description
Åtkomstkontroll Hantera vem som kan komma åt vad med hjälp av privilegier, attributbaserade principer, rad- och kolumnfilter och arbetsytebindningar.
Upptäckt Använd Catalog Explorer, Azure Databricks användargränssnitt för att upptäcka och hantera data- och AI-tillgångar som har registrerats i Unity Catalog, för att interagera med säkringsbara objekt.
Lineage Spåra automatiskt hur data och AI-tillgångar flödar och ansluter, från källdata till modeller, tjänster och instrumentpaneler.
Auditing Behåll ett fullständigt register över all åtkomst till data och all systemaktivitet med hjälp av systemtabellen för granskningsloggen.
Dataklassificering Klassificera och tagga känsliga data automatiskt i katalogen.
Övervakning av datakvalitet Spåra datahälsa proaktivt med inbyggd profilering och aviseringar som fångar avvikelser innan de når nedströmskonsumenter.
Datadelning Dela realtidsdata och AI-tillgångar på ett säkert sätt mellan organisationer och moln med hjälp av open OpenSharing-protokollet.
AI-styrning Styra AI-tillgångar och AI-trafik med hjälp av Unity Catalog och AI Gateway.

Get started

Följande resurser hjälper dig att komma igång med Unity Catalog. Om din arbetsyta skapades efter den 9 november 2023 aktiveras den automatiskt med Unity Catalog.

Topic Description
Kom igång med Unity Catalog Kontrollera om Unity Catalog redan är aktiverat för din arbetsyta och konfigurera dina första katalog-, schema- och dataåtkomstkontroller.
Uppgradera till Unity Catalog Lär dig hur du uppgraderar en arbetsyta som ännu inte använder Unity Catalog.
Kom igång med AI-styrning Konfigurera styrning för dina AI-tillgångar, AI-trafik och AI-tjänstbeteende.

Ytterligare resurser