Erste Schritte mit Unity-Katalog

Unity Catalog ist die einheitliche Governance-Ebene für Daten und KI in Azure Databricks. Sie bietet zentrale Zugriffssteuerung, Linien, Überwachung und Datenermittlung in Ihren Arbeitsbereichen. Siehe Was ist Unity Catalog?.

Unity Catalog ist automatisch für alle Azure Databricks Arbeitsbereiche aktiviert, die nach dem 9. November 2023 erstellt wurden. Wenn für Ihren Arbeitsbereich bereits Unity Catalog aktiviert ist, folgen Sie dem Tutorial zur Einrichtung. Wenn Ihr Arbeitsbereich älter als Unity Catalog ist oder bei der Erstellung nicht aktiviert wurde, befolgen Sie die Upgrade-Anleitung.

Guide Description
Installationshandbuch für Unity-Katalog Für Arbeitsbereiche, für die Unity Catalog bereits aktiviert ist. Konfigurieren Sie Administratorrollen, Benutzer, Rechenressourcen, Berechtigungen und Kataloge.
Upgrade auf Unity Catalog Für vorhandene Arbeitsbereiche, die noch nicht in Unity Catalog sind. Aktivieren Sie Unity-Katalog, und migrieren Sie Ihre Daten.

Erweitern des Unity-Katalog-Setups

Nachdem Ihr Arbeitsbereich eingerichtet wurde, können Sie erweiterte Governance-Funktionen auf Ihre Daten und KI-Workflows anwenden.

Attributbasierte Zugriffssteuerung

Mithilfe der attributbasierten Zugriffssteuerung (Access Control, ABAC) können Sie dynamische, differenzierte Zugriffsrichtlinien basierend auf Attributen der Daten und dem Benutzer definieren, auf die zugegriffen wird. Anstatt die Berechtigungstabelle nach Tabelle zu verwalten, schreiben Sie Richtlinien, die automatisch das Filtern auf Zeilenebene und die Maskierung auf Spaltenebene erzwingen. Sie können z. B. vertrauliche Spalten von Benutzern außerhalb einer bestimmten Region ausblenden oder PII für nicht privilegierte Rollen maskieren.

ABAC-Spaltenmaskierung in der Praxis

Datenklassifizierung

Die Datenklassifizierung verwendet einen KI-Agent, um Ihren Katalog automatisch zu scannen und vertrauliche Daten wie PII, Finanzinformationen und Anmeldeinformationen zu markieren. Nach der Klassifizierung können Tags direkt in ABAC-Richtlinien integriert werden, sodass Sie Governance-Kontrollen auf Grundlage dessen anwenden können, was die Daten tatsächlich enthalten, anstatt den Zugriff Objekt für Objekt zu verwalten.

Ergebnisse der Datenklassifizierung

Datenqualitätsüberwachung

Die Datenqualitätsüberwachung ermöglicht die Anomalieerkennung in allen Tabellen in einem Schema und einer Datenprofilerstellung auf Tabellenebene. Anomalieerkennung überwacht automatisch Aktualität und Vollständigkeit mithilfe von historischen Datenmustern, Erkennen von Problemen ohne manuelle Konfiguration. Die Datenprofilerstellung erfasst statistische Verteilungen im Laufe der Zeit, sodass Sie die Datenintegrität nachverfolgen und Warnungen für unerwartete Änderungen festlegen können.

Dashboard zur Datenqualitätsüberwachung

Datenherkunft

Die Datenlinie erfasst automatisch, wie Daten über Tabellen, Notizbücher, Aufträge und Pipelines hinweg fließen – bis zur Spaltenebene. Sie können den Ursprung jeder Spalte nachverfolgen, sehen, welche nachgeschalteten Ressourcen davon abhängen, und die auswirkungen einer Schemaänderung verstehen, bevor Sie sie vornehmen.

Datenlinie auf Spaltenebene

KI-Governance mit Unity AI Gateway

Unity AI Gateway erweitert Unity Catalog Governance auf KI. Es bietet Unternehmensgovernance für LLM-Endpunkte, Agents und MCP-Server, sodass Sie Zugriffssteuerung, Überwachungsprotokollierung und Observierbarkeit für alle KI-Interaktionen in einer einheitlichen Benutzeroberfläche implementieren können.

Eine vollständige Übersicht über die Unity-Katalogfunktionen finden Sie unter "Was ist Unity-Katalog?" Bewährte Methoden für Governance finden Sie unter "Bewährte Methoden im Unity-Katalog".