Freigeben über


Verwenden von Tags zum Attributieren und Nachverfolgen der Verwendung

In diesem Artikel wird erläutert, wie Sie mithilfe von Tags die Computenutzung bestimmten Arbeitsbereichen, Teams, Projekten oder Benutzern zur Unterstützung der Kostennachverfolgung und -budgetierung zuordnen.

Es gibt zwei Arten von Tags:

  • Standardtags: Automatisch von Databricks auf in der Cloud bereitgestellte Ressourcen angewendet. Diese stellen grundlegende Metadaten wie Anbieter, Cluster-ID und Ersteller bereit.
  • Benutzerdefinierte Tags: Benutzerdefinierte Tags, die Sie zur Berechnung von Ressourcen und serverlosen Workloads hinzufügen können. Diese ermöglichen eine präzise Nachverfolgung, Berichterstellung und Budgetierung.

Warnung

Tagdaten werden als Nur-Text gespeichert und können global repliziert werden. Verwenden Sie keine Tagnamen, Werte oder Deskriptoren, die die Sicherheit Ihrer Ressourcen gefährden könnten. Verwenden Sie beispielsweise keine Tagnamen, Werte oder Deskriptoren, die persönliche oder vertrauliche Informationen enthalten.

Standardtags

Azure Databricks fügt automatisch Standardtags hinzu, um Ressourcen zu berechnen, die sie in Ihrem Cloudkonto bereitstellt. Diese Tags weisen die Verwendung auf Databricks zurück und stellen grundlegende Informationen zur Ressource bereit, z. B. name, ID und Creator.

Die Standardtags werden automatisch an detaillierte Costanalyseberichte weitergegeben, auf die Sie im Azure-Portal zugreifen können.

Im Azure-Portal wird ein Bericht zu Rechnungsdetails zur Kostenanalyse angezeigt, in dem die Kosten nach clusterid Tag über einen zeitraum von einem Monat angegeben werden:

Kostenanalyse nach Cluster-ID

Standard RFID-Transponder-Schlüssel und Werte

Azure Databricks fügt die folgenden Standardtags zu Computeressourcen hinzu:

Tagschlüssel value
Vendor Konstanter Wert: Databricks
ClusterId Azure Databricks interne ID des Clusters
ClusterName Name des Clusters
Creator Benutzername (E-Mail-Adresse) des Benutzers, der den Cluster erstellt hat
RunName Einzelvorgangsname (nur auf berechneten Einzelvorgängen verteilen). Wenn Sie die Jobs-API 2.0 verwenden, entspricht dies run_name. In der Jobs-API 2.1 ist dies der task_key.
JobId Einzelvorgangskennung (wird nur bei berechneten Einzelvorgängen verteilt)

Die von der Datenprofilerstellung verwendete Berechnung umfasst die folgenden zusätzlichen Tags:

Tagschlüssel value
LakehouseMonitoring Wahr
LakehouseMonitoringTableId ID der überwachten Tabelle
LakehouseMonitoringWorkspaceId ID des Arbeitsbereichs, in dem der Monitor erstellt wurde
LakehouseMonitoringMetastoreId ID des Metastores, in dem die überwachte Tabelle vorhanden ist

Azure Databricks fügt den Pools und den von Pools erstellten Compute-Ressourcen die folgenden Standardtags hinzu.

Tagschlüssel value
Vendor Konstanter Wert: Databricks
DatabricksInstancePoolCreatorId Azure Databricks interne ID des Benutzers, der den Pool erstellt hat
DatabricksInstancePoolId Azure Databricks interne ID des Pools

Benutzerdefinierte Tags

Mit benutzerdefinierten Tags können Sie die Berechnungsnutzung bestimmten Teams, Projekten oder Kostenstellen mit mehr Granularität als Standardtags zuordnen. Diese Tags werden von Benutzern oder Administratoren angewendet und sowohl in die Nutzungsprotokolle Ihres Kontos als auch auf die entsprechenden Cloudressourcen weitergegeben. Diese Tags werden auch verwendet, um Budgets in Ihrem Azure Databricks Konto zu erstellen und zu überwachen.

Unterstützte Ressourcen für benutzerdefinierte Tags

Objekt Taggingschnittstelle (UI) Taggingschnittstelle (API)
Arbeitsbereich Azure-Portal Azure Ressourcen-API
Tümpel Pool-UI im Azure Databricks Arbeitsbereich Instanzpool-API
All-Purpose Compute und Job Compute Berechnen der Benutzeroberfläche im Azure Databricks-Arbeitsbereich Cluster-API
SQL-Warehouse SQL Warehouse UI im Azure Databricks Arbeitsbereich Lagerlager-API
Datenbankinstanz Benutzeroberfläche der Datenbankinstanz im Azure Databricks-Arbeitsbereich Datenbankinstanzen-API
Lakebase Autoscaling-Projekt Lakebase-App im Azure Databricks Arbeitsbereich Postgres-API

Warnung

Weisen Sie einem Cluster kein benutzerdefiniertes Tag mit dem Schlüssel Name zu. Jeder Cluster verfügt über ein Tag Name, dessen Wert durch Azure Databricks festgelegt wird. Wenn Sie den dem Schlüssel zugeordneten Wert Name ändern, kann der Cluster nicht mehr von Azure Databricks nachverfolgt werden. Dies hat zur Folge, dass der Cluster im Leerlauf möglicherweise nicht beendet wird, sodass weiterhin Nutzungskosten anfallen.

Markieren von serverlosen Computeworkloads

Wichtig

Dieses Feature befindet sich in Public Preview.

Um serverlose Computeverwendung für Benutzer, Gruppen oder Projekte zuzuordnen, können Sie serverlose Verwendungsrichtlinien verwenden. Wenn einem Benutzer eine serverlose Nutzungsrichtlinie zugewiesen wird, wird die serverlose Verwendung automatisch mit den benutzerdefinierten Tags der Richtlinie markiert. Serverlose Nutzungsrichtlinien können auf serverlose Notizbücher, Aufträge, Pipelines und Modell angewendet werden, die Endpunkte bedienen.

Hinweis

Der serverlose Berechnungsverbrauch wird in der fakturierbaren Verbrauchs-Systemtabelle Ihres Kontos protokolliert. Die Legacy-DBU-Verwendungsberichte enthalten keine Serverless-Nutzung oder Serverless-Nutzungsrichtlinien-Tags.

Siehe Attributverwendung mit serverlosen Verwendungsrichtlinien.

Tagweitergabe

Arbeitsbereichs-, Pool- und Clustertags werden durch Azure Databricks aggregiert und an Azure VMs für Costanalyseberichte verteilt. Pool- und Clustertags werden jedoch unterschiedlich voneinander weitergegeben.

Arbeitsbereichs- und Pooltags werden als Ressourcentags der Azure VMs aggregiert und zugewiesen, die die Pools hosten.

Arbeitsbereichs- und Clustertags werden als Ressourcentags der Azure VMs aggregiert und zugewiesen, die die Cluster hosten.

Wenn Cluster aus Pools erstellt werden, werden nur Arbeitsbereichstags und Pooltags an die VMs weitergegeben. Clustertags werden nicht weitergegeben, um die Startleistung des Poolclusters beizubehalten.

Tagkonfliktlösung

Wenn ein benutzerdefiniertes Tag (Arbeitsbereich, Cluster oder Pooltag) denselben Schlüsselnamen wie ein Azure Databricks Standardtag hat, wird dem benutzerdefinierten Tag während der Verteilung automatisch x_ vorangestellt. Das Standardtag Azure Databricks behält seinen ursprünglichen Schlüsselnamen bei.

Beispielsweise wendet Azure Databricks ein Standardclustertag vendor = Databricks auf alle Cluster an. Wenn Sie ein benutzerdefiniertes Arbeitsbereichs-Tag vendor = Azure Databricks hinzufügen, tritt ein Konflikt mit dem Standard-Tag vendor auf. Wenn es an Azure weitergegeben wird, wird das benutzerdefinierte Tag für den Arbeitsbereich zu x_vendor = Azure Databricks, während das Standardtag Azure Databricks als vendor = Databricks unverändert bleibt.

Warnung

Konfliktierende benutzerdefinierte RFID-Transponder, die durch Berechnungsrichtlinien hinzugefügt wurden, lösen sich nicht auf, was dazu führt, dass der Cluster oder Pool mit einem ungültigen Einstellung Fehler fehlschlägt. Stellen Sie sicher, dass Ihre Computerrichtlinien keine widersprüchlichen Tagnamen hinzufügen.

Tagerzwingung

Um die Verwendung bestimmter benutzerdefinierter Tags zu erzwingen, können Sie Berechnungsvorgaben verwenden. Siehe Durchsetzung benutzerdefinierter RFID-Transponder. Verwenden Sie serverlose Nutzungsrichtlinien, um benutzerdefinierte Tags für serverlose Computeworkloads zu erzwingen.

Einschränkungen

  • Es kann bis zu einer Stunde dauern, bis benutzerdefinierte Arbeitsbereichstags nach jeder Änderung auf Azure Databricks übertragen werden.
  • Einer Azure Ressource können maximal 50 Tags zugewiesen werden. Wenn die Gesamtanzahl aggregierter Tags diesen Grenzwert überschreitet, werden Tags mit dem Präfix x_ in alphabetischer Reihenfolge ausgewertet, und Tags, die den Grenzwert überschreiten, werden ignoriert. Wenn alle Tags mit dem Präfix x_ ignoriert werden und die Anzahl über dem Limit des Grenzwerts liegt, werden die verbleibenden Tags in alphabetischer Reihenfolge ausgewertet, und Tags, die den Grenzwert überschreiten, werden ignoriert.
  • RFID-Transponder-Schlüssel und Werte dürfen nur Schreiben, Leerzeichen, Zahlen oder die Zeichen +, -, =, ., _, :, /, @ enthalten. Kategorien, die andere Zeichen enthalten, sind ungültig. Diese Zeicheneinschränkungen werden durch Azure Resource Manager festgelegt.
  • Wenn Sie Tagschlüsselnamen oder -werte ändern, werden diese Änderungen erst nach dem Neustart des Clusters oder der Poolerweiterung wirksam.
  • Wenn die benutzerdefinierten Tags des Clusters mit den benutzerdefinierten Tags eines Pools in Konflikt stehen, kann der Cluster nicht erstellt werden.
  • Neu hinzugefügte, geänderte oder gelöschte Arbeitsbereichstags werden nicht automatisch an vorhandene Computeressourcen weitergegeben. Um neue Tags zu propagieren, öffnen Sie die Detailseite der Rechnerressource, klicken Sie auf Bearbeiten und dann auf Bestätigen und neu starten.