Modelldienste im Unity-Katalog

Important

Dieses Feature befindet sich in der Betaversion. Kontoadministratoren können den Zugriff auf dieses Feature über die Seite " Vorschau" der Kontokonsole steuern. Siehe Manage Azure Databricks Previews.

Hinweis

Unity AI Gateway wird für Azure Government nicht unterstützt.

Ein Modelldienst ist ein sicherungsfähiges Unity-Katalog-Objekt, das einen geregelten LLM-Endpunkt darstellt. Mithilfe von Modelldiensten können Sie den Zugriff auf LLMs zentral im Unity-Katalog definieren, freigeben und steuern, zusammen mit Ihren Daten und über Arbeitsbereichsgrenzen hinweg.

Während der Betaversion unterstützen Modelldienste Folgendes:

  • Databricks-gehostete Pay-per-Token Foundation-Modelle, als vom System bereitgestellte Dienste in system.ai und als Dienste, die Sie erstellen.
  • Erstellen und Verwalten von Modelldiensten mit der Unity AI Gateway-Benutzeroberfläche, dem Katalog-Explorer und der Unity-Katalog-REST-API.
  • Abfragen von Modelldiensten über Arbeitsbereiche hinweg, innerhalb und außerhalb von Azure Databricks.

Was ist ein Modelldienst?

Ein Modelldienst befindet sich in einem Unity-Katalogschema und verweist auf ein oder mehrere bereitgestellte Modelle als Ziele mit Routing und Fallback zwischen ihnen. Anrufer rufen den Modelldienst anhand seines vollqualifizierten Namens auf, und Unity AI Gateway leitet jede Anforderung an ein Zielmodell weiter.

Da ein Modellservice ein sicherbares Objekt in Unity Catalog ist, gilt Folgendes:

  • Lebt in einem Katalog und Schema, wo es Schemaeinstellungen wie Arbeitsbereichsbindungen erbt.
  • Enthält Standardmetadaten des Unity-Katalogs, z. B. Name, Besitzer, Kommentar und Tags.
  • Unterliegt den Unity-Katalogrechten, sodass Sie den Zugriff mit denselben GRANT Anweisungen REVOKE gewähren, die Sie für Tabellen, Funktionen und Modelle verwenden.
  • Ist im Katalog-Explorer zusammen mit den restlichen Unity-Katalogressourcen auffindbar.

Derselbe Modelldienst wird auch als Endpunkt in der Unity AI Gateway-Benutzeroberfläche angezeigt, wo KI-Teams Funktionen wie Ratenlimits, Inferenztabellen und Leitplanken konfigurieren können. Weitere Informationen zu diesen Features finden Sie unter KI-Governance mit Unity AI Gateway.

Warum LLMs im Unity Catalog verwalten?

Unity AI Gateway-Endpunkte, die in einem Arbeitsbereich erstellt wurden, sind auf diesen Arbeitsbereich beschränkt. Um einen Endpunkt über Arbeitsbereiche hinweg freizugeben, müssen Sie ihn in jedem Arbeitsbereich duplizieren und jede Kopie separat verwalten.

Modelldienste überführen die Governance in Unity Catalog, sodass Sie:

  • Definieren Sie einen LLM-Endpunkt einmal , und verwenden Sie ihn aus jedem Arbeitsbereich, der demselben Metaspeicher zugeordnet ist.
  • Steuern Sie den Zugriff zentral mithilfe von Unity-Katalogberechtigungen anstelle von Berechtigungen pro Arbeitsbereich.
  • Entdecken Sie Modelle , die für Sie von einem einzigen Ort aus über Arbeitsbereiche verfügbar sind.
  • Verfolgen Sie die Nutzung und Kosten für Modelldienste in Unity Catalog-Systemtabellen.

Vom System bereitgestellte Modelldienste

Azure Databricks stellt für jedes von Databricks gehostete Basismodell einen einsatzbereiten Modellservice im Schema system.ai bereit, z. B. system.ai.databricks-claude-opus-4-6. Azure Databricks fügt neue Systemmodelldienste hinzu, wenn neue Foundation-Modelle verfügbar werden.

Vom System bereitgestellte Modelldienste weisen die folgenden Merkmale auf:

  • Standardmäßig verfügen alle Kontobenutzer über die EXECUTE Berechtigung, sodass Sie sie ohne zusätzliche Einrichtung abfragen können.
  • Ein Systembenutzer besitzt sie, und Sie können sie nicht löschen.
  • Standardmäßig können nur Metastoreadministratoren sie ändern. Ein Metastoreadministrator kann die Verwaltung delegieren, indem er die MANAGE Berechtigung gewährt.

Informationen zum Einschränken des Zugriffs auf vom System bereitgestellte Modelldienste finden Sie unter "Steuern von Modelldiensten".

Berechtigungen

Modelldienste verwenden das Standardmäßige Unity Catalog-Berechtigungsmodell. Die folgenden Berechtigungen gelten:

Privileg Beschreibung
USE CATALOG, USE SCHEMA Greifen Sie auf den Katalog und das Schema zu, der den Modelldienst enthält. Erforderlich für alle Vorgänge.
CREATE SERVICE Erstellen sie Modelldienste in einem Schema. Wird für den Katalog oder das Schema gewährt.
EXECUTE Einen Modelldienst abfragen.
MANAGE Ändern oder Löschen eines Modelldiensts und Verwalten seiner Zuschüsse. Der Besitzer hat eine Obermenge von MANAGE.

Wenn ein Benutzer einen Modelldienst abfragt, überprüft Azure Databricks, ob der EigentümerEXECUTE für die referenzierten Modelle hat (Rechte des Definierenden). Der Aufrufer benötigt keinen direkten Zugriff auf die zugrunde liegenden Modelle.

Limitations

Die folgenden Funktionen sind während der Betaversion nicht verfügbar:

  • Bereitgestellte Durchsatzmodelle und externe Modellanbieter.
  • Erstellen und Verwalten von Modelldiensten mit Terraform oder SQL.
  • Ermitteln von Modelldiensten mit nur den BROWSE Berechtigungen.
  • Linien- und globale Suche nach Modelldiensten.

Nächste Schritte