Preise und Abrechnung für Azure SRE-Agent

Erfahren Sie, wie die Abrechnung des Azure SRE-Agents funktioniert und was Sie in Ihrer Azure-Rechnung erwarten können.

Funktionsweise der Abrechnung

Azure SRE Agent-Gebühren basieren auf Azure Agent Units (AAUs), einem standardisierten Maß für die agentische Verarbeitung, die für alle vordefinierten Azure Agenten verwendet wird. Ihre monatliche Rechnung kombiniert zwei Arten von Gebühren.

Always-on Flow (feste Kosten)

Wenn Sie einen Agenten erstellen, zahlen Sie einen festen Satz, solange der Agent vorhanden ist:

Bestandteil Rate
Always On-Flow 4 AAUs pro Agent-Stunde

Der kontinuierliche Fluss bedeutet nicht, dass der Agent die Arbeit aktiv bearbeitet. Sie stellt die Grundkosten für die Bereitstellung und Verfügbarkeit Ihres Agenten dar. Die Always-On-Abrechnung wird von der Agenterstellung fortgesetzt, bis der Agent gelöscht wird.

Aktiver Fluss (variable Kosten)

Wann immer Ihr Agent funktioniert – unabhängig davon, ob ein Benutzer eine Frage interaktiv stellt, eine Automatisierung eine Aufgabe auslöst oder ein asynchroner Vorgang im Hintergrund ausgeführt wird – verwendet der Agent aktive Ablauf-AAUs. Jedes Mal, wenn der Agent aktiv etwas verarbeitet, zählt dies als aktiver Arbeitsfluss, unabhängig davon, wie die Arbeit initiiert wurde.

So werden Token zu AAUs

Jedes Mal, wenn Ihr Agent arbeitet, verwendet er LLM-Token. Jeder Token-Typ wird separat mit der in der folgenden Tabelle gezeigten Rate getaktet.

Tokentyp Was sie misst
Eingabe Token, die an das Modell gesendet werden (Eingabeaufforderungen, Toolergebnisse, Kontext)
Output Vom Modell generierte Token (Antworten, Gründe)
Cache-Lesen Token, die aus dem Prompt-Cache bereitgestellt werden (wiederholter Kontext)
Cacheschreibzugriff Token, die in den Cache zur zukünftigen Wiederverwendung geschrieben werden.

Die Gesamtzahl der aktiven Fluss-AAUs für eine Aufgabe = Summe der AAUs über alle vier Tokentypen hinweg.

AAU-Tarife nach Modell

Anzahl der AAUs, die pro 1 Million Token verbraucht wurden:

Modell Eingabe Output Cache-Lesevorgang Cache-Schreibvorgänge
Claude Opus 4.6 100 AAUs 500 AAUs 10 AAUs 125 AAUs
GPT 5.3 Codex 35 AAUs 280 AAUs 3.5 AAUs 0 AAUs
GPT 5.2 35 AAUs 280 AAUs 3.5 AAUs 0 AAUs

Die Preise sind pro 1 Million Token.

Note

Azure könnten in Zukunft weitere Modelle und Anbieter hinzufügen. Azure legt AAU-Raten fest und aktualisiert sie möglicherweise, wenn neue Modelle veröffentlicht werden.

Wichtige Details:

  • Nur die Verarbeitungszeit zählt. Die Zeit, mit der der Agent auf Ihre Antwort wartet, wird nicht als aktiver Ablauf in Rechnung gestellt.
  • Der aktive Flow wird monatlich zurückgesetzt. Ihr AAU-Verbrauchszähler wird zu Beginn jedes Kalendermonats zurückgesetzt.
  • Legen Sie den Anbieter auf Agentebene fest. Konfigurieren Sie den Modellanbieter (Anthropic, OpenAI und andere) in den Einstellungen Ihres Agents. Das entsprechende Modell bestimmt ihre AAU-Tarife.

Aktiver Fluss nach Aufgabentyp

Die Anzahl der Token, die Sie verwenden – und die AAUs, für die Sie bezahlen – hängt davon ab, wie komplex die Aufgabe ist. Komplexere Aufgaben benötigen mehr LLM-Begründungsschritte, Toolaufrufe und Datenverarbeitung, sodass sie mehr Token verwenden.

Hier erfahren Sie, wie die Tokenverwendung für häufige Szenarien in AAUs übersetzt wird:

Szenario Eingabetoken Ausgabetoken Cache-Lesevorgang Cache-Schreibvorgänge Claude Opus 4.6 AAUs GPT 5.3 Codex AAUs Beispiel
Schnelle Frage ca. 20.000 ~2K ca. 15K Etwa 5.000 ~3,8 ~1,3 Aktuelle Benachrichtigungen anzeigen
Untersuchung von Vorfällen Etwa 200.000 ca. 15K ~150K ~50K ~35,3 ~11,7 Automatisierter Vorfall von Azure Monitor
Vollständige Wartung ~500K ~40K Etwa 400.000 ~100K ~86,5 ~30,1 "Diagnostizieren und Beheben der fehlerhaften Bereitstellung"

Funktionsweise der Mathematik (Claude Opus 4.6 Beispiel - schnelle Frage):

Tokentyp Token Rate pro 1M AAUs
Eingabe 20.000 100 2.0
Output 2 000 500 1.0
Cache-Lesevorgang 15 Tausend 10 0.15
Cache-Schreibvorgänge 5K 125 0.625
Summe 3.775 AAUs

Tipp

Um die Kosten für den aktiven Flow vorhersehbar zu halten, legen Sie ein monatliches AAU-Zuweisungslimit in Einstellungen>Agent-Verbrauch fest.

Überwachen Ihrer Kosten

Im SRE-Agent-Portal

Wechseln Sie zu Einstellungen>Agentenverbrauch, um Ihre Nutzung anzuzeigen:

  • Monatliche AAU-Grenze: Ihre kombinierte Always-On- und Active Flow-Zuordnung mit einer Schaltfläche, um sie anzupassen
  • Gesamtnutzung des aktiven Flusses: Donut-Diagramme, die die Verwendung nach Threadtyp aufschlüsseln (Chats, Vorfälle, geplante Vorgänge, Trigger)
  • Tägliche Nutzung des aktiven Flusses: Gestapelte Balkendiagramm mit AAU-Verwendung pro Tag, farbcodiert nach Typ
  • Verbrauch nach Thread: Tabelle listet jeden Thread mit seinen AAU-Kosten, -Typ und -Status auf

Eine vollständige exemplarische Vorgehensweise finden Sie unter Überwachen der Agent-Nutzung.

Festlegen eines Grenzwerts für aktive Ablaufausgaben

Wählen Sie "AAU-Zuordnung ändern" aus, um einen monatlichen AAU-Grenzwert für den aktiven Fluss festzulegen (mindestens 500, maximal 1.000.000 AAUs). Dieser Grenzwert gilt nur für den aktiven Fluss – die Abrechnung wird immer aktiviert, solange der Agent vorhanden ist.

  • Wenn Ihr Agent den Aktiven Flussgrenzwert erreicht, ist er für Chats und Aktionen bis zum nächsten Monat nicht verfügbar. Die Gebühren für den Always-On-Service bleiben für den Rest des Monats bestehen.
  • Sie können die Zuweisung jederzeit erhöhen oder verkleinern.
  • Erhöhungen werden sofort wirksam – wenn Sie den Grenzwert über dem aktuellen Verbrauch erhöhen, werden Chats und Aktionen sofort fortgesetzt.
  • Kürzungen werden im nächsten Monat wirksam. Bis dahin wird der Agent nur im Always-On-Fluss ausgeführt.

Auswirkungen auf die Abrechnung nach Aktion

Action Aktiver Fluss Immer eingeschaltet Nächsten Monat fortsetzen
Festlegen des Budgetlimits (Treffergrenzwert) Beendet Noch in Rechnung gestellt Setzt sich zu Beginn des Monats automatisch zurück.
Agent beenden Beendet Noch in Rechnung gestellt Wählen Sie "Manuell starten" in den Einstellungen>"Grundlagen" aus.
Agent löschen Beendet Beendet Erstellen eines neuen Agents

In Azure Cost Management

Verwenden Sie Azure Cost Management im Azure-Portal, um detaillierte Abrechnungsaufschlüsselungen für mehrere Agents und Ressourcen zu ermitteln.

Tipps zur Kostenoptimierung

Strategie Auswirkungen Vorgehensweise
Fügen Sie Kontext zu Ihrem Agenten hinzu Weniger verschwendete Token Fügen Sie Fähigkeiten, Wissen und Dokumente hinzu, damit die Agentur fokussiert und präzise bleibt. Beständiger Speicher aus früheren Interaktionen verbessert die Effizienz im Laufe der Zeit.
Filtern von Vorfällen mit Reaktionsplänen Weniger unnötige Arbeit Verwenden Sie Antwortpläne, um Azure Monitor Warnungen nach Schweregrad, Dienst oder Schlüsselwort zu filtern– der Agent untersucht nur Vorfälle, die übereinstimmen.
Batcharbeit mit geplanten Vorgängen Weniger Laufläufe Planen Sie Vorgänge so, dass sie täglich oder wöchentlich ausgeführt werden, anstatt kontinuierlich abzufragen. Siehe geplante Vorgänge.
Testen im Chat vor der Automatisierung Vermeiden Sie verschwendete Läufe Probieren Sie zuerst Ihre Eingabeaufforderung im Chat oder im Playground aus. Eine falsch konfigurierte Automatisierung wird wiederholt ausgeführt und verschwendet AAUs.
Inaktive Agenten stoppen Beseitigt den aktiven Fluss. Wechseln Sie zu ">", und wählen Sie "Beenden" aus. Der Agent behält seine Konfiguration bei, stoppt jedoch den gesamten aktiven Fluss. Die Kosten für den Always-On-Dienst laufen weiter, bis sie gelöscht werden.
Löschen nicht verwendeter Agents Beseitigt alle Kosten Öffnen Sie in sre.azure.com den Agent, und wechseln Sie zu "Einstellungen>Basics>Delete Agent". Alle Abrechnungen werden sofort beendet.

Häufig gestellte Fragen

Wie berechnet der Agent AAUs aus Token?

Jedes Mal, wenn Ihr Agent Arbeit ausführt, verfolgt er die LLM-Token, die in allen vier Tokentypen verwendet werden, und misst sie mit den AAU-Raten für Ihr konfiguriertes Modell. Sie können Ihren AAU-Verbrauch unter Einstellungen>Agent-Verbrauch sehen.

Wirkt sich der von mir gewählte Anbieter auf meine Kosten aus?

Legen Sie den Modellanbieter (Anthropic, OpenAI und andere) auf Agentebene fest. Er bestimmt, welche AAU-Tarife gelten. Verschiedene Modelle weisen unterschiedliche Tarife auf. In der AAU-Tariftabelle finden Sie die aktuellen Tarife.

Welches Modell sollte ich auswählen?

Claude Opus 4.6 hat höhere AAU-Raten, produziert jedoch in der Regel gründlichere Untersuchungen mit weniger Begründungsschritten. Bei komplexen Untersuchungen von Vorfällen und der Ursachenanalyse erreicht Opus häufig eine Schlussfolgerung in weniger Toolaufrufen, wodurch die höhere Rate pro Token ausgeglichen werden kann. GPT-Modelle sind eine gute Wahl für einfachere, umfangreiche Aufgaben wie geplante Compliance-Prüfungen, bei denen Kosteneffizienz wichtiger ist als Tiefe. Sie können Ihren Modellanbieter jederzeit in den Einstellungen>"Grundlagen" ändern und Ergebnisse vergleichen.

Wird mir eine Gebühr berechnet, wenn der Agent darauf wartet, dass ich antworte?

Nein. Nur die Zeit, die der Agent aktiv für die Verarbeitung einer Aufgabe aufwendet, zählt als aktiver Fluss. Wenn der Agent nach Ihrer Genehmigung fragt und wartet, wird diese Wartezeit nicht in Rechnung gestellt.

Was zählt als aktiver Fluss?

Jedes Mal, wenn der Agent aktiv arbeitet, wird dies als aktive Bearbeitungszeit gewertet. Diese Arbeit umfasst:

  • Interaktive Eingabeaufforderungen: ein Benutzer, der dem Agent eine Frage im Chat stellt
  • Automatisierung: geplante Aufgaben, Pläne zur Reaktion auf Vorfälle oder andere automatisierte Trigger
  • Asynchrone Vorgänge: Hintergrunduntersuchungen, Berichtsgenerierung oder Wartungsaufgaben

In allen Fällen misst der Agent die verbrauchten Tokens als AAUs.

Was geschieht, wenn ich meinen Agenten stoppe?

Ein angehaltener Agent kann weder Ihre Ressourcen überwachen noch auf Prompts reagieren, aber er verursacht weiterhin die fixen Kosten für den Dauerbetrieb. Aktive Fluss-AAUs werden während des Anhaltens nicht verbraucht. Um Ihren Agent zu beenden, wechseln Sie zu Einstellungen>Basics und wählen Sie Stop. Um den Vorgang fortzusetzen, wählen Sie "Start " auf derselben Seite aus. Um die Abrechnung vollständig zu beenden, löschen Sie den Agenten.

Kann ein Agent mehrere Workloads verarbeiten?

Ja. Ein einzelner Agent kann mehrere Ressourcen innerhalb des konfigurierten Bereichs überwachen. Die Konsolidierung von Workloads unter einem Agenten reduziert die Dauerbetriebskosten im Vergleich zur Bereitstellung separater Agenten.

Gibt es eine kostenlose Stufe?

Nein. Azure-SRE-Agenten-Gebühren beginnen mit der Erstellung des Agenten. Die aktuellen Preise finden Sie im Azure-Preisrechner .

Ist die Preisgestaltung in allen Regionen gleich?

Überprüfen Sie den Azure-Preisrechner auf aktuelle Preise in Ihrer Region.