Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Erfahren Sie, wie die Abrechnung des Azure SRE-Agents funktioniert und was Sie in Ihrer Azure-Rechnung erwarten können.
Funktionsweise der Abrechnung
Azure SRE Agent-Gebühren basieren auf Azure Agent Units (AAUs), einem standardisierten Maß für die agentische Verarbeitung, die für alle vordefinierten Azure Agenten verwendet wird. Ihre monatliche Rechnung kombiniert zwei Arten von Gebühren.
Always-on Flow (feste Kosten)
Wenn Sie einen Agenten erstellen, zahlen Sie einen festen Satz, solange der Agent vorhanden ist:
| Bestandteil | Rate |
|---|---|
| Always On-Flow | 4 AAUs pro Agent-Stunde |
Der kontinuierliche Fluss bedeutet nicht, dass der Agent die Arbeit aktiv bearbeitet. Sie stellt die Grundkosten für die Bereitstellung und Verfügbarkeit Ihres Agenten dar. Die Always-On-Abrechnung wird von der Agenterstellung fortgesetzt, bis der Agent gelöscht wird.
Aktiver Fluss (variable Kosten)
Wann immer Ihr Agent funktioniert – unabhängig davon, ob ein Benutzer eine Frage interaktiv stellt, eine Automatisierung eine Aufgabe auslöst oder ein asynchroner Vorgang im Hintergrund ausgeführt wird – verwendet der Agent aktive Ablauf-AAUs. Jedes Mal, wenn der Agent aktiv etwas verarbeitet, zählt dies als aktiver Arbeitsfluss, unabhängig davon, wie die Arbeit initiiert wurde.
So werden Token zu AAUs
Jedes Mal, wenn Ihr Agent arbeitet, verwendet er LLM-Token. Jeder Token-Typ wird separat mit der in der folgenden Tabelle gezeigten Rate getaktet.
| Tokentyp | Was sie misst |
|---|---|
| Eingabe | Token, die an das Modell gesendet werden (Eingabeaufforderungen, Toolergebnisse, Kontext) |
| Output | Vom Modell generierte Token (Antworten, Gründe) |
| Cache-Lesen | Token, die aus dem Prompt-Cache bereitgestellt werden (wiederholter Kontext) |
| Cacheschreibzugriff | Token, die in den Cache zur zukünftigen Wiederverwendung geschrieben werden. |
Die Gesamtzahl der aktiven Fluss-AAUs für eine Aufgabe = Summe der AAUs über alle vier Tokentypen hinweg.
AAU-Tarife nach Modell
Anzahl der AAUs, die pro 1 Million Token verbraucht wurden:
| Modell | Eingabe | Output | Cache-Lesevorgang | Cache-Schreibvorgänge |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAUs | 500 AAUs | 10 AAUs | 125 AAUs |
| GPT 5.3 Codex | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
| GPT 5.2 | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
Die Preise sind pro 1 Million Token.
Note
Azure könnten in Zukunft weitere Modelle und Anbieter hinzufügen. Azure legt AAU-Raten fest und aktualisiert sie möglicherweise, wenn neue Modelle veröffentlicht werden.
Wichtige Details:
- Nur die Verarbeitungszeit zählt. Die Zeit, mit der der Agent auf Ihre Antwort wartet, wird nicht als aktiver Ablauf in Rechnung gestellt.
- Der aktive Flow wird monatlich zurückgesetzt. Ihr AAU-Verbrauchszähler wird zu Beginn jedes Kalendermonats zurückgesetzt.
- Legen Sie den Anbieter auf Agentebene fest. Konfigurieren Sie den Modellanbieter (Anthropic, OpenAI und andere) in den Einstellungen Ihres Agents. Das entsprechende Modell bestimmt ihre AAU-Tarife.
Aktiver Fluss nach Aufgabentyp
Die Anzahl der Token, die Sie verwenden – und die AAUs, für die Sie bezahlen – hängt davon ab, wie komplex die Aufgabe ist. Komplexere Aufgaben benötigen mehr LLM-Begründungsschritte, Toolaufrufe und Datenverarbeitung, sodass sie mehr Token verwenden.
Hier erfahren Sie, wie die Tokenverwendung für häufige Szenarien in AAUs übersetzt wird:
| Szenario | Eingabetoken | Ausgabetoken | Cache-Lesevorgang | Cache-Schreibvorgänge | Claude Opus 4.6 AAUs | GPT 5.3 Codex AAUs | Beispiel |
|---|---|---|---|---|---|---|---|
| Schnelle Frage | ca. 20.000 | ~2K | ca. 15K | Etwa 5.000 | ~3,8 | ~1,3 | Aktuelle Benachrichtigungen anzeigen |
| Untersuchung von Vorfällen | Etwa 200.000 | ca. 15K | ~150K | ~50K | ~35,3 | ~11,7 | Automatisierter Vorfall von Azure Monitor |
| Vollständige Wartung | ~500K | ~40K | Etwa 400.000 | ~100K | ~86,5 | ~30,1 | "Diagnostizieren und Beheben der fehlerhaften Bereitstellung" |
Funktionsweise der Mathematik (Claude Opus 4.6 Beispiel - schnelle Frage):
| Tokentyp | Token | Rate pro 1M | AAUs |
|---|---|---|---|
| Eingabe | 20.000 | 100 | 2.0 |
| Output | 2 000 | 500 | 1.0 |
| Cache-Lesevorgang | 15 Tausend | 10 | 0.15 |
| Cache-Schreibvorgänge | 5K | 125 | 0.625 |
| Summe | 3.775 AAUs |
Tipp
Um die Kosten für den aktiven Flow vorhersehbar zu halten, legen Sie ein monatliches AAU-Zuweisungslimit in Einstellungen>Agent-Verbrauch fest.
Überwachen Ihrer Kosten
Im SRE-Agent-Portal
Wechseln Sie zu Einstellungen>Agentenverbrauch, um Ihre Nutzung anzuzeigen:
- Monatliche AAU-Grenze: Ihre kombinierte Always-On- und Active Flow-Zuordnung mit einer Schaltfläche, um sie anzupassen
- Gesamtnutzung des aktiven Flusses: Donut-Diagramme, die die Verwendung nach Threadtyp aufschlüsseln (Chats, Vorfälle, geplante Vorgänge, Trigger)
- Tägliche Nutzung des aktiven Flusses: Gestapelte Balkendiagramm mit AAU-Verwendung pro Tag, farbcodiert nach Typ
- Verbrauch nach Thread: Tabelle listet jeden Thread mit seinen AAU-Kosten, -Typ und -Status auf
Eine vollständige exemplarische Vorgehensweise finden Sie unter Überwachen der Agent-Nutzung.
Festlegen eines Grenzwerts für aktive Ablaufausgaben
Wählen Sie "AAU-Zuordnung ändern" aus, um einen monatlichen AAU-Grenzwert für den aktiven Fluss festzulegen (mindestens 500, maximal 1.000.000 AAUs). Dieser Grenzwert gilt nur für den aktiven Fluss – die Abrechnung wird immer aktiviert, solange der Agent vorhanden ist.
- Wenn Ihr Agent den Aktiven Flussgrenzwert erreicht, ist er für Chats und Aktionen bis zum nächsten Monat nicht verfügbar. Die Gebühren für den Always-On-Service bleiben für den Rest des Monats bestehen.
- Sie können die Zuweisung jederzeit erhöhen oder verkleinern.
- Erhöhungen werden sofort wirksam – wenn Sie den Grenzwert über dem aktuellen Verbrauch erhöhen, werden Chats und Aktionen sofort fortgesetzt.
- Kürzungen werden im nächsten Monat wirksam. Bis dahin wird der Agent nur im Always-On-Fluss ausgeführt.
Auswirkungen auf die Abrechnung nach Aktion
| Action | Aktiver Fluss | Immer eingeschaltet | Nächsten Monat fortsetzen |
|---|---|---|---|
| Festlegen des Budgetlimits (Treffergrenzwert) | Beendet | Noch in Rechnung gestellt | Setzt sich zu Beginn des Monats automatisch zurück. |
| Agent beenden | Beendet | Noch in Rechnung gestellt | Wählen Sie "Manuell starten" in den Einstellungen>"Grundlagen" aus. |
| Agent löschen | Beendet | Beendet | Erstellen eines neuen Agents |
In Azure Cost Management
Verwenden Sie Azure Cost Management im Azure-Portal, um detaillierte Abrechnungsaufschlüsselungen für mehrere Agents und Ressourcen zu ermitteln.
Tipps zur Kostenoptimierung
| Strategie | Auswirkungen | Vorgehensweise |
|---|---|---|
| Fügen Sie Kontext zu Ihrem Agenten hinzu | Weniger verschwendete Token | Fügen Sie Fähigkeiten, Wissen und Dokumente hinzu, damit die Agentur fokussiert und präzise bleibt. Beständiger Speicher aus früheren Interaktionen verbessert die Effizienz im Laufe der Zeit. |
| Filtern von Vorfällen mit Reaktionsplänen | Weniger unnötige Arbeit | Verwenden Sie Antwortpläne, um Azure Monitor Warnungen nach Schweregrad, Dienst oder Schlüsselwort zu filtern– der Agent untersucht nur Vorfälle, die übereinstimmen. |
| Batcharbeit mit geplanten Vorgängen | Weniger Laufläufe | Planen Sie Vorgänge so, dass sie täglich oder wöchentlich ausgeführt werden, anstatt kontinuierlich abzufragen. Siehe geplante Vorgänge. |
| Testen im Chat vor der Automatisierung | Vermeiden Sie verschwendete Läufe | Probieren Sie zuerst Ihre Eingabeaufforderung im Chat oder im Playground aus. Eine falsch konfigurierte Automatisierung wird wiederholt ausgeführt und verschwendet AAUs. |
| Inaktive Agenten stoppen | Beseitigt den aktiven Fluss. | Wechseln Sie zu ">", und wählen Sie "Beenden" aus. Der Agent behält seine Konfiguration bei, stoppt jedoch den gesamten aktiven Fluss. Die Kosten für den Always-On-Dienst laufen weiter, bis sie gelöscht werden. |
| Löschen nicht verwendeter Agents | Beseitigt alle Kosten | Öffnen Sie in sre.azure.com den Agent, und wechseln Sie zu "Einstellungen>Basics>Delete Agent". Alle Abrechnungen werden sofort beendet. |
Häufig gestellte Fragen
Wie berechnet der Agent AAUs aus Token?
Jedes Mal, wenn Ihr Agent Arbeit ausführt, verfolgt er die LLM-Token, die in allen vier Tokentypen verwendet werden, und misst sie mit den AAU-Raten für Ihr konfiguriertes Modell. Sie können Ihren AAU-Verbrauch unter Einstellungen>Agent-Verbrauch sehen.
Wirkt sich der von mir gewählte Anbieter auf meine Kosten aus?
Legen Sie den Modellanbieter (Anthropic, OpenAI und andere) auf Agentebene fest. Er bestimmt, welche AAU-Tarife gelten. Verschiedene Modelle weisen unterschiedliche Tarife auf. In der AAU-Tariftabelle finden Sie die aktuellen Tarife.
Welches Modell sollte ich auswählen?
Claude Opus 4.6 hat höhere AAU-Raten, produziert jedoch in der Regel gründlichere Untersuchungen mit weniger Begründungsschritten. Bei komplexen Untersuchungen von Vorfällen und der Ursachenanalyse erreicht Opus häufig eine Schlussfolgerung in weniger Toolaufrufen, wodurch die höhere Rate pro Token ausgeglichen werden kann. GPT-Modelle sind eine gute Wahl für einfachere, umfangreiche Aufgaben wie geplante Compliance-Prüfungen, bei denen Kosteneffizienz wichtiger ist als Tiefe. Sie können Ihren Modellanbieter jederzeit in den Einstellungen>"Grundlagen" ändern und Ergebnisse vergleichen.
Wird mir eine Gebühr berechnet, wenn der Agent darauf wartet, dass ich antworte?
Nein. Nur die Zeit, die der Agent aktiv für die Verarbeitung einer Aufgabe aufwendet, zählt als aktiver Fluss. Wenn der Agent nach Ihrer Genehmigung fragt und wartet, wird diese Wartezeit nicht in Rechnung gestellt.
Was zählt als aktiver Fluss?
Jedes Mal, wenn der Agent aktiv arbeitet, wird dies als aktive Bearbeitungszeit gewertet. Diese Arbeit umfasst:
- Interaktive Eingabeaufforderungen: ein Benutzer, der dem Agent eine Frage im Chat stellt
- Automatisierung: geplante Aufgaben, Pläne zur Reaktion auf Vorfälle oder andere automatisierte Trigger
- Asynchrone Vorgänge: Hintergrunduntersuchungen, Berichtsgenerierung oder Wartungsaufgaben
In allen Fällen misst der Agent die verbrauchten Tokens als AAUs.
Was geschieht, wenn ich meinen Agenten stoppe?
Ein angehaltener Agent kann weder Ihre Ressourcen überwachen noch auf Prompts reagieren, aber er verursacht weiterhin die fixen Kosten für den Dauerbetrieb. Aktive Fluss-AAUs werden während des Anhaltens nicht verbraucht. Um Ihren Agent zu beenden, wechseln Sie zu Einstellungen>Basics und wählen Sie Stop. Um den Vorgang fortzusetzen, wählen Sie "Start " auf derselben Seite aus. Um die Abrechnung vollständig zu beenden, löschen Sie den Agenten.
Kann ein Agent mehrere Workloads verarbeiten?
Ja. Ein einzelner Agent kann mehrere Ressourcen innerhalb des konfigurierten Bereichs überwachen. Die Konsolidierung von Workloads unter einem Agenten reduziert die Dauerbetriebskosten im Vergleich zur Bereitstellung separater Agenten.
Gibt es eine kostenlose Stufe?
Nein. Azure-SRE-Agenten-Gebühren beginnen mit der Erstellung des Agenten. Die aktuellen Preise finden Sie im Azure-Preisrechner .
Ist die Preisgestaltung in allen Regionen gleich?
Überprüfen Sie den Azure-Preisrechner auf aktuelle Preise in Ihrer Region.