Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Meer informatie over hoe facturering van Azure SRE Agent werkt en wat u kunt verwachten op uw Azure-factuur.
Hoe facturering werkt
Azure SRE-agentkosten zijn gebaseerd op Azure Agent Units (AAUs), een gestandaardiseerde meting van agentische verwerking die wordt gebruikt voor alle vooraf gemaakte Azure agents. Uw maandelijkse factuur combineert twee soorten kosten.
Always-on flow (vaste kosten)
Wanneer u een agent maakt, betaalt u een vast tarief zolang de agent bestaat:
| Onderdeel | Tarief |
|---|---|
| Altijd-aan-stroom | 4 AAUs per agent-uur |
Een Always-on-stroom betekent niet dat de agent continu werk aan het verwerken is. Dit vertegenwoordigt de basiskosten voor het inrichten en beschikbaar houden van uw agent. "Always-on-facturering gaat door vanaf de creatie van een agent totdat de agent wordt verwijderd."
Actieve stroom (variabele kosten)
Wanneer uw agent werkt, of een gebruiker interactief een vraag stelt, wordt een taak door een automatisering geactiveerd of wordt een asynchrone bewerking op de achtergrond uitgevoerd. De agent verbruikt actieve stroom-AAUs. Elke keer dat de agent actief bezig is met verwerken, telt als een actieve flow, ongeacht hoe het werk is gestart.
Hoe tokens AAUs worden
Telkens wanneer uw agent werkt, worden LLM-tokens gebruikt. Elk tokentype wordt afzonderlijk gemeten met de snelheid die wordt weergegeven in de volgende tabel.
| Tokentype | Wat het meet |
|---|---|
| Invoer | Tokens die naar het model worden verzonden (prompts, toolresultaten, context) |
| Output | Tokens gegenereerd door het model (antwoorden, redenering) |
| Cache lezen | Tokens die worden geleverd vanuit de promptcache (herhaalde context) |
| Schrijven in cache | Tokens die zijn geschreven om cache te vragen voor toekomstig hergebruik |
Uw totale actieve stroom-AAUs voor een taak = som van AAU's voor alle vier de tokentypen.
AAU-tarieven per model
Aantal verbruikte AAUs per 1 miljoen tokens:
| Model | Invoer | Uitvoer | Cache lezen | Schrijven in cache |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAUs | 500 AAUs | 10 AAUs | 125 AAUs |
| GPT 5.3 Codex | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
| GPT 5.2 | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
Tarieven zijn per 1 miljoen tokens.
Note
Azure kunnen in de toekomst meer modellen en providers toevoegen. Azure AAU-tarieven instelt en deze mogelijk bijwerkt wanneer er nieuwe modellen worden uitgebracht.
Belangrijke details:
- Alleen verwerkingstijd telt. De tijd die de agent besteedt aan het wachten op uw antwoord, wordt niet in rekening gebracht als actieve stroom.
- De actieve stroom wordt maandelijks opnieuw ingesteld. Uw AAU-verbruiksteller wordt aan het begin van elke kalendermaand opnieuw ingesteld.
- Stel provider in op agentniveau. Configureer de modelprovider (Anthropic, OpenAI en andere) in de instellingen van uw agent. Het bijbehorende model bepaalt uw AAU-tarieven.
Actieve stroom per taaktype
Het aantal tokens dat u gebruikt en de AAUs waarvoor u betaalt, is afhankelijk van hoe complex de taak is. Complexere taken hebben meer LLM-redeneringsstappen, hulpprogramma-aanroepen en gegevensverwerking nodig, zodat ze meer tokens gebruiken.
Het gebruik van tokens wordt als volgt omgezet in AAUs voor veelvoorkomende scenario's:
| Scenario | Invoertokens | Uitvoertokens | Cache lezen | Schrijven in cache | Claude Opus 4.6 AAUs | GPT 5.3 Codex AAUs | Voorbeeld |
|---|---|---|---|---|---|---|---|
| Snelle vraag | ~20K | ~2K | ~15K | ~5K | ~3,8 | ~1,3 | "Recente waarschuwingen weergeven" |
| Incidentonderzoek | ~200K | ~15K | ~150.000 | ~50K | ~35,3 | ~11,7 | Geautomatiseerd incident van Azure Monitor |
| Volledig herstel | ~500K | Ongeveer 40K | ~400K | ~100.000 | ~86,5 | ~30,1 | "De mislukte implementatie vaststellen en oplossen" |
Hoe de wiskunde werkt (Claude Opus 4.6-voorbeeld - snelle vraag):
| Tokentype | Tokens | Tarief per 1 miljoen | AAUs |
|---|---|---|---|
| Invoer | 20K | 100 | 2.0 |
| Uitvoer | 2K | 500 | 1.0 |
| Cache lezen | 15K | 10 | 0.15 |
| Schrijven in cache | 5K | 125 | 0.625 |
| Totaal | 3.775 AAUs |
Aanbeveling
Om de actieve stroomkosten voorspelbaar te houden, stelt u een maandelijkse AAU-toewijzingslimiet in via Instellingen>Agentverbruik.
Houd uw kosten in de gaten
In de SRE Agent-portal
Ga naar Instellingen>Het verbruik van de agent om uw gebruik weer te geven:
- Maandelijkse AAU-limiet: uw gecombineerde always-on en actieve stroomtoewijzing met een knop om deze aan te passen
- Totaal verbruik van actieve stroom: ringdiagram dat het gebruik afbreekt per threadtype (Chats, Incidenten, Geplande taken, Triggers)
- Dagelijks verbruik van actieve stroom: gestapeld staafdiagram met AAU-gebruik per dag, kleurgecodeerd op type
- Verbruik per thread: tabel met elke thread met de AAU-kosten, het type en de status
Zie Het gebruik van agents controleren voor een volledig overzicht.
Een bestedingslimiet voor actieve stromen instellen
Selecteer AAU-toewijzing wijzigen om een AAU-limiet voor een maandelijkse actieve stroom in te stellen (minimaal 500, maximum 1.000.000 AAUs). Deze limiet is alleen van toepassing op actieve stroom. De facturering blijft altijd ingeschakeld zolang de agent bestaat.
- Wanneer uw agent de limiet voor de actieve stroom bereikt, is deze niet meer beschikbaar voor chat en acties tot de volgende maand. Doorlopende kosten blijven de rest van de maand van kracht.
- U kunt de toewijzing op elk gewenst moment vergroten of verkleinen.
- Verhogingen worden onmiddellijk van kracht: als u de limiet boven het huidige verbruik verhoogt, worden chats en acties meteen hervat.
- Afnames worden volgende maand van kracht. Tot die tijd draait de agent alleen in een altijd-aan modus.
Gevolgen voor facturering per actie
| Action | Actieve stroom | Always-on | Volgende maand hervatten |
|---|---|---|---|
| Budgetlimiet instellen (limiet bereikt) | Onderbrekingen | Nog steeds gefactureerd | Wordt automatisch opnieuw ingesteld aan het begin van de maand |
| Agent stoppen | Onderbrekingen | Nog steeds gefactureerd | Handmatig Start selecteren inBasisbeginselen vaninstellingen> |
| Agent verwijderen | Onderbrekingen | Onderbrekingen | Een nieuwe agent maken |
In Azure Cost Management
Gebruik Azure Cost Management in de Azure-portal voor gedetailleerde factureringsanalyses voor meerdere agents en resources.
Tips voor kostenoptimalisering
| Strategie | Impact | Hoe kunt u het doen? |
|---|---|---|
| Context toevoegen aan uw agent | Minder verspilde tokens | Voeg vaardigheden, kennis en documenten toe, zodat de agent geaard en beknopt blijft. Permanent geheugen van eerdere interacties verbetert de efficiëntie in de loop van de tijd. |
| Incidenten filteren met reactieplannen | Minder onnodig werk | Gebruik reactieplannen om Azure Monitor waarschuwingen te filteren op ernst, service of trefwoord. De agent onderzoekt alleen incidenten die overeenkomen. |
| Batch-werk met geplande taken | Minder uitvoeringen | Plan taken om dagelijks of wekelijks uit te voeren in plaats van continu polling uit te voeren. Zie Geplande taken. |
| Testen in chat voordat u automatiseert | Vermijdt verspilde uitvoeringen | Probeer eerst uw prompt in de chat of de Speeltuin. Een onjuist geconfigureerde automatisering wordt herhaaldelijk uitgevoerd en verspilt AAU's. |
| Niet-actieve agenten uitschakelen | Elimineert actieve stroom | Ga naar>Basisinstellingen en selecteer Stoppen. De agent behoudt de configuratie, maar stopt alle actieve stroom. De kosten voor always-on worden voortgezet totdat ze zijn verwijderd. |
| Ongebruikte agents verwijderen | Elimineert alle kosten | Open in sre.azure.com de agent en ga naar de> agentBasisbeginselen>verwijderen. Alle facturering stopt onmiddellijk. |
Veelgestelde vragen
Hoe berekent de agent AAUs van tokens?
Elke keer dat uw agent taken uitvoert, worden de LLM-tokens die worden gebruikt voor alle vier de tokentypen bijgehouden en worden ze gemeten tegen de AAU-tarieven van uw geconfigureerde model. U kunt uw AAU-verbruik zien in Instellingen>Agent verbruik.
Heeft de provider die ik kies invloed op mijn kosten?
Stel de modelprovider (Anthropic, OpenAI en andere) in op agentniveau. Het bepaalt welke AAU-tarieven van toepassing zijn. Verschillende modellen hebben verschillende tarieven. Zie de AAU-tarieventabel voor huidige tarieven.
Welk model moet ik kiezen?
Claude Opus 4,6 heeft hogere AAU-tarieven, maar produceert doorgaans grondiger onderzoek met minder redeneringsstappen. Voor complexe incidentonderzoeken en hoofdoorzaakanalyse bereikt Opus vaak een conclusie in minder hulpprogramma-aanroepen, wat de hogere snelheid per token kan compenseren. GPT-modellen zijn een goede keuze voor eenvoudigere taken met een hoog volume, zoals geplande nalevingscontroles, waarbij kostenefficiëntie belangrijker is dan diepte. U kunt uw modelprovider op elk gewenst moment wijzigen inDe basisbeginselen van > en resultaten vergelijken.
Worden er kosten in rekening gebracht wanneer de agent wacht totdat ik reageer?
Nee. Alleen de tijd die de agent besteedt aan het actief verwerken van een taak, telt als actieve stroom. Als de agent om uw goedkeuring en wachttijden vraagt, wordt die wachttijd niet gefactureerd.
Wat telt als actieve stroom?
Telkens wanneer de agent actief werk doet, wordt dit beschouwd als een actieve stroom. Dit werk omvat:
- Interactieve prompts: een gebruiker die de agent een vraag stelt in de chat
- Automatisering: geplande taken, incidentresponsplannen of andere geautomatiseerde triggers
- Asynchrone bewerkingen: achtergrondonderzoeken, rapportgeneratie of hersteltaken
In alle gevallen meet de agent de geconsumeerde tokens als AAUs.
Wat gebeurt er als ik mijn agent stop?
Een gestopte agent kan uw resources niet controleren of reageren op prompts, maar er worden nog steeds vaste always-on-kosten in rekening gebracht. Actieve flow-AAUs worden niet verbruikt terwijl ze zijn gestopt. Als u uw agent wilt stoppen, gaat u naar>Basisinstellingen en selecteert u Stoppen. Als u wilt hervatten, selecteert u Start op dezelfde pagina. Als u alle facturering volledig wilt stoppen, verwijdert u de agent.
Kan één agent meerdere werkbelastingen verwerken?
Ja. Eén agent kan meerdere resources bewaken binnen het geconfigureerde bereik. Het consolideren van workloads onder één agent vermindert always-on-kosten vergeleken met het implementeren van afzonderlijke agents.
Is er een gratis niveau?
Nee. De kosten voor de Azure SRE-agent beginnen bij de aanmaak van de agent. Zie de Azure-prijscalculator voor actuele tarieven.
Zijn de prijzen in alle regio's hetzelfde?
Controleer de Azure-prijscalculator op de huidige prijzen in uw regio.