Tarification et facturation d’Azure SRE Agent

Découvrez comment fonctionne la facturation de l’Agent SRE Azure et ce qui doit être attendu sur votre facture Azure.

Comment la facturation fonctionne

Azure frais de l’agent SRE sont basés sur Azure Unités d’agent (AAU), une mesure standardisée du traitement agentique utilisé sur tous les agents prédéfinis Azure. Votre facture mensuelle combine deux types de frais.

Flux Toujours Activé (coût fixe)

Lorsque vous créez un agent, vous payez un taux fixe tant que l’agent existe :

Composant Taux
Flux Always on 4 AAUs par heure d’agent

Le flux en continu ne signifie pas que l'agent traite activement le travail. Il représente le coût de référence de la mise en service et de la disponibilité de votre agent. La facturation toujours activée continue de la création de l’agent jusqu’à ce que l’agent soit supprimé.

Flux actif (coût variable)

Chaque fois que votre agent fonctionne - qu’un utilisateur pose une question de manière interactive, une automatisation déclenche une tâche ou une opération asynchrone s’exécute en arrière-plan - l’agent consomme des unités AA de flux actif. Chaque fois que l’agent traite activement un flux, cela compte comme un flux actif, quelle que soit la façon dont le travail a été lancé.

Comment les jetons deviennent des unités AAUs

Chaque fois que votre agent fonctionne, il consomme des jetons LLM. Chaque type de jeton est mesuré séparément au taux indiqué dans le tableau suivant.

Type de jeton Ce qu’il mesure
Input Jetons envoyés au modèle (invites, résultats de l’outil, contexte)
Sortie Jetons générés par le modèle (réponses, raisonnement)
Lecture du cache Jetons fournis depuis le cache de demande (contexte répétitif)
Écriture du cache Jetons écrits pour inviter le cache à réutiliser ultérieurement

Votre total des AAUs de flux actifs pour une tâche = somme des AAUs sur les quatre types de tokens.

Taux d’AAU par modèle

Nombre d’unités AA consommées par 1 million de jetons :

Modèle Input Sortie Lecture du cache Écriture du cache
Claude Opus 4.6 100 UNITÉS AAUs 500 AAU 10 UNITÉS D’AA 125 UNITÉS AA
GPT 5.3 Codex 35 UNITÉS AA 280 UNITÉS AUTONOMES 3.5 AAU 0 UNITÉS AA
GPT 5.2 35 UNITÉS AA 280 UNITÉS AUTONOMES 3.5 AAU 0 UNITÉS AA

Les tarifs sont de 1 million de jetons.

Note

Azure peut ajouter d’autres modèles et fournisseurs à l’avenir. Azure définit les tarifs AAU et peut les mettre à jour à mesure que de nouveaux modèles sont publiés.

Détails clés :

  • Seul le nombre de temps de traitement est compté. Le temps passé par l’agent en attente de votre réponse n’est pas facturé comme flux actif.
  • Le flux actif est réinitialisé tous les mois. Votre compteur de consommation AAU est réinitialisé au début de chaque mois calendrier.
  • Définissez le fournisseur au niveau de l’agent. Configurez le fournisseur de modèles (Anthropic, OpenAI et d'autres) dans les paramètres de votre agent. Le modèle correspondant détermine vos taux d’AAU.

Flux actif par type de tâche

Le nombre de jetons que vous utilisez et les unités AA que vous payez dépend de la complexité de la tâche. Les tâches plus complexes nécessitent davantage d’étapes de raisonnement LLM, d’appels d’outils et de traitement des données, afin qu’elles utilisent davantage de jetons.

Voici comment l’utilisation du jeton se traduit par des unités AA Pour les scénarios courants :

Scénario Jetons d’entrée Jetons de sortie Lecture du cache Écriture du cache Claude Opus 4.6 Unités Automatiques d'Analyse GPT 5.3 Codex AAUs Exemple
Question rapide ~20K ~2K ~15 000 ~5K ~3.8 ~1,3 « Afficher les alertes récentes »
Enquête sur les incidents environ 200K ~15 000 ~150K ~50K ~35.3 ~11.7 Incident automatisé à partir d’Azure Monitor
Correction complète ~500K ~40K ~400K ~100K ~86.5 ~30.1 « Diagnostiquer et corriger le déploiement défaillant »

Fonctionnement des mathématiques (exemple Claude Opus 4.6 - question rapide) :

Type de jeton Jetons Taux par 1M AAUs
Input 20 000 100 2.0
Sortie 2K 500 1.0
Lecture du cache 15 000 10 0.15
Écriture du cache 5K 125 0.625
Total 3.775 UNITÉS AA

Conseil / Astuce

Pour maintenir les coûts de flux actifs prévisibles, définissez une limite d’allocation AAU mensuelle dans Paramètres>Agent de consommation.

Surveiller vos coûts

Dans le portail de l’agent SRE

Accédez à paramètres>Consommation de l'agent pour afficher votre utilisation :

  • Limite d’AAU mensuelle : votre allocation de flux toujours activée et active combinée avec un bouton pour l’ajuster
  • Consommation totale de flux actif : graphique en anneau décomposant l’utilisation par type de thread (Conversations, Incidents, Tâches planifiées, Déclencheurs)
  • Consommation quotidienne de flux actif : graphique à barres empilées montrant l’utilisation de l’AAU par jour, codée en couleur par type
  • Consommation par thread : table répertoriant chaque thread avec son coût, son type et son état AAU

Pour obtenir une procédure pas à pas complète, consultez Surveiller l’utilisation de l’agent.

Définir une limite de dépense de flux actif

Sélectionnez Modifier l’allocation AAU pour définir une limite AAU de flux actif mensuel (minimum 500, 1 000 000 unités DA maximum). Cette limite s’applique uniquement au flux actif : la facturation always-on se poursuit tant que l’agent existe.

  • Lorsque votre agent atteint la limite de flux active, il devient indisponible pour les conversations et les actions jusqu’au mois suivant. Les frais permanents continuent pour le reste du mois.
  • Vous pouvez augmenter ou diminuer l’allocation à tout moment.
  • Les augmentations prennent effet immédiatement : si vous augmentez la limite au-dessus de la consommation actuelle, les conversations et les actions reprendnt immédiatement.
  • Les diminutions prennent effet le mois prochain. Jusqu’à ce moment-là, l’agent s’exécute uniquement en mode « always-on flow ».

Impact de facturation par action

Action Flux actif Always-on Pour reprendre le mois prochain
Définir la limite budgétaire (limite atteinte) Arrêts Toujours facturé Réinitialise automatiquement au début du mois
Arrêter l’agent Arrêts Toujours facturé Sélectionner manuellement Démarrer dans paramètres>de base
Supprimer l’agent Arrêts Arrêts Créer un agent

Dans Gestion des coûts Azure

Pour obtenir des répartitions détaillées de facturation entre plusieurs agents et ressources, utilisez Gestion des coûts Azure dans le portail Azure.

Conseils d’optimisation des coûts

Stratégie Impact Comment procéder
Ajouter un contexte à votre agent Moins de jetons gaspillés Ajoutez des compétences, des connaissances et des documents pour que l’agent reste ancré et concis. La mémoire persistante des interactions passées améliore l’efficacité au fil du temps.
Filtrer les incidents avec des plans de réponse Travail moins inutile Utilisez des plans de réponse pour filtrer les alertes Azure Monitor par gravité, service ou mot clé : l’agent examine uniquement les incidents qui correspondent.
Travail par lots avec des tâches planifiées Moins d’exécutions Planifiez les tâches à exécuter quotidiennement ou hebdomadairement au lieu d’interroger en continu. Consultez les tâches planifiées.
Tester dans la conversation avant d’automatiser Permet d’éviter les exécutions superflues Essayez d’abord votre invite dans le chat ou dans le Playground. Une automatisation mal configurée s’exécute à plusieurs reprises et gaspille les AAUs.
Arrêter les agents inactifs Élimine le flux actif Accédez à Paramètres>de base , puis sélectionnez Arrêter. L’agent conserve sa configuration, mais arrête tout le flux actif. Le coût permanent se poursuit jusqu’à ce qu’il soit supprimé.
Supprimer les agents inutilisés Élimine tous les coûts Dans sre.azure.com, ouvrez l’agent et accédez à Paramètres>de base>Supprimer l’agent. Toutes les facturations s’arrêtent immédiatement.

Questions fréquemment posées

Comment l’agent calcule-t-il des AAUs à partir de jetons ?

Chaque fois que votre agent effectue un travail, il effectue le suivi des jetons LLM consommés sur les quatre types de jetons et les mesure aux tarifs AAU pour votre modèle configuré. Vous pouvez voir votre consommation AAU dansParamètres>la consommation de l'Agent.

Le fournisseur que je choisis affecte-t-il mes coûts ?

Définissez le fournisseur de modèles (Anthropic, OpenAI et d’autres) au niveau de l’agent. Il détermine les taux d’AAU qui s’appliquent. Différents modèles ont des taux différents. Consultez le tableau des tarifs de l’AAU pour connaître les tarifs actuels.

Quel modèle choisir ?

Claude Opus 4.6 a des taux d’AAU plus élevés, mais produit généralement des enquêtes plus approfondies avec moins d’étapes de raisonnement. Pour les enquêtes d’incidents complexes et l’analyse des causes profondes, Opus parvient souvent à une conclusion en moins d’appels d’outils, ce qui peut compenser le tarif par jeton plus élevé. Les modèles GPT constituent un bon choix pour des tâches plus simples et à volume élevé, telles que les vérifications de conformité planifiées, où l’efficacité des coûts est plus importante que la profondeur. Vous pouvez modifier votre fournisseur de modèles à tout moment dans Paramètres>de base et comparer les résultats.

Est-ce que je suis facturé lorsque l’agent attend que je réponde ?

Non. Seul le temps passé par l’agent à traiter activement une tâche compte comme flux actif. Si l’agent demande votre approbation et attend, ce délai d’attente n’est pas facturé.

Qu’est-ce qui compte comme flux actif ?

Chaque fois que l’agent effectue des tâches de manière active, cela est comptabilisé comme un flux actif. Ce travail comprend les éléments suivants :

  • Invites interactives : un utilisateur demandant à l’agent une question dans la conversation
  • Automatisation : tâches planifiées, plans de réponse aux incidents ou autres déclencheurs automatisés
  • Opérations asynchrones : enquêtes en arrière-plan, génération de rapports ou tâches de correction

Dans tous les cas, l’agent mesure les jetons consommés en tant qu’AAU.

Que se passe-t-il si j’arrête mon agent ?

Un agent arrêté ne peut pas surveiller vos ressources ni répondre aux prompts, mais il continue à générer le coût fixe always-on. Les unités AA de flux actif ne sont pas consommées lors de l’arrêt. Pour arrêter votre agent, accédez à Paramètres>de base , puis sélectionnez Arrêter. Pour reprendre, sélectionnez Démarrer dans la même page. Pour arrêter entièrement la facturation, supprimez l’agent.

Un agent peut-il gérer plusieurs charges de travail ?

Yes. Un seul agent peut surveiller plusieurs ressources dans son étendue configurée. La consolidation des charges de travail sous un seul agent réduit les coûts permanents par rapport au déploiement de plusieurs agents distincts.

Existe-t-il un niveau gratuit ?

Non. Les frais de l’agent Azure SRE commencent dès la création de l’agent. Consultez la calculatrice de prix Azure pour connaître les tarifs actuels.

La tarification est-elle la même dans toutes les régions ?

Consultez la calculatrice de prix Azure pour connaître la tarification actuelle dans votre région.