Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Saiba como funciona a faturação do Azure SRE Agent e o que esperar na sua fatura Azure.
Como funciona a faturação
Azure as cargas de agentes SRE baseiam-se em Unidades de Agente (AAUs)Azure , uma medida padronizada do processamento agente utilizada em todos os agentes Azure pré-construídos. A sua fatura mensal combina dois tipos de encargos.
Fluxo sempre ativo (custo fixo)
Quando cria um agente, paga uma taxa fixa desde que o agente exista:
| Componente | Tarifa |
|---|---|
| Fluxo contínuo | 4 AAUs por hora de agente |
Fluxo sempre ativo não significa que o agente esteja a processar ativamente o trabalho. Representa o custo base de manter o seu agente provisionado e disponível. A cobrança contínua prossegue desde a criação do agente até que este seja apagado.
Fluxo ativo (custo variável)
Sempre que o seu agente trabalha – quer um utilizador faça uma pergunta de forma interativa, uma automação desencadeie uma tarefa, ou uma operação assíncrona seja executada em segundo plano – o agente consome AAUs de fluxo ativo. Qualquer momento em que o agente está a processar ativamente conta como fluxo ativo, independentemente de como o trabalho foi iniciado.
Como os tokens se tornam AAUs
Sempre que o seu agente trabalha, consome tokens LLM. Cada tipo de token é medido separadamente à taxa apresentada na tabela seguinte.
| Tipo de token | O que mede |
|---|---|
| Input | Tokens enviados ao modelo (prompts, resultados de ferramentas, contexto) |
| Output | Tokens gerados pelo modelo (respostas, raciocínio) |
| Leitura de cache | Tokens fornecidos a partir da cache de prompt (contexto repetitivo) |
| Escrita em cache | Tokens escritos para indicar cache para reutilização futura |
O seu total de AAUs de fluxo ativo para uma tarefa = soma das AAUs em todos os quatro tipos de tokens.
Taxas AAU por modelo
Número de AAUs consumidas por 1 milhão de tokens:
| Modelo | Entrada | Output | Leitura de cache | Escrita em cache |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAUs | 500 AAUs | 10 AAUs | 125 AAUs |
| Códice GPT 5.3 | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
| GPT 5.2 | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
As taxas são por 1 milhão de tokens.
Note
O Azure pode adicionar mais modelos e fornecedores no futuro. O Azure define as taxas AAU e pode atualizá-las à medida que novos modelos forem lançados.
Detalhes principais:
- Só o tempo de processamento conta. O tempo que o agente passa à espera da sua resposta não é contabilizado como fluxo ativo.
- O fluxo ativo reinicia-se mensalmente. O seu contador de consumo de AAU reinicia no início de cada mês civil.
- Defina o fornecedor ao nível do agente. Configure o fornecedor de modelos (Anthropic, OpenAI e outros) nas definições do seu agente. O modelo correspondente determina as suas taxas AAU.
Fluxo ativo por tipo de tarefa
O número de tokens que usas – e as AAUs pelas quais pagas – depende da complexidade da tarefa. Tarefas mais complexas exigem mais passos de raciocínio do LLM, chamadas de ferramentas e processamento de dados, por isso usam mais tokens.
Eis como o uso de tokens se traduz em AAUs para cenários comuns:
| Scenario | Tokens de entrada | Tokens de saída | Leitura de cache | Escrita em cache | Claude Opus 4.6 AAUs | AAUs do Códice GPT 5.3 | Exemplo |
|---|---|---|---|---|---|---|---|
| Pergunta rápida | ~20K | ~2K | ~15K | ~5K | ~3.8 | ~1.3 | "Mostra-me alertas recentes" |
| Investigação de incidentes | ~200K | ~15K | cerca de 150 mil | ~50K | ~35,3 | ~11,7 | Incidente automatizado do Azure Monitor |
| Remediação completa | ~500K | ~40K | ~400K | cerca de 100K | ~86,5 | ~30,1 | "Diagnosticar e corrigir a implementação falhada" |
Como funciona a matemática (exemplo Claude Opus 4.6 - pergunta rápida):
| Tipo de token | Tokens | Taxa por 1M | AAUs |
|---|---|---|---|
| Entrada | 20 mil | 100 | 2.0 |
| Output | 2K | 500 | 1.0 |
| Leitura de cache | 15K | 10 | 0.15 |
| Escrita em cache | 5K | 125 | 0.625 |
| Total | 3.775 AAUs |
Sugestão
Para manter os custos de fluxo ativo previsíveis, defina um limite mensal de alocação de AAU em Definições>consumo do Agente.
Monitorize os seus custos
No portal do Agente SRE
Vá a Definições>Consumo de Agentes para ver o seu consumo:
- Limite mensal de AAU: a sua alocação combinada de fluxo sempre ligado e ativo com um botão para a ajustar
- Consumo total de fluxo ativo: gráfico de rosquinhas que detalha o uso por tipo de thread (Chats, Incidentes, Tarefas agendadas, Triggers)
- Consumo ativo diário de caudal: gráfico de barras empilhadas mostrando o uso diário de AAU, codificado por cores por tipo
- Consumo por thread: tabela que lista cada thread com o seu custo, tipo e estado AAU
Para um guia completo, veja Monitorizar uso de agentes.
Defina um limite de despesa de fluxo ativo
Selecione Alterar alocação AAU para definir um limite mensal de fluxo ativo de AAU (mínimo 500, máximo 1.000.000 AAUs). Este limite aplica-se apenas ao fluxo ativo – a faturação sempre ativa continua enquanto o agente existir.
- Quando o seu agente atinge o limite de fluxo ativo, fica indisponível para chat e ações até ao mês seguinte. As cobranças permanentes continuam durante o resto do mês.
- Pode aumentar ou diminuir a alocação a qualquer momento.
- Os aumentos têm efeito imediato – se aumentares o limite acima do consumo atual, o chat e as ações recomeçam imediatamente.
- As diminuições entram em vigor no próximo mês. Até lá, o agente funciona apenas em fluxo sempre ativo.
Impacto da faturação por ação
| Action | Fluxo ativo | Sempre ligado | A retomar no próximo mês |
|---|---|---|---|
| Definir limite orçamental (limite de atingimento) | Paragens | Ainda está faturado | Reinicia automaticamente no início do mês |
| Parar agente | Paragens | Ainda está faturado | Selecionar manualmente Iniciar em Definições>Básicas |
| Eliminar agente | Paragens | Paragens | Criar um novo agente |
In Gestão de Custos do Azure
Para análises detalhadas de faturação entre vários agentes e recursos, utilize Gestão de Custos do Azure no portal Azure.
Sugestões de otimização de custos
| Estratégia | Impacto | Como fazê-lo |
|---|---|---|
| Adicione contexto ao seu agente | Menos tokens desperdiçados | Adicione competências, conhecimentos e documentos para que o agente se mantenha com os pés no chão e conciso. A memória persistente de interações passadas melhora a eficiência ao longo do tempo. |
| Filtrar incidentes com planos de resposta | Menos trabalho desnecessário | Use planos de resposta para filtrar alertas do Azure Monitor por gravidade, serviço ou palavra-chave – o agente só investiga incidentes que correspondem. |
| Trabalho em lote com tarefas agendadas | Menos execuções | Agende tarefas diárias ou semanais em vez de consultas contínuas. Ver Tarefas agendadas. |
| Teste no chat antes de automatizar | Evita corridas desperdiçadas | Experimenta primeiro o teu prompt no chat ou no Playground. Uma automação mal configurada executa-se repetidamente e desperdiça AAUs. |
| Interromper agentes inativos | Elimina o fluxo ativo | Vai a Definições>Básicas e seleciona Parar. O agente mantém a sua configuração, mas suspende todo o fluxo ativo. O custo constante permanece até ser removido. |
| Eliminar agentes não utilizados | Elimina todos os custos | Em sre.azure.com, abre o agente e vai a Definições>Básicas>Eliminar agente. Toda a faturação para imediatamente. |
Perguntas frequentes
Como é que o agente calcula AAUs a partir de tokens?
Sempre que o seu agente realiza trabalho, acompanha os tokens LLM consumidos em todos os quatro tipos de tokens e metrifica-os às taxas AAU do seu modelo configurado. Podes ver o teu consumo de AAU em Definições>consumo do Agente.
O prestador que escolho afeta os meus custos?
Defina o fornecedor do modelo (Anthropic, OpenAI e outros) ao nível do agente. Determina quais as taxas AAU aplicáveis. Modelos diferentes têm taxas diferentes. Consulte a tabela de taxas AAU para as taxas atuais.
Que modelo devo escolher?
Claude Opus 4.6 tem taxas AAU mais elevadas, mas normalmente produz investigações mais aprofundadas com menos passos de raciocínio. Para investigações complexas de incidentes e análise de causa raiz, o Opus frequentemente chega a uma conclusão com menos chamadas de ferramenta, o que pode compensar a taxa mais elevada por token. Os modelos GPT são uma boa escolha para tarefas mais simples e de grande volume, como verificações de conformidade programadas, onde a eficiência de custos importa mais do que a profundidade. Pode mudar o seu fornecedor de modelo a qualquer momento em Definições>Básicas e comparar resultados.
Sou cobrado quando o agente está à espera da minha resposta?
Não. Apenas o tempo que o agente passa a processar ativamente uma tarefa conta como fluxo ativo. Se o agente pedir a sua aprovação e esperar, esse tempo de espera não é cobrado.
O que conta como fluxo ativo?
Qualquer momento em que o agente esteja a fazer trabalho conta como fluxo ativo. Este trabalho inclui:
- Prompts interativos: um utilizador fazendo uma pergunta ao agente no chat
- Automação: tarefas agendadas, planos de resposta a incidentes ou outros gatilhos automáticos
- Operações assíncronas: investigações em segundo plano, geração de relatórios ou tarefas de remediação
Em todos os casos, o agente mede os tokens consumidos como AAUs.
O que acontece se eu parar o meu agente?
Um agente interrompido não pode monitorizar os seus recursos nem responder a pedidos, mas ainda assim incorre no custo fixo de estar sempre ligado. As AAUs de fluxo ativo não são consumidas enquanto estão paradas. Para parar o seu agente, vá a Definições>Básicas e selecione Parar. Para continuar, selecione Iniciar na mesma página. Para parar completamente toda a faturação, apague o agente.
Será que um agente consegue lidar com múltiplas cargas de trabalho?
Yes. Um único agente pode monitorizar múltiplos recursos dentro do seu âmbito configurado. Consolidar tarefas sob um único agente reduz os custos operacionais contínuos em comparação com a instalação de agentes separados.
Existe um nível gratuito?
Não. As cobranças do Azure SRE Agent começam na criação do agente. Consulte a calculadora de preços do Azure para as taxas atuais.
O preço é igual em todas as regiões?
Consulta a calculadora de preços do Azure para os preços atuais na tua região.