Preços e cobrança para o Agente SRE do Azure

Saiba como funciona a cobrança do Agente SRE do Azure e o que esperar em sua fatura do Azure.

Como funciona a cobrança

Azure encargos do Agente SRE são baseados em Azure Agent Units (AAUs), uma medida padronizada do processamento agente usado em todos os agentes de Azure predefinidos. Sua fatura mensal combina dois tipos de encargos.

Fluxo sempre ativo (custo fixo)

Ao criar um agente, você paga uma taxa fixa desde que o agente exista:

Componente	Rate
Fluxo Always On	4 AAUs por cada hora de trabalho do agente

O fluxo always-on não significa que o agente esteja processando ativamente o trabalho. Ele representa o custo base de manter o seu agente provisionado e disponível. A cobrança "always-on" continua desde a criação do agente até que o agente seja excluído.

Fluxo ativo (custo variável)

Sempre que o agente funciona - se um usuário faz uma pergunta interativamente, uma automação dispara uma tarefa ou uma operação assíncrona é executada em segundo plano - o agente consome AAUs de fluxo ativo. Sempre que o agente estiver processando ativamente conta como fluxo ativo, independentemente de como o trabalho foi iniciado.

Como os tokens se tornam AAUs

Sempre que o agente funciona, ele consome tokens LLM. Cada tipo de token é medido separadamente à taxa mostrada na tabela a seguir.

Tipo de token	O que é medido
Input	Tokens enviados para o modelo (prompts, resultados da ferramenta, contexto)
Output	Tokens gerados pelo modelo (respostas, raciocínio)
Leitura de cache	Tokens fornecidos a partir do cache de solicitações (contexto repetido)
Gravação em cache	Tokens gravados no cache para reutilização futura

As suas AAUs totais de fluxo ativo para uma tarefa = a soma das AAUs em todos os quatro tipos de tokens.

Taxas de AAU por modelo

Número de AAUs consumidas por 1 milhão de tokens:

Modelo	Entrada	Saída	Leitura de cache	Gravação em cache
Claude Opus 4.6	100 AAUs	500 AAUs	10 AAUs	125 AAUs
GPT 5.3 Codex	35 AAUs	280 AAUs	3.5 AAUs	0 AAUs
GPT 5.2	35 AAUs	280 AAUs	3.5 AAUs	0 AAUs

As taxas são por 1 milhão de tokens.

Note

Azure pode adicionar mais modelos e provedores no futuro. Azure define as taxas de AAU e pode atualizá-las à medida que novos modelos são lançados.

Detalhes principais:

Somente o tempo de processamento conta. O tempo gasto pelo agente aguardando sua resposta não é cobrado como fluxo ativo.
O fluxo ativo é redefinido mensalmente. O contador de consumo da AAU é zerado no início de cada mês do calendário.
Defina o provedor no nível do agente. Configure o provedor de modelo (Anthropic, OpenAI e outros) nas configurações do agente. O modelo correspondente determina suas taxas de AAU.

Fluxo ativo por tipo de tarefa

O número de tokens que você usa - e as AAUs que você paga - depende de quão complexa é a tarefa. Tarefas mais complexas precisam de mais etapas de raciocínio llm, chamadas de ferramenta e processamento de dados, para que usem mais tokens.

Veja como o uso de token se traduz em AAUs para cenários comuns:

Scenario	Tokens de entrada	Tokens de saída	Leitura de cache	Gravação em cache	Claude Opus 4.6 AAUs	GPT 5.3 Codex AAUs	Exemplo
Pergunta rápida	~20 mil	~2 mil	~15 mil	~5K	~3.8	~1.3	"Mostre-me alertas recentes"
Investigação de incidentes	~200 mil	~15 mil	~150 mil	~50K	~35.3	~11,7	Incidente automatizado do Azure Monitor
Remediação completa	~500 mil	~40 mil	~400 mil	~100 mil	~86,5	~30.1	Diagnosticar e corrigir a falha na implantação

Como funciona a matemática (exemplo de Claude Opus 4.6 – pergunta rápida):

Tipo de token	Tokens	Taxa por 1M	AAUs
Entrada	20 K	100	2.0
Saída	2 mil	500	1.0
Leitura de cache	15 mil	10	0.15
Gravação em cache	5K	125	0.625
Total			3.775 AAUs

Dica

Para manter os custos de fluxo ativo previsíveis, defina um limite mensal de alocação de AAU em Configurações>Consumo do agente.

Monitorar seus custos

No portal do Agente SRE

Vá para Configurações>consumo do Agente para exibir seu uso:

Limite mensal de AAU: sua alocação de fluxo sempre ativa e ativa combinada com um botão para ajustá-lo
Consumo total de fluxo ativo: gráfico de rosca quebrando o uso por tipo de thread (Chats, Incidentes, Tarefas Agendadas, Gatilhos)
Consumo de fluxo ativo diário: gráfico de barras empilhadas mostrando o uso de AAU por dia, codificado por cor por tipo
Consumo por thread: tabela listando cada thread com seu custo, tipo e status AAU

Para obter um passo a passo completo, consulte Monitorar o uso do agente.

Definir um limite de gastos de fluxo ativo

Selecione Alterar alocação de AAU para definir um limite de AAU de fluxo ativo mensal (mínimo de 500, máximo de 1.000.000 AAUs). Esse limite se aplica somente ao fluxo ativo – a cobrança sempre ativa continua desde que o agente exista.

Quando o agente atinge o limite de fluxo ativo, ele fica indisponível para chat e ações até o próximo mês. As cobranças contínuas continuam pelo resto do mês.
Você pode aumentar ou diminuir a alocação a qualquer momento.
Os aumentos entrarão em vigor imediatamente - se você elevar o limite acima do consumo atual, o chat e as ações serão retomados imediatamente.
As reduções entrarão em vigor no próximo mês. Até lá, o agente é executado somente no fluxo sempre ativado.

Impacto na cobrança por ação

Ação	Fluxo ativo	Always-on	Para retomar no próximo mês
Definir limite de orçamento (limite de ocorrência)	Parada	Ainda sendo cobrado	Redefine automaticamente no início do mês
Parar agente	Parada	Ainda sendo cobrado	Selecione Iniciar manualmente no Conceitos Básicos> deConfigurações
Excluir agente	Parada	Parada	Criar um novo agente

Em Gerenciamento de Custos do Azure

Para detalhar as divisões de cobrança em vários agentes e recursos, use Gerenciamento de Custos do Azure no portal Azure.

Dicas de otimização de custos

Estratégia	Impacto	Como fazê-lo
Adicionar contexto ao seu agente	Menos tokens desperdiçados	Adicione habilidades, conhecimento e documentos para que o agente permaneça fundamentado e conciso. A memória persistente de interações passadas melhora a eficiência ao longo do tempo.
Filtrar incidentes com planos de resposta	Trabalho menos desnecessário	Use planos de resposta para filtrar Azure Monitor alertas por severidade, serviço ou palavra-chave – o agente investiga apenas incidentes correspondentes.
Trabalho em lote com tarefas agendadas	Menos execuções	Agende tarefas a serem executadas diariamente ou semanalmente em vez de sondar continuamente. Consulte tarefas agendadas.
Testar no chat antes de automatizar	Evita corridas desperdiçadas	Experimente seu prompt no chat ou no Playground primeiro. Uma automação mal configurada é executada repetidamente e desperdiça AAUs.
Parar agentes inativos	Elimina o fluxo ativo	Vá para As Noções Básicas de Configurações> e selecione Parar. O agente mantém sua configuração, mas interrompe todo o fluxo ativo. O custo de operação contínua continua até ser excluído.
Excluir agentes não utilizados	Elimina todos os custos	Em sre.azure.com, abra o agente e vá para oagente de Exclusão de Noções BásicasdeConfigurações>>. Toda a cobrança é interrompida imediatamente.

Perguntas frequentes

Como o agente computa AAUs a partir de tokens?

Sempre que o agente executa o trabalho, ele rastreia os tokens LLM consumidos em todas as quatro categorias de tokens e os mede nas taxas de AAU do modelo configurado. Você pode ver seu consumo de AAU em Configurações>Consumo do Agente.

O provedor escolhido afeta meus custos?

Defina o provedor de modelo (Anthropic, OpenAI e outros) no nível do agente. Ele determina quais taxas de AAU se aplicam. Modelos diferentes têm taxas diferentes. Consulte a tabela de taxas de AAU para obter as taxas atuais.

Qual modelo devo escolher?

Claude Opus 4.6 tem taxas de AAU mais altas, mas normalmente produz investigações mais completas com menos etapas de raciocínio. Para investigações complexas de incidentes e análise de causa raiz, o Opus geralmente chega a uma conclusão em menos chamadas de ferramenta, o que pode compensar a taxa mais alta por token. Os modelos de GPT são uma boa opção para tarefas mais simples e de alto volume, como verificações de conformidade agendadas em que a eficiência de custo importa mais do que a profundidade. Você pode alterar seu provedor de modelos a qualquer momento no Conceitos Básicos de Configurações> e comparar resultados.

Eu sou cobrado enquanto o agente aguarda minha resposta?

Não. Somente o tempo que o agente passa processando ativamente uma tarefa conta como fluxo ativo. Se o agente solicitar sua aprovação e aguardar, esse tempo de espera não será cobrado.

O que conta como fluxo ativo?

Sempre que o agente estiver ativamente realizando trabalho, isso conta como fluxo ativo. Este trabalho inclui:

Mensagens interativas: um usuário fazendo uma pergunta ao agente no chat
Automação: tarefas agendadas, planos de resposta a incidentes ou outros gatilhos automatizados
Operações assíncronas: investigações em segundo plano, geração de relatórios ou tarefas de correção

Em todos os casos, o agente mede os tokens consumidos como AAUs.

O que acontece se eu cancelar meu agente?

Um agente parado não pode monitorar seus recursos nem responder a solicitações, mas ainda assim gera o custo fixo de manutenção. As AAUs de fluxo ativo não são consumidas enquanto são interrompidas. Para parar o agente, vá para As Noções Básicas de Configurações> e selecione Parar. Para retomar, selecione Iniciar na mesma página. Para interromper totalmente toda a cobrança, exclua o agente.

Um agente pode lidar com várias cargas de trabalho?

Sim. Um único agente pode monitorar vários recursos em seu escopo configurado. A consolidação de cargas de trabalho em um único agente reduz os custos contínuos em comparação com implantar agentes separados.

Há uma camada gratuita?

Não. As cobranças do Agente SRE do Azure começam a partir da criação do agente. Consulte a calculadora de preços do Azure para obter as taxas atuais.

O preço é o mesmo em todas as regiões?

Verifique a calculadora de preços do Azure quanto aos preços atuais em sua região.

Comentários

Esta página foi útil?

Last updated on 2026-05-14