Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Saiba como funciona a cobrança do Agente SRE do Azure e o que esperar em sua fatura do Azure.
Como funciona a cobrança
Azure encargos do Agente SRE são baseados em Azure Agent Units (AAUs), uma medida padronizada do processamento agente usado em todos os agentes de Azure predefinidos. Sua fatura mensal combina dois tipos de encargos.
Fluxo sempre ativo (custo fixo)
Ao criar um agente, você paga uma taxa fixa desde que o agente exista:
| Componente | Rate |
|---|---|
| Fluxo Always On | 4 AAUs por cada hora de trabalho do agente |
O fluxo always-on não significa que o agente esteja processando ativamente o trabalho. Ele representa o custo base de manter o seu agente provisionado e disponível. A cobrança "always-on" continua desde a criação do agente até que o agente seja excluído.
Fluxo ativo (custo variável)
Sempre que o agente funciona - se um usuário faz uma pergunta interativamente, uma automação dispara uma tarefa ou uma operação assíncrona é executada em segundo plano - o agente consome AAUs de fluxo ativo. Sempre que o agente estiver processando ativamente conta como fluxo ativo, independentemente de como o trabalho foi iniciado.
Como os tokens se tornam AAUs
Sempre que o agente funciona, ele consome tokens LLM. Cada tipo de token é medido separadamente à taxa mostrada na tabela a seguir.
| Tipo de token | O que é medido |
|---|---|
| Input | Tokens enviados para o modelo (prompts, resultados da ferramenta, contexto) |
| Output | Tokens gerados pelo modelo (respostas, raciocínio) |
| Leitura de cache | Tokens fornecidos a partir do cache de solicitações (contexto repetido) |
| Gravação em cache | Tokens gravados no cache para reutilização futura |
As suas AAUs totais de fluxo ativo para uma tarefa = a soma das AAUs em todos os quatro tipos de tokens.
Taxas de AAU por modelo
Número de AAUs consumidas por 1 milhão de tokens:
| Modelo | Entrada | Saída | Leitura de cache | Gravação em cache |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAUs | 500 AAUs | 10 AAUs | 125 AAUs |
| GPT 5.3 Codex | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
| GPT 5.2 | 35 AAUs | 280 AAUs | 3.5 AAUs | 0 AAUs |
As taxas são por 1 milhão de tokens.
Note
Azure pode adicionar mais modelos e provedores no futuro. Azure define as taxas de AAU e pode atualizá-las à medida que novos modelos são lançados.
Detalhes principais:
- Somente o tempo de processamento conta. O tempo gasto pelo agente aguardando sua resposta não é cobrado como fluxo ativo.
- O fluxo ativo é redefinido mensalmente. O contador de consumo da AAU é zerado no início de cada mês do calendário.
- Defina o provedor no nível do agente. Configure o provedor de modelo (Anthropic, OpenAI e outros) nas configurações do agente. O modelo correspondente determina suas taxas de AAU.
Fluxo ativo por tipo de tarefa
O número de tokens que você usa - e as AAUs que você paga - depende de quão complexa é a tarefa. Tarefas mais complexas precisam de mais etapas de raciocínio llm, chamadas de ferramenta e processamento de dados, para que usem mais tokens.
Veja como o uso de token se traduz em AAUs para cenários comuns:
| Scenario | Tokens de entrada | Tokens de saída | Leitura de cache | Gravação em cache | Claude Opus 4.6 AAUs | GPT 5.3 Codex AAUs | Exemplo |
|---|---|---|---|---|---|---|---|
| Pergunta rápida | ~20 mil | ~2 mil | ~15 mil | ~5K | ~3.8 | ~1.3 | "Mostre-me alertas recentes" |
| Investigação de incidentes | ~200 mil | ~15 mil | ~150 mil | ~50K | ~35.3 | ~11,7 | Incidente automatizado do Azure Monitor |
| Remediação completa | ~500 mil | ~40 mil | ~400 mil | ~100 mil | ~86,5 | ~30.1 | Diagnosticar e corrigir a falha na implantação |
Como funciona a matemática (exemplo de Claude Opus 4.6 – pergunta rápida):
| Tipo de token | Tokens | Taxa por 1M | AAUs |
|---|---|---|---|
| Entrada | 20 K | 100 | 2.0 |
| Saída | 2 mil | 500 | 1.0 |
| Leitura de cache | 15 mil | 10 | 0.15 |
| Gravação em cache | 5K | 125 | 0.625 |
| Total | 3.775 AAUs |
Dica
Para manter os custos de fluxo ativo previsíveis, defina um limite mensal de alocação de AAU em Configurações>Consumo do agente.
Monitorar seus custos
No portal do Agente SRE
Vá para Configurações>consumo do Agente para exibir seu uso:
- Limite mensal de AAU: sua alocação de fluxo sempre ativa e ativa combinada com um botão para ajustá-lo
- Consumo total de fluxo ativo: gráfico de rosca quebrando o uso por tipo de thread (Chats, Incidentes, Tarefas Agendadas, Gatilhos)
- Consumo de fluxo ativo diário: gráfico de barras empilhadas mostrando o uso de AAU por dia, codificado por cor por tipo
- Consumo por thread: tabela listando cada thread com seu custo, tipo e status AAU
Para obter um passo a passo completo, consulte Monitorar o uso do agente.
Definir um limite de gastos de fluxo ativo
Selecione Alterar alocação de AAU para definir um limite de AAU de fluxo ativo mensal (mínimo de 500, máximo de 1.000.000 AAUs). Esse limite se aplica somente ao fluxo ativo – a cobrança sempre ativa continua desde que o agente exista.
- Quando o agente atinge o limite de fluxo ativo, ele fica indisponível para chat e ações até o próximo mês. As cobranças contínuas continuam pelo resto do mês.
- Você pode aumentar ou diminuir a alocação a qualquer momento.
- Os aumentos entrarão em vigor imediatamente - se você elevar o limite acima do consumo atual, o chat e as ações serão retomados imediatamente.
- As reduções entrarão em vigor no próximo mês. Até lá, o agente é executado somente no fluxo sempre ativado.
Impacto na cobrança por ação
| Ação | Fluxo ativo | Always-on | Para retomar no próximo mês |
|---|---|---|---|
| Definir limite de orçamento (limite de ocorrência) | Parada | Ainda sendo cobrado | Redefine automaticamente no início do mês |
| Parar agente | Parada | Ainda sendo cobrado | Selecione Iniciar manualmente no Conceitos Básicos> deConfigurações |
| Excluir agente | Parada | Parada | Criar um novo agente |
Em Gerenciamento de Custos do Azure
Para detalhar as divisões de cobrança em vários agentes e recursos, use Gerenciamento de Custos do Azure no portal Azure.
Dicas de otimização de custos
| Estratégia | Impacto | Como fazê-lo |
|---|---|---|
| Adicionar contexto ao seu agente | Menos tokens desperdiçados | Adicione habilidades, conhecimento e documentos para que o agente permaneça fundamentado e conciso. A memória persistente de interações passadas melhora a eficiência ao longo do tempo. |
| Filtrar incidentes com planos de resposta | Trabalho menos desnecessário | Use planos de resposta para filtrar Azure Monitor alertas por severidade, serviço ou palavra-chave – o agente investiga apenas incidentes correspondentes. |
| Trabalho em lote com tarefas agendadas | Menos execuções | Agende tarefas a serem executadas diariamente ou semanalmente em vez de sondar continuamente. Consulte tarefas agendadas. |
| Testar no chat antes de automatizar | Evita corridas desperdiçadas | Experimente seu prompt no chat ou no Playground primeiro. Uma automação mal configurada é executada repetidamente e desperdiça AAUs. |
| Parar agentes inativos | Elimina o fluxo ativo | Vá para As Noções Básicas de Configurações> e selecione Parar. O agente mantém sua configuração, mas interrompe todo o fluxo ativo. O custo de operação contínua continua até ser excluído. |
| Excluir agentes não utilizados | Elimina todos os custos | Em sre.azure.com, abra o agente e vá para oagente de Exclusão de Noções BásicasdeConfigurações>>. Toda a cobrança é interrompida imediatamente. |
Perguntas frequentes
Como o agente computa AAUs a partir de tokens?
Sempre que o agente executa o trabalho, ele rastreia os tokens LLM consumidos em todas as quatro categorias de tokens e os mede nas taxas de AAU do modelo configurado. Você pode ver seu consumo de AAU em Configurações>Consumo do Agente.
O provedor escolhido afeta meus custos?
Defina o provedor de modelo (Anthropic, OpenAI e outros) no nível do agente. Ele determina quais taxas de AAU se aplicam. Modelos diferentes têm taxas diferentes. Consulte a tabela de taxas de AAU para obter as taxas atuais.
Qual modelo devo escolher?
Claude Opus 4.6 tem taxas de AAU mais altas, mas normalmente produz investigações mais completas com menos etapas de raciocínio. Para investigações complexas de incidentes e análise de causa raiz, o Opus geralmente chega a uma conclusão em menos chamadas de ferramenta, o que pode compensar a taxa mais alta por token. Os modelos de GPT são uma boa opção para tarefas mais simples e de alto volume, como verificações de conformidade agendadas em que a eficiência de custo importa mais do que a profundidade. Você pode alterar seu provedor de modelos a qualquer momento no Conceitos Básicos de Configurações> e comparar resultados.
Eu sou cobrado enquanto o agente aguarda minha resposta?
Não. Somente o tempo que o agente passa processando ativamente uma tarefa conta como fluxo ativo. Se o agente solicitar sua aprovação e aguardar, esse tempo de espera não será cobrado.
O que conta como fluxo ativo?
Sempre que o agente estiver ativamente realizando trabalho, isso conta como fluxo ativo. Este trabalho inclui:
- Mensagens interativas: um usuário fazendo uma pergunta ao agente no chat
- Automação: tarefas agendadas, planos de resposta a incidentes ou outros gatilhos automatizados
- Operações assíncronas: investigações em segundo plano, geração de relatórios ou tarefas de correção
Em todos os casos, o agente mede os tokens consumidos como AAUs.
O que acontece se eu cancelar meu agente?
Um agente parado não pode monitorar seus recursos nem responder a solicitações, mas ainda assim gera o custo fixo de manutenção. As AAUs de fluxo ativo não são consumidas enquanto são interrompidas. Para parar o agente, vá para As Noções Básicas de Configurações> e selecione Parar. Para retomar, selecione Iniciar na mesma página. Para interromper totalmente toda a cobrança, exclua o agente.
Um agente pode lidar com várias cargas de trabalho?
Sim. Um único agente pode monitorar vários recursos em seu escopo configurado. A consolidação de cargas de trabalho em um único agente reduz os custos contínuos em comparação com implantar agentes separados.
Há uma camada gratuita?
Não. As cobranças do Agente SRE do Azure começam a partir da criação do agente. Consulte a calculadora de preços do Azure para obter as taxas atuais.
O preço é o mesmo em todas as regiões?
Verifique a calculadora de preços do Azure quanto aos preços atuais em sua região.