Precios y facturación del agente de SRE de Azure

Obtenga información sobre cómo funciona la facturación del agente de SRE de Azure y qué esperar en la factura de Azure.

Cómo funciona la facturación

Azure los cargos del agente SRE se basan en Azure unidades de agente (AAUs), una medida estandarizada del procesamiento agente usado en todos los agentes de Azure creados previamente. La factura mensual combina dos tipos de cargos.

Flujo siempre activado (costo fijo)

Al crear un agente, paga una tarifa fija siempre que el agente exista:

Componente Tarifa
Flujo siempre activado 4 AAUs por hora de agente

El flujo siempre activo no significa que el agente esté procesando activamente el trabajo. Representa el costo base de mantener el agente aprovisionado y disponible. La facturación continua se aplica desde la creación del agente hasta que se elimina.

Flujo activo (costo variable)

Cada vez que el agente funciona ( si un usuario realiza una pregunta de forma interactiva, una automatización desencadena una tarea o se ejecuta una operación asincrónica en segundo plano), el agente consume AAU de flujo activo. Cada vez que el agente procesa activamente cuenta como flujo activo, independientemente de cómo se inició el trabajo.

Cómo se convierten los tokens en AAUs

Cada vez que el agente funciona, consume tokens llm. Cada tipo de token se mide por separado a la velocidad que se muestra en la tabla siguiente.

Tipo de token Qué mide
Input Tokens enviados al modelo (avisos, resultados de herramientas, contexto)
Output Tokens generados por el modelo (respuestas, razonamiento)
Lectura de caché Tokens servidos desde la caché de solicitud (contexto repetido)
Escritura en caché Tokens escritos para solicitar la memoria caché para su reutilización futura

Su flujo activo total de AAUs para una tarea = suma de AAUs en todos los cuatro tipos de tokens.

Tarifas de AAU por modelo

Número de UDA consumidas por cada millón de tokens:

Modelo Entrada Salida Lectura de caché Escritura en caché
Claude Opus 4.6 100 AAUs 500 AAUs 10 AAUs 125 AAU
GPT 5.3 Códice 35 AAUs 280 AAUs 3.5 AAUs 0 AAUs
GPT 5.2 35 AAUs 280 AAUs 3.5 AAUs 0 AAUs

Las tasas son por 1 millón de tokens.

Note

Azure podría agregar más modelos y proveedores en el futuro. Azure establece las tasas de AAU y puede actualizarlas a medida que se publiquen nuevos modelos.

Detalles clave:

  • Sólo cuenta el tiempo de procesamiento. El tiempo que el agente dedica a esperar la respuesta no se factura como flujo activo.
  • El flujo activo se restablece mensualmente. El contador de consumo de AAU se restablece al principio de cada mes natural.
  • Establezca el proveedor en el nivel de agente. Configure el proveedor de modelos (Anthropic, OpenAI y otros) en la configuración del agente. El modelo correspondiente determina las tasas de AAU.

Flujo activo por tipo de tarea

El número de tokens que usa y las AAUs que paga depende de la complejidad de la tarea. Las tareas más complejas necesitan más pasos de razonamiento de LLM, llamadas a herramientas y procesamiento de datos, por lo que usan más tokens.

Este es el modo en que el uso de tokens se traduce en AAUs para escenarios comunes:

Escenario Tokens de entrada Tokens de salida Lectura de caché Escritura en caché Claude Opus 4.6 AUS Unidades de aceleración de IA (UAA) para el modelo Codex basado en GPT 5.3" Ejemplo
Pregunta rápida ~20 000 Alrededor de 2000 Alrededor de 15 000 Alrededor de 5000 Aproximadamente 3,8 ~1.3 "Mostrar alertas recientes"
Investigación de incidentes ~200 000 Alrededor de 15 000 ~150 000 ~50K ~35.3 ~11.7 Incidente automatizado desde Azure Monitor
Corrección completa ~500 000 ~40 000 ~400 000 ~100 000 ~86.5 ~30.1 "Diagnosticar y corregir la implementación con errores"

Funcionamiento de las matemáticas (ejemplo de Claude Opus 4.6: pregunta rápida):

Tipo de token Tokens Tasa por 1 M Unidades de Asignación Autorizada (AAUs)
Entrada 20 K 100 2.0
Salida 2K 500 1.0
Lectura de caché 15 000 10 0.15
Escritura en caché 5K 125 0.625
Total 3.775 AAU

Sugerencia

Para mantener los costos de flujo activos predecibles, establezca un límite de asignación mensual de AAU en Configuración>Consumo del agente.

Supervisión de los costos

En el portal del agente de SRE

Vaya a Configuración>Consumo de agente para ver el uso:

  • Límite mensual de AAU: la asignación de flujo activa y siempre combinada con un botón para ajustarla
  • Consumo total de flujo activo: gráfico de anillos desglosando el uso por tipo de subproceso (chats, incidentes, tareas programadas, desencadenadores)
  • Consumo diario de flujo activo: gráfico de barras apiladas que muestra el uso de AAU por día, codificado por tipo
  • Consumo por subproceso: tabla que muestra cada subproceso con su costo, tipo y estado de AAU

Para ver un tutorial completo, consulte Supervisión del uso del agente.

Establecimiento de un límite de gasto de flujo activo

Seleccione Cambiar asignación de AAU para establecer un límite de AAU de flujo activo mensual (mínimo 500, máximo de 1000 000 AAU). Este límite solo se aplica al flujo activo: la facturación siempre activa continúa siempre y cuando el agente exista.

  • Cuando el agente alcanza el límite de flujo activo, deja de estar disponible para el chat y las acciones hasta el mes siguiente. Los cargos permanentes continúan durante el resto del mes.
  • Puede aumentar o disminuir la asignación en cualquier momento.
  • Los aumentos surten efecto inmediatamente: si aumenta el límite por encima del consumo actual, el chat y las acciones se reanudan inmediatamente.
  • Las disminuciones surten efecto el mes siguiente. Hasta entonces, el agente solo se ejecuta en flujo siempre activado.

Impacto en la facturación por acción

Acción Flujo activo Siempre activo Reanudar el próximo mes
Establecer el límite de presupuesto (límite alcanzado) Paradas Todavía facturado Se restablece automáticamente al principio del mes
Detener agente Paradas Todavía facturado Seleccione Inicio manualmente en Losconceptos básicos deconfiguración>.
Eliminar agente Paradas Paradas Creación de un agente

En Azure Cost Management

Para obtener desgloses de facturación detallados en varios agentes y recursos, use Azure Cost Management en el portal de Azure.

Sugerencias para la optimización de costos

Estrategia Impacto Cómo hacerlo
Añade contexto a tu agente Menos tokens desperdiciados Agregue aptitudes, conocimientos y documentos para que el agente permanezca fundamentado y conciso. La memoria persistente de las interacciones pasadas mejora la eficacia con el tiempo.
Filtrar incidentes con planes de respuesta Trabajo menos innecesario Use planes de respuesta para filtrar Azure Monitor alertas por gravedad, servicio o palabra clave: el agente solo investiga incidentes que coinciden.
Trabajo por lotes con tareas programadas Menos ejecuciones Programe tareas para que se ejecuten diaria o semanalmente en lugar de sondear continuamente. Consulte Tareas programadas.
Probar en chat antes de automatizar Evita ejecuciones desperdiciadas Pruebe el mensaje en el chat o en el área de juegos primero. Una automatización mal configurada se ejecuta repetidamente y desperdicia las AAU.
Detener agentes inactivos Elimina el flujo activo. Vaya a Configuración>Básico y seleccione Detener. El agente mantiene su configuración, pero detiene todo el flujo activo. El costo permanente continúa hasta que se elimine.
Eliminación de agentes sin usar Elimina todos los costos En sre.azure.com, abra el agente y vaya a Configuración>Básico>Eliminar agente. Toda la facturación se detiene inmediatamente.

Preguntas más frecuentes

¿Cómo calcula el agente las AAU de los tokens?

Cada vez que su agente realiza su trabajo, lleva un seguimiento de los tokens LLM consumidos en los cuatro tipos de tokens y los mide según las tarifas AAU para su modelo configurado. Puede ver su consumo de AAU en Configuración>consumo del agente.

¿El proveedor que elijo afecta a mis costos?

Establezca el proveedor de modelos (Anthropic, OpenAI y otros) en el nivel de agente. Determina qué tarifas de AAU se aplican. Los diferentes modelos tienen tasas diferentes. Consulte la tabla de tarifas de AAU para ver las tarifas actuales.

¿Qué modelo debo elegir?

Claude Opus 4.6 tiene mayores volúmenes de UAA, pero normalmente investiga de forma más exhaustivas con menos fases de razonamiento. Para las investigaciones complejas de incidentes y el análisis de la causa raíz, Opus suele llegar a una conclusión con menos invocaciones de herramientas, lo que puede compensar la mayor tasa por token. Los modelos GPT son una buena opción para tareas más sencillas y de gran volumen, como comprobaciones de cumplimiento programadas en las que la eficiencia de los costos es más importante que la profundidad. Puede cambiar el proveedor de modelos en cualquier momento en Configuración>básica y comparar los resultados.

¿Se me cobra cuando el agente está esperando que responda?

N.º Solo el tiempo que el agente dedica activamente a procesar una tarea cuenta como flujo activo. Si el agente solicita su aprobación y espera, ese tiempo de espera no se factura.

¿Qué cuenta como flujo activo?

Cualquier momento en el que el agente esté realizando trabajo se considera flujo activo. Este trabajo incluye:

  • Avisos interactivos: un usuario que pregunta al agente en el chat
  • Automatización: tareas programadas, planes de respuesta a incidentes u otros desencadenadores automatizados
  • Operaciones asincrónicas: investigaciones en segundo plano, generación de informes o tareas de corrección

En todos los casos, el agente mide los tokens consumidos como AAUs.

¿Qué ocurre si detengo mi agente?

Un agente detenido no puede supervisar los recursos ni responder a las solicitudes, pero sigue incurriendo en el costo fijo siempre activo. Las AAU de flujo activo no se consumen mientras se detienen. Para detener el agente, vaya a Configuración>Básicas y seleccione Detener. Para reanudarlo, seleccione Iniciar en la misma página. Para detener toda la facturación, elimine el agente.

¿Puede un agente controlar varias cargas de trabajo?

Sí. Un solo agente puede supervisar varios recursos dentro de su ámbito configurado. La consolidación de cargas de trabajo en un único agente reduce los costos de estar siempre activos en comparación con la implementación de agentes independientes.

¿Hay un nivel gratis?

N.º Los cargos de Azure SRE Agent empiezan a cobrarse con la creación del agente. Consulte la calculadora de precios de Azure para conocer las tarifas actuales.

¿Los precios son los mismos en todas las regiones?

Consulte la calculadora de precios de Azure para ver los precios actuales en su región.