Azure SRE 에이전트 청구의 작동 방식과 Azure 청구서에 예상되는 사항에 대해 알아봅니다.
청구 방법
Azure SRE 에이전트 요금은 미리 빌드된 모든 Azure 에이전트에서 사용되는 에이전트 처리의 표준화된 측정값인 Azure AUS(에이전트 단위) 를 기반으로 합니다. 월별 청구서에는 두 가지 유형의 요금이 결합됩니다.
항상 활성화된 흐름 (고정 비용)
에이전트를 만들 때 에이전트가 있는 한 고정 요금을 지불합니다.
| 구성 요소 | 비용 |
|---|---|
| Always-On 흐름 | 에이전트 시간당 4 AAU |
Always-On 흐름이 활성화되어 있다고 해서 에이전트가 반드시 작업을 수행 중인 것은 아닙니다. 에이전트를 프로비전하고 사용 가능한 상태로 유지하는 기준 비용을 나타냅니다. 에이전트 생성부터 에이전트 가 삭제될 때까지 Always-On 청구가 계속됩니다.
활성 흐름(가변 비용)
에이전트가 작동할 때마다(사용자가 대화형으로 질문을 하는지 여부) 자동화에서 작업을 트리거하거나 비동기 작업이 백그라운드에서 실행되면 에이전트는 활성 흐름 AOU를 사용합니다. 에이전트가 활성 처리 중일 때마다 작업이 시작된 방법에 관계없이 활성 흐름으로 계산됩니다.
토큰이 AOU가 되는 방법
에이전트가 작동할 때마다 LLM 토큰을 사용합니다. 각 토큰 유형은 다음 표에 표시된 속도로 별도로 계량됩니다.
| 토큰 형식 | 측정한 내용 |
|---|---|
| 입력 | 모델에 전송된 토큰(프롬프트, 도구 결과, 컨텍스트) |
| Output | 모델에서 생성된 토큰(응답, 추론) |
| 캐시 읽기 | 프롬프트 캐시에서 제공되는 토큰(반복되는 컨텍스트) |
| 캐시 쓰기 | 나중에 다시 사용할 수 있도록 캐시를 프롬프트하도록 작성된 토큰 |
작업에 대한 총 활성 흐름 AOU = 네 가지 토큰 형식 모두에 대한 AOU의 합계입니다.
모델별 AAU 요금
토큰 100만 개당 사용된 AOU 수:
| 모델 | 입력 | 출력 | 캐시 읽기 | 캐시 쓰기 |
|---|---|---|---|---|
| 클로드 작품 4.6 | 100 AAU | 500 AAU | 10 AAU | 125 AAU |
| GPT 5.3 Codex | 35 AAU | 280 AAU | 3.5 AAU | 0AU |
| GPT 5.2 | 35 AAU | 280 AAU | 3.5 AAU | 0AU |
요금은 토큰 100만 개당입니다.
참고
Azure 나중에 더 많은 모델 및 공급자를 추가할 수 있습니다. Azure AAU 요금을 설정하고 새 모델이 릴리스될 때 업데이트할 수 있습니다.
주요 세부 정보:
- 처리 시간만 계산됩니다. 에이전트가 응답을 기다리는 데 소요되는 시간은 활성 흐름으로 청구되지 않습니다.
- 활성 흐름은 매월 다시 설정됩니다. AAU 사용 카운터는 매월 초에 다시 설정됩니다.
- 에이전트 수준에서 공급자를 설정합니다. 에이전트 설정에서 모델 공급자(Anthropic, OpenAI 등)를 구성합니다. 해당 모델은 AAU 요금을 결정합니다.
작업 유형별 활성 흐름
사용하는 토큰 수와 지불하는 AOU는 작업이 얼마나 복잡한지에 따라 달라집니다. 더 복잡한 작업에는 더 많은 LLM 추론 단계, 도구 호출 및 데이터 처리가 필요하므로 더 많은 토큰을 사용합니다.
일반적인 시나리오에서 토큰 사용이 AOU로 변환되는 방법은 다음과 같습니다.
| 시나리오 | 입력 토큰 | 출력 토큰 | 캐시 읽기 | 캐시 쓰기 | 클로드 오푸스 4.6 AOU | GPT 5.3 Codex AAU | 예시 |
|---|---|---|---|---|---|---|---|
| 빠른 질문 | ~20K | ~2천 | ~15K | 약 5천 | -3.8 | ~1.3 | "최근 경고를 보여줘" |
| 인시던트 조사 | ~200K | ~15K | ~150K | ~50K | ~35.3 | ~11.7 | Azure Monitor의 자동화된 인시던트 |
| 전체 수정 | ~500K | ~40K | ~400K | ~100K | ~86.5 | ~30.1 | "실패한 배포 진단 및 수정" |
수학 작동 방식(클로드 오푸스 4.6 예제 - 빠른 질문):
| 토큰 형식 | 토큰 | 1M당 요율 | AAUs |
|---|---|---|---|
| 입력 | 20K | 100 | 2.0 |
| 출력 | 2K | 500 | 1.0 |
| 캐시 읽기 | 15K | 10 | 0.15 |
| 캐시 쓰기 | 5K | 125 | 0.625 |
| 총 | 3.775 AOU |
팁 (조언)
활성 흐름 비용을 예측 가능하게 유지하려면 설정>에이전트 사용량에서 월별 AAU 할당 제한을 설정합니다.
비용 모니터링
SRE 에이전트 포털에서
설정>에이전트 사용량으로 이동하여 사용량을 확인합니다.
- 월별 AAU 제한: 조정 단추가 있는 결합된 Always-On 및 활성 흐름 할당
- 총 활성 흐름 사용: 도넛형 차트에서 스레드 유형별 사용량(채팅, 인시던트, 예약된 작업, 트리거)
- 일일 활성 흐름 사용: 일일 AAU 사용량을 보여 주는 누적 가로 막대형 차트, 유형별로 색으로 구분
- 스레드별 사용: AAU 비용, 유형 및 상태가 있는 모든 스레드를 나열하는 테이블
전체 연습은 에이전트 사용 모니터링을 참조하세요.
활성 흐름 지출 한도 설정
AAU 할당 변경을 선택하여 월별 활성 흐름 AAU 제한(최소 500, 최대 1,000,000AOU)을 설정합니다. 이 제한은 활성 흐름에만 적용됩니다. 에이전트가 있는 한 항상 켜기 청구가 계속됩니다.
- 에이전트가 활성 흐름 제한에 도달하면 다음 달까지 채팅 및 작업에 사용할 수 없게 됩니다. 상시 요금은 해당 월의 나머지 부분에 대해 계속됩니다.
- 언제든지 할당을 늘리거나 줄일 수 있습니다.
- 증가는 즉시 적용됩니다 .
- 감소는 다음 달에 적용됩니다. 그때까지 에이전트는 Always-On 흐름에서만 실행됩니다.
행동별 청구 영향
| 조치 | 활성 흐름 | 항상 사용 | 다음 달에 다시 시작하려면 |
|---|---|---|---|
| 예산 한도 설정 (적중 한도) | 중지 | 청구가 계속됨 | 월초에 자동으로 다시 설정 |
| 에이전트 중지 | 중지 | 청구가 계속됨 | 설정>기본 사항에서 수동으로 시작 선택 |
| 에이전트 삭제 | 중지 | 중지 | 새 에이전트 만들기 |
Azure Cost Management
여러 에이전트 및 리소스에 대한 자세한 청구 분석은 Azure 포털에서 Azure Cost Management 사용합니다.
비용 최적화 팁
| 전략 | 영향 | 이 작업을 수행하는 방법 |
|---|---|---|
| 에이전트에 컨텍스트 추가 | 낭비된 토큰 감소 | 에이전트가 신뢰성을 유지하고 간결하게 할 수 있도록 기술, 지식 및 문서를 추가합니다. 과거 상호 작용의 영구 메모리는 시간이 지남에 따라 효율성을 향상시킵니다. |
| 응답 계획을 사용하여 인시던트 필터링 | 덜 불필요한 작업 | 응답 계획을 사용하여 심각도, 서비스 또는 키워드별로 Azure Monitor 경고를 필터링합니다. 에이전트는 일치하는 인시던트만 조사합니다. |
| 예약된 작업을 사용하여 일괄 처리 작업 | 실행 횟수 감소 | 작업을 지속적으로 폴링하는 대신 매일 또는 매주 실행되도록 예약합니다. 예약된 작업을 참조하세요. |
| 자동화하기 전에 채팅에서 테스트 | 낭비되는 실행을 방지합니다. | 먼저 채팅 또는 플레이그라운드에서 프롬프트를 사용해 보세요. 잘못 구성된 자동화는 반복적으로 실행되고 AOU를 낭비합니다. |
| 유휴 에이전트를 중지하십시오 | 활성 흐름을 제거합니다. | 설정>기본 사항으로 이동하고 중지를 선택합니다. 에이전트는 구성을 유지하지만 모든 활성 흐름을 중지합니다. Always-on 기능의 비용은 삭제할 때까지 계속 발생합니다. |
| 사용하지 않는 에이전트 삭제 | 모든 비용 제거 | sre.azure.com 에이전트를 열고 설정>기본 사항>삭제 에이전트로 이동합니다. 모든 청구는 즉시 중지됩니다. |
자주 묻는 질문
에이전트는 토큰에서 AOU를 어떻게 계산하나요?
에이전트가 작업을 수행할 때마다 네 가지 토큰 유형에서 사용된 LLM 토큰을 추적하고, 구성된 모델에 대한 AAU 속도로 측정합니다. 설정> 에이전트 사용량에서 AAU사용량을 확인할 수 있습니다.
선택한 공급자가 내 비용에 영향을 주나요?
에이전트 수준에서 모델 공급자(Anthropic, OpenAI 등)를 설정합니다. 어떤 AAU 요금이 적용되는지 결정합니다. 다른 모델에는 다른 속도가 있습니다. 현재 요금에 대한 AAU 요금 테이블을 참조하세요.
어떤 모델을 선택해야 하나요?
Claude Opus 4.6은 AAU 비율이 높지만 일반적으로 추론 단계가 적은 보다 철저한 조사를 생성합니다. 복잡한 인시던트 조사 및 근본 원인 분석의 경우 Opus는 종종 더 적은 수의 도구 호출에서 결론에 도달하여 토큰당 더 높은 속도를 상쇄할 수 있습니다. GPT 모델은 비용 효율성이 깊이보다 중요한 예약된 규정 준수 검사와 같은 더 간단하고 대량의 작업에 적합합니다. 설정> 기본 사항에서 언제든지 모델 공급자를 변경하고 결과를 비교할 수있습니다.
에이전트가 응답을 기다리는 동안 요금이 청구되나요?
아니요. 에이전트가 작업을 적극적으로 처리하는 데 소요되는 시간만 활성 흐름으로 계산됩니다. 에이전트가 승인을 요청하고 기다리는 경우 해당 대기 시간은 청구되지 않습니다.
활성 흐름으로 계산되는 항목은 무엇인가요?
에이전트가 작업을 적극적으로 수행할 때마다 활성 흐름으로 계산됩니다. 이 작업에는 다음이 포함됩니다.
- 대화형 프롬프트: 채팅에서 에이전트에 질문을 하는 사용자
- 자동화: 예약된 작업, 인시던트 응답 계획 또는 기타 자동화된 트리거
- 비동기 작업: 백그라운드 조사, 보고서 생성 또는 수정 작업
모든 경우에 에이전트는 소비된 토큰을 AAU로 측정합니다.
에이전트를 중지하면 어떻게 되나요?
중지된 에이전트는 리소스를 모니터링하거나 프롬프트에 응답할 수 없지만 고정된 상시 사용 비용이 발생합니다. 활성 흐름 AAU는 중지되어 있는 동안 사용되지 않습니다. 에이전트를 중지하려면 설정>기본 사항 으로 이동하고 중지를 선택합니다. 다시 시작하려면 같은 페이지에서 시작을 선택합니다. 모든 청구를 완전히 중지하려면 에이전트를 삭제합니다.
한 에이전트가 여러 워크로드를 처리할 수 있나요?
예. 단일 에이전트는 구성된 범위 내에서 여러 리소스를 모니터링할 수 있습니다. 하나의 에이전트로 워크로드를 통합하면 별도의 에이전트를 배포하는 것에 비해 항상 비용이 절감됩니다.
무료 계층이 있나요?
아니요. Azure SRE 에이전트 요금은 에이전트 생성 시 시작됩니다. 현재 요금에 대한 Azure 가격 계산기를 참조하세요.
모든 지역에서 가격이 동일합니까?
해당 지역의 현재 가격 책정에 대한 Azure 가격 계산기를 확인합니다.