Azure SRE 에이전트를 사용하여 작업 예약

Tip

예약된 작업은 다음과 같은 이점을 제공합니다.

  • 사전 모니터링이 반응형 대시보드를 대체하기 때문에 사용자가 알아차리기 전에 문제 포착
  • 에이전트가 데이터 소스 간에 추론을 수행하므로, 원시 메트릭을 표시하는 대신 인사이트를 상관시키는
  • 작성하거나 유지 관리할 스크립트가 없는 자연어로 검사를 설명하도록 허용
  • 포털 또는 채팅에서 작업을 만들고, 편집하고, 관리할 수 있도록 허용

문제

운영 작업은 반복됩니다. 매일 아침 누군가가 리소스 상태를 확인합니다. 매주 월요일 누군가가 비용 데이터를 가져옵니다. 매시간 누군가가 이상을 검색합니다. 이러한 반복적인 작업은 예측 가능하고 자동화 가능한 작업으로 팀의 시간을 소비하므로 실제 문제를 조사하는 데 더 많은 시간을 할애할 수 있습니다.

기존의 모니터링은 문제를 복잡하게 만듭니다. 경고 규칙은 임계값을 위반한 발생하며, 임계값이 표시될 때까지 사용자는 이미 영향을 받습니다. 대시보드는 원시 데이터를 표시하지만 그 의미를 설명하지는 않습니다. 각 경고는 격리됩니다. CPU 경고는 10분 전에 발생한 배포에 대해 알지 못합니다. 매번 도구 간에 수동으로 상관 관계를 지정합니다.

예약된 작업의 작동 방식

에이전트는 사용자가 정의한 일정에 따라 작업을 실행합니다. 자연어로 수행하려는 작업을 설명하고 빈도를 설정하며 에이전트는 자동으로 실행을 처리합니다. 각 실행은 에이전트가 접근 방식을 계획하고, 데이터 원본, 결과 이유를 쿼리하고, 실행 가능한 요약을 생성하는 대화 스레드를 만듭니다.

이 프로세스는 스크립트를 실행하는 cron 작업이 아닙니다. 에이전트 는 커넥터, 도구, 지식메모리 를 사용하여 컨텍스트를 이해합니다. 경고 임계값에 도달하지 않았음에도 불구하고 오류율이 하루% 15% 상승하는 것을 알 수 있습니다. 스토리지 사용량이 현재 증가율로 3일 안에 할당량에 도달할 것이라는 점을 포착합니다. 어제의 배포를 오늘날의 예외에 연결합니다.

왼쪽 사이드바에서 예약된 작업을 선택하여 모든 작업을 관리합니다.

이것이 다른 이유

경고 규칙 Dashboards Cron 작업 예약된 작업
언제 임계값 초과 후 보시면 일정에 따라 귀하의 일정대로, 마감 시간 전에
표시되는 내용 단일 메트릭 원시 데이터 스크립트 출력 설명과 상관 관계가 있는 결과
컨텍스트 None 구성한 모든 항목 스크립트가 쿼리하는 내용 기준치 대비 교차 소스
행동 당신은 조사합니다. 당신은 조사합니다. 스크립트가 수행하는 작업 권장되는 다음 단계가 포함된 요약
적응 정적 규칙 정적 뷰 정적 스크립트 메모리 는 시간에 따른 패턴을 캡처합니다.

cron 작업과 달리 에이전트는 자연어를 이해합니다. 스크립트를 작성하는 대신 수행해야 하는 작업을 설명합니다. Runbook과 달리 예약된 작업은 선택한 자율성 수준으로 자동으로 실행됩니다.

이전 및 이후

이전 이후
매일 아침 수동으로 대시보드 확인 에이전트가 사전에 검사하고 요약을 게시합니다.
여러 도구에서 경고의 상관 관계를 직접 지정합니다. 에이전트는 연결된 모든 소스에서 상관 관계를 분석합니다.
사용자가 보고한 후 발견된 문제 인시던트가 되기 전에 포착된 추세
모니터링 스크립트 작성 및 유지 관리 자연어로 검사 설명
각 팀 구성원이 다르게 확인 매번 일관된 자동화된 검사
작업을 변경해야 합니까? 삭제 및 다시 생성 실행 기록이 유지된 모든 작업 편집

작업 대시보드

대시보드는 위쪽에 세 가지 주요 메트릭을 표시합니다.

Metric Description
활성 작업 현재 사용하도록 설정되고 일정에 따라 실행 중인 작업
총 작업 수 일시 중지 및 완료를 포함한 모든 작업
총 실행 수 모든 태스크에서 완료된 실행

작업 목록에는 정렬 가능한 열이 있는 각 작업이 표시됩니다.

칼럼 Description
이름 실행 기록을 보기 위해 선택한 작업 식별자
작업 상태 켜기, 끄기, 종료 또는 실패
일정 사람이 읽을 수 있는 형식(예: "매일 오전 8시")
만든 사람 작업을 만든 사용자
마지막 실행 가장 최근 실행 시간
다음 실행 예정된 실행
완료된 실행 총 성공한 실행

작업 편집

일정을 변경하거나, 지침을 업데이트하거나, 사용자 지정 에이전트를 다시 할당하거나, 실행 매개 변수를 조정하여 예약된 작업을 직접 수정합니다. 시스템은 작업의 실행 기록을 유지합니다.

편집하는 세 가지 방법

메서드 단계
도구 모음 작업 확인란을 선택한 다음 도구 모음에서 작업 편집 을 선택합니다.
행 메뉴 작업 행에서 선택한 다음, 작업 편집을 선택합니다.
실행 보기 작업 이름을 선택하여 실행 기록을 연 다음 작업 편집을 선택합니다.

편집 대화 상자가 열리고 모든 현재 값이 미리 채워진 상태로 열립니다. 필드 조합을 변경합니다.

  • 작업 이름지침: 에이전트가 수행하는 작업을 업데이트합니다.
  • 일정: 빈도, 시간 또는 사용자 지정 cron 식으로 전환합니다.
  • 응답 사용자 지정 에이전트: 다른 사용자 지정 에이전트에 다시 할당합니다.
  • 날짜 범위: 시작 날짜를 조정하거나 새 종료 날짜를 설정합니다.
  • 업데이트에 대한 메시지 그룹화: 실행당 동일한 스레드 또는 새 스레드 간에 전환합니다.
  • 실행 제한을 설정합니다. 최대 실행 수를 추가, 변경 또는 제거합니다.
  • 에이전트 자율성 수준: 자율 모드와 검토 모드 간에 전환합니다. 자치를 선택하면 정보 아이콘(️ℹ)이 나타납니다. 자율 모드 승인을 검토하려면, 에이전트 경계, AI 모델 제한 사항, 귀하의 책임 및 책임 조건을 설명하는 항목을 선택하십시오.

저장을 선택하여 변경 내용을 적용합니다.

비고

저장 버튼은 필드 중 하나 이상을 수정할 때까지 비활성화되어, 실수로 아무 작업도 수행하지 않는 업데이트가 발생하는 것을 방지합니다.

예제 사용 사례

사용 사례 에이전트가 수행하는 작업
일일 상태 검사 리소스 상태 검토, 성능 저하된 서비스 확인, 결과 보고
비용 변칙 탐지 지출을 기준선과 비교하고, 예기치 않은 증가에 플래그를 지정합니다.
보안 상태 검토 잘못된 구성, 만료된 인증서, 열린 포트 확인
배포 확인 배포 후 최근 배포된 환경이 정상적으로 작동하는지 확인합니다
SLA 보고서 주간 가용성 및 성능 요약 생성

예제 작업 프롬프트

일일 상태 검사:

리소스 그룹 prod-apps에서 모든 컨테이너 앱의 상태를 검토합니다. 지난 24시간 동안 애플리케이션이 다시 시작되었거나, 메모리 사용량이 80%를 초과하거나, 오류율이 1%를 초과하는 경우 보고합니다. 현재 오류율을 지난 주 평균과 비교합니다.

비용 이상 탐지:

내 구독에 대한 Azure 비용 데이터를 분석합니다. 오늘의 지출 비율을 7일 평균과 비교합니다. 지출이%20개 이상 증가한 리소스 그룹에 플래그를 지정합니다.

Capability 추가되는 내용
완화 조치 실행 모니터링에서 문제를 감지할 때 조치 수행
워크플로 자동화 트리거, 사용자 지정 에이전트 및 알림을 사용하여 작업 연결
알림 보내기 에이전트가 팀에 결과를 제공하는 방법
실행 모드 작업별 에이전트 자율 관리 제어
커넥터 타사 관찰 도구에 액세스