인시던트 대응의 중요성
- 3분
이 학습 경로의 다른 모듈에서 설명하는 모니터링의 원칙과 사례를 토대로 이제 모니터링에 문제가 표시될 때 수행할 작업을 알아봅니다. 시스템이 예상대로 작동하지 않음을 알리는 실행 가능한 경고를 수신하는 경우 해당 문제를 처리하기 위한 응답의 트리거입니다.
인시던트란?
인시던트 대응은 인시던트가 발생할 때 수행하는 작업에 관한 것이지만 정확히 인시던트를 구성하는 것은 무엇인가요? 대답은 주관적일 수 있습니다. 모든 엔지니어도 인시던트가 무엇인지에 대해 동의하지 않습니다. 여러 산업 및 조직에서 질문을 하면 다양한 답변을 얻을 수 있습니다.
일부는 고객에게 영향을 주는지 여부에 관계없이 모든 중단을 인시던트로 레이블을 지정합니다. 이 모듈의 컨텍스트에서 인시던트가 서비스 중단으로 정의된다는 데 동의할 수 있습니다. 이는 사용자가 사용하는 서비스를 사용하는 데 영향을 주는 발생 또는 조건입니다. 예를 들어 시스템이 다운되거나 고객에게 영향을 주는 방식으로 오작동하는 경우가 있습니다.
인시던트 대응이란?
모든 문제를 방지하는 것은 칭찬할 만하지만 불가능한 목표입니다. 문제가 발생하므로 최종 사용자에게 미치는 영향을 제한하고 작업을 가능한 한 빨리 정상으로 되돌리는 계획이 필요합니다.
핵심은 반응보다는 긴급하게 대응 하는 것입니다. 반응은 장기적인 효력을 고려하지 않고, 현재 순간에 근거를 둔 더 충동적인 경향이 있습니다. 대응은 면밀하고, 체계적이며, 정보를 기반으로 합니다.
인시던트 대응 방법은 다음에서의 효과를 결정합니다.
- 무슨 일이 일어나고 있는지 이해합니다(문제 진단).
- 문제 심사(긴급도 확인) 및 우선 순위 지정
- 올바른 리소스를 사용하여 문제를 완화합니다.
- 문제에 대해 이해 관계자와 의사 소통.
인시던트를 수정한 후에는 인시던트 후 검토 프로세스를 통해 인시던트로부터 알아볼 수 있습니다. 중요한 주제이며, 별도의 모듈로 다룰 정도로 중요한 논의 대상입니다.
인시던트 응답 성능 측정
"복구 시간", "수정할 시간" 또는 "복원 시간"으로 다양하게 정의된 약어 TTR에 익숙할 수 있습니다. 이러한 모든 변형은 서비스를 다시 고객의 기대치를 충족하는 상태로 되돌리는 데 걸리는 시간이라는 동일한 개념을 나타냅니다.
다른 프레임워크는 이 개념에 대해 서로 다른 이름을 사용합니다. DORA의 현재 지침은 5개의 소프트웨어 배달 성능 메트릭 중 하나인 실패한 배포 복구 시간을 나타냅니다. 팀이 프로덕션 문제를 일으키는 실패한 배포에서 얼마나 빨리 복구할 수 있는지를 측정하여 인시던트 대응 기능의 가장 강력한 지표 중 하나입니다.
이 메트릭은 인시던트에 대응할 때 팀이 얼마나 잘 수행하고 있는지 측정하는 한 가지 방법입니다. 서비스를 더 빨리 복원할수록 중단 또는 성능 저하된 서비스가 사용자에게 미치는 영향이 줄어듭니다.
조직에서 인시던트 대응을 얼마나 잘 처리하고 있는지 아는 것이 중요합니다. DORA의 연구는 복구 성능과 전반적인 소프트웨어 배달 성능 간에 강력한 관계를 계속 보여주고 있습니다. 벤치마크 밴드를 고정 대상으로 처리하는 대신 복구 시간을 사용하여 시간에 따른 서비스를 비교하고, 응답 프로세스에서 병목 상태를 식별하고, 개선 사항이 작동하는지 여부를 측정합니다.
강력한 인시던트 대응 사례를 가진 팀은 성능이 낮은 동료보다 빠르게 복구되며 전반적으로 더 강력한 배달 성능과 해당 속도를 결합하는 경향이 있습니다. 적절한 모니터링, 명확한 소유권, 실행된 응답 계획 및 자동화는 모두 복구 시간을 줄이는 데 도움이 될 수 있습니다.
강력한 인시던트 대응 사례를 가진 팀이 나머지 팀보다 훨씬 빠르게 복구하는 이유는 무엇인가요? 부분적으로는 엘리트 조직은 상황이 불가피하게 잘못될 경우를 대비해 훌륭한 기초 대응 계획을 마련하는 것의 중요성을 잘 알고 있기 때문입니다.
이 모듈을 진행하면서 인시던트 특성과 수명 주기에 대해 알아보고 해당 지식을 사용하여 고유한 기본 계획을 만드는 방법을 알아봅니다.
지식 점검
피드백
이 페이지가 도움이 되었나요?
No
이 항목에 대한 도움이 필요하세요?
Ask Learn을 사용하여 이 주제를 명확히 설명하거나 안내하고 싶으신가요?