Blameless postmortem canvas template

블레이멀리스 포스트모템 캔버스

이 "비난 없는" 사후 분석 템플릿은 프로덕션에서 발생한 사고에 대한 정보를 수집하는 데 도움을 줍니다.

이 "비난없는" 사후 검토 템플릿은 프로덕션에서 발생한 사건에 대한 정보를 수집하는 데 도움이 됩니다. 이 프로세스를 따르면 사고에 기여한 엔지니어들이 자신의 행동에 대해 자세히 설명할 수 있습니다.

  • 그들이 언제 어떤 행동을 했는지

  • 어떤 효과를 관찰했는지,

  • 기대했던 바,

  • 그들이 세운 가정,

  • 사건들이 발생한 순서에 대한 이해

  • 처벌이나 보복에 대한 두려움 없이 이 상세한 설명을 제공할 수 있습니다.

블레임리스 사후 검토에는 다음 섹션이 포함됩니다.

단계 1: 회의 전 요약 (미리 작성)

현재 알려진 사항과 이에 대한 고객의 영향을 중심으로 이슈에 대한 높은 수준의 요약을 제공합니다. 한두 문장으로 유지하세요.

2 단계: 대략적인 타임라인 (회의 전에 미리 작성)

이슈의 대략적인 타임라인. 이슈의 진행 속도에 따라 이 타임라인은 몇 분에서 몇 시간, 몇 일에 이를 수도 있습니다. 긴급 상황에서 팀의 응답 시간을 향상시키는 데 주된 초점이 있다면, 이를 초 단위로 줄이고자 할 것입니다.

타임라인을 기록할 때는 다음을 반드시 포함하세요:

  • 이슈가 보고된 시점과 보고자/프로세스

  • 어떤 조치가 취해졌는지

  • 팀 내외로 커뮤니케이션을 할 때

해결 아이디어

  • 이슈를 논의할 때, 이슈 작업에 참여한 모든 사람을 초대하세요. 여기에는 운영 지원 팀뿐만 아니라 참여했을 수 있는 고객 지원 팀 구성원도 포함됩니다.

  • 요약을 검토하고, 타임라인을 검토하여 누락된 부분을 추가한 다음, 개선 아이디어로 넘어가세요.

  • 이 질문들은 팀이 문제를 주도적으로 해결할 수 있도록 돕기 위해 만들어졌습니다. 팀의 통제 밖이라고 느껴지는 몇몇 이슈들이 있습니다(데이터 센터 전원 차단 등). 하지만 그런 상황에서도 팀은 재난에 대한 대응을 개선할 수 있습니다.

3단계: 감지 – 이 문제 또는 이와 같은 문제를 조기에 어떻게 감지할 수 있을까요?

이 문제 또는 매우 유사한 문제가 다시 발생할 것을 가정합니다. 지원 팀이 고객보다 먼저 이 문제를 더 빠르게 감지하여 찾아내는 방법은 무엇인가요?

4단계: 리액션 – 이러한 이슈에 대한 우리의 반응을 어떻게 개선할까요?

이슈가 보고되었다고 가정하세요. 반응이 얼마나 빨랐나요? 문제를 누군가에게 보게 하는 동안 사람들이 이메일을 돌리며 몇 분이 낭비되었나요?

다음에 이 이슈가 발생했을 때, 팀이 더 신속하거나 체계적으로 반응할 수 있는 방법은 무엇인가요?

5단계: 빠른 해결 – 출혈을 더 빨리 멈추려면 어떻게 해야 하나요?

이런 일이 다시 발생했을 때, 문제의 영향을 줄이기 위해 고객에게 제공할 수 있는 준비된 해결책이 있나요?

만약 이 문제가 시간이 지남에 따라 악화되는 것이라면 (예: DDOS 공격), 근본 원인을 파악하는 동안 급히 문제를 해결할 수 있는 방법이 있습니까?

6단계: 이슈의 미래 영향을 예방하거나 줄이는 방법은 무엇인가요?

포스트모텀에서 팀이 묻는 유일한 질문일 때가 많습니다. 중요한 질문이므로 여기에서 많은 시간을 할애해야 합니다. 그러나 문제를 예방하는 방법만 물어보는 것에만 그친다면, (문제를 감지하고 대응하거나 빠르게 해결하는 방법처럼) 당신의 통제 하에 있는 것들에 대한 책임을 벗어날 수 있게 됩니다.

아이디어를 브레인스토밍할 때 기술적인 해결책에만 국한되지 마세요. 더 나은 모니터링, 더 나은 커뮤니케이션 경로, 더 나은 교육, 고객 지원 인력이 제작 지원 인력을 이름으로 알도록 하는 등.

7단계: 기타 위험 영역 – 같은 취약성을 공유하는 다른 영역은 무엇입니까?

모든 이슈는 시스템의 약점을 나타내는 힌트입니다. 발견한 각 이슈에 대해 그림자 속에서 발견되지 않은 이슈가 수십 개씩 숨어 있을 가능성이 큽니다.

마치 부엌에서 쥐를 본 것 같은 느낌이죠. “마우스” 문제가 아니라 “쥐” 문제가 있습니다.

시스템의 다른 부분들도 같은 디자인 가정을 공유하거나 경우에 따라서는 동일한 코드를 사용하는 경우가 있을 것입니다 (아무도 코드를 복사/붙여넣기하지는 않겠지만).

몇 분 동안 비슷한 방식으로 취약할 수 있는 다른 장소에 대해 브레인스토밍해보세요.

팀이 스트레스를 받고 과로할 때, 이 단계를 생략할 것입니다. 제가 생각하기에 팀에게 프로액티브한 사고방식을 제공하고 미래의 문제 발생을 줄이기 위해 묻는 것이 가장 중요한 질문입니다.

8단계: 다음 단계 (액션)

문제가 어떻게 감지되고, 반응하며, 빠르게 수정되고, 예방할 수 있는지를 개선할 수 있는 모든 가능한 사항을 식별했다면... 애플리케이션의 다른 주목할 만한 부분도 찾아 보았다면...어떤 조치를 취할지 결정하는 단계로 넘어가세요.

이들의 우선순위를 정하는 방법은 여러분의 선택에 달려 있습니다. 하지만 몇 가지 조언은 드릴 수 있어요.

회의가 끝나기 전에 실행할 각 항목에 이름과 날짜를 지정하세요.

회의에서 누군가가 행동 중 하나에 열정을 가지고 있다면, 그 행동이 가장 중요한 것이 아닌 것 같더라도 격려해 주세요.

이름과 날짜

일반적으로, 팀이 이 연습을 즐긴다는 것을 알았습니다 (회의에서 비난 없는 환경을 조성할 수 있다면). 문제를 분석하고 브레인스토밍을 통해 해결책을 찾는 것을 좋아합니다. 그러나 모두가 바쁘고 과로에 시달린다고 느낍니다. 이 회의가 해야 할 일 옆에 책임자와 날짜를 명시하지 않으면, 개선이 이루어질 가능성은 거의 없습니다.

3주 후 동일한 문제가 더 크게 발생할 때, 누군가가 "맞아, 우리가 그걸 고치려고 얘기했었지"라고 말할 것입니다. 좋지 않은 곳이다.

이를 방지하려면 그룹이 수행하려는 각 작업 옆에 이름과 날짜가 기재되어 있는지 확인하세요.

David Frink Blameless Postmortem 캔버스를 기반으로 합니다.

블레이멀리스 포스트모템 캔버스

지금 바로 이 템플릿으로 시작해 보세요.

관련 템플릿
Work Plan Thumbnail
미리보기
작업 계획 템플릿
SAFe PI Planning template thumb
미리보기
SAFe PI 계획
End of Year Team Retro
미리보기
리플렉션 아일랜드: 연말 팀 회고
All-in-one PI Planning template thumb
미리보기
올인원 PI 계획
PI Planning Thumbnail
미리보기
PI 계획 템플릿
CustomerJourneyMapTimeline-thumb-web
미리보기
고객 접점 맵 템플릿