Lienzo de postmortem sin culpa
Esta plantilla de Post-Mortem "sin culpas" te ayuda a reunir información sobre los incidentes que ocurrieron en producción.
Esta plantilla de Post-Mortem "sin culpas" te ayuda a recopilar información sobre los incidentes ocurridos en producción. Seguir este proceso significa que los ingenieros cuyas acciones han contribuido a un accidente pueden dar un relato detallado de:
qué acciones tomaron a qué hora,
qué efectos observaron,
expectativas que tenían,
suposiciones que habían hecho,
su comprensión del cronograma de eventos tal como ocurrieron.
y que puedan dar esta cuenta detallada sin miedo a castigos o represalias.
El postmortem Blameless incluye las siguientes secciones
Paso 1: Resumen (prellenar antes de la reunión)
Un resumen de alto nivel de la incidencia, centrándose en lo que se sabe hasta este momento y en el impacto que tuvo para el cliente. Limítalo a una o dos frases.
Paso 2: Cronograma aproximado (prellenar antes de la reunión)
Un cronograma aproximado de la incidencia. Dependiendo de lo rápido que se moviera la incidencia, este cronograma podría abarcar desde unos minutos hasta unas horas o unos días. Si tu enfoque principal es mejorar los tiempos de respuesta del equipo durante emergencias, querrás que esto se mida hasta el segundo.
Al capturar el cronograma, asegúrate de incluir:
Cuándo se reportó la incidencia y por quién/qué proceso
Qué acciones se tomaron
Cuando se estableció la comunicación dentro y fuera del equipo
Ideas de Remediación
Cuando te reúnas para discutir la incidencia, invita a todos los que trabajaron en ella. Esto incluye al equipo de soporte para la producción, así como a los miembros del equipo de atención al cliente que pudieran haber estado involucrados.
Revisa el resumen, revisa la línea de tiempo y añade las partes que falten. Luego, pasa a las ideas de remediación.
Estas preguntas están formuladas para ayudar al equipo a asumir la responsabilidad del problema. Hay algunas incidencias que parecen estar fuera del control del equipo (el centro de datos pierde energía, etc). Pero incluso en eventos como esos, el equipo aún puede mejorar su reacción al desastre.
Paso 3: Detectar – ¿Cómo detectamos este problema o un problema como este antes?
Asume que este problema o un problema muy similar ocurrirá de nuevo. ¿Cómo puede el equipo de soporte detectar este problema más rápido y encontrarlo antes de que lo haga un cliente?
Paso 4: React – ¿Cómo mejoramos nuestra reacción ante incidencias como estas?
Asume que se ha reportado la incidencia. ¿Qué tan rápida fue la reacción? ¿Se perdieron minutos mientras las personas enviaban correos intentando que alguien revisara el problema?
¿Cómo puede el equipo reaccionar más rápidamente o de manera más organizada la próxima vez que ocurra esta incidencia?
Paso 5: Solución Rápida: ¿Cómo detenemos la hemorragia más rápido?
Cuando esto vuelva a ocurrir, ¿hay un solución alternativa lista que podamos proporcionar al cliente para reducir el impacto del problema?
Si esto es algo que empeora con el tiempo (como un ataque DDoS), ¿tenemos una forma rápida de cerrar las compuertas mientras descubrimos la causa raíz?
Paso 6: Prevenir: ¿Cómo prevenimos o reducimos el impacto de incidencias similares en el futuro?
Esta es a menudo la única pregunta que los equipos hacen en un postmortem. Es una pregunta importante y deberías dedicarle mucho tiempo. Sin embargo, si te limitas a preguntar solo cómo prevenir una incidencia, te permite no asumir ninguna responsabilidad por las cosas que están bajo tu control (como la forma en que detectas, reaccionas o solucionas rápidamente una incidencia).
Mientras haces una lluvia de ideas, no te limites solo a soluciones técnicas. Mejor monitoreo, mejores vías de comunicación, mejor capacitación, asegurarse de que las personas en asistencia al cliente conozcan a las personas en asistencia de producción por su nombre, etc.
Paso 7: Otras áreas de riesgo: ¿Qué otras áreas comparten esta misma vulnerabilidad?
Cada incidencia es una pista de dónde tu sistema es débil. Es probable que, por cada incidencia que encuentres, haya docenas acechando en las sombras, aún por descubrir.
Es como si vieras un ratón en tu cocina. No tienes un problema de "ratón", tienes un problema de "ratones".
Es probable que haya otras partes del sistema que compartan los mismos supuestos de diseño o, en algunos casos, el mismo código (aunque nadie copia/pega código).
Dedica unos minutos a hacer una lluvia de ideas sobre otros lugares que sean vulnerables de manera similar.
Cuando los equipos están estresados y sobrecargados, omitirán este paso. Encuentro que esta es la pregunta más importante que hacer para lograr que el equipo tenga una mentalidad proactiva y reducir la aparición de incidencias en el futuro.
Paso 8: Próximos pasos (Acciones)
Después de haber identificado todas las cosas posibles que puedes hacer para mejorar cómo se detectan, reaccionan, corrigen rápidamente y previenen las incidencias... y haber encontrado las otras áreas de tu aplicación que necesitan atención... pasa a decidir qué acciones tomar.
La forma en que priorizas esto depende de ti. Pero tengo algunos consejos.
Consigue un nombre y una fecha para cada uno que planees ejecutar antes de salir de la reunión
Si alguien en la reunión está entusiasmado con tomar una de las acciones, anímalo a hacerlo, incluso si piensas que podría no ser lo más importante a solucionar.
Nombres y fechas
En general, he encontrado que a los equipos les gusta este ejercicio (siempre que puedas crear un ambiente sin culpas para la reunión). Les gusta analizar el problema y hacer lluvias de ideas para encontrar soluciones. Sin embargo, todos se sienten ocupados y sobrecargados de trabajo. A menos que esta reunión concluya con propietarios y fechas junto a las cosas que deben hacerse, lo más probable es que ninguna de las mejoras ocurra.
Lo que sucederá es que dentro de 3 semanas, cuando el mismo problema ocurra en producción (pero esta vez de manera más grande), alguien dirá: "oh sí, hablamos sobre arreglar eso." No es un gran lugar para estar.
Para combatir eso, simplemente asegúrate de que haya un nombre y una fecha junto a cada acción que el grupo quiera realizar.
Basado en David Frink Blameless Postmortem Canvas.
Comienza ahora mismo con esta plantilla.
Retrospectiva - Verano
Ideal para:
Retrospectivas, Metodología Agile, Reuniones
La plantilla Retrospectiva - Summer ofrece un enfoque estacional y temático para las retrospectivas, perfecto para capturar el espíritu del verano. Proporciona elementos para reflexionar sobre logros, experiencias y objetivos en medio del escenario veraniego. Esta plantilla habilita a los equipos para relajarse, recargar energías, y recalibrar sus esfuerzos para la próxima temporada. Al promover la reflexión y el rejuvenecimiento, la Retrospectiva - Verano capacita a los equipos para celebrar éxitos, aprender de los contratiempos e iniciar nuevas aventuras con renovada energía y entusiasmo de manera efectiva.
Plantilla Lean Coffee
Ideal para:
Metodología Agile, Gestión de productos, Reuniones
¿Qué hace que una reunión sea genial (además de las donas)? Es apreciar las habilidades, los recursos y el tiempo de todos haciendo el mejor uso posible de ellos. Eso es lo que está diseñado para hacer el enfoque Lean Coffee. Genial para hacer lluvias de ideas y retrospectivas en equipo, el Lean Coffee divide la reunión en tres etapas básicas: qué discutir, qué se está discutiendo y qué se ha discutido. Esta plantilla facilita la recopilación de notas adhesivas y la actualización de las columnas a medida que avanzas de tema en tema.
Plantilla de tablero Agile
Ideal para:
Metodología Agile, Reuniones, Flujos de trabajo de Agile
Parte del popular marco Agile, un Tablero Agile es una visualización que te permite sincronizar las tareas a lo largo de un ciclo de producción. El Tablero Agile se utiliza típicamente en el contexto de métodos de desarrollo Agile como Kanban y Scrum, pero cualquier persona puede adoptar la herramienta. Utilizado por desarrolladores de software y gestores de proyectos, el Tablero Agile ayuda a gestionar la carga de trabajo de manera flexible, transparente e iterativa. La plantilla Agile proporciona una manera fácil de comenzar con un diseño predefinido de notas adhesivas personalizables para tus tareas y equipo.
Tablero de roam seguro
Ideal para:
Metodología Agile, Operaciones, Flujos de trabajo de Agile
Un tablero de ROAM SAFe es un marco para hacer visibles los riesgos. Te brinda a ti y a tu equipo un espacio compartido para identificar y destacar riesgos, para que no se pasen por alto. El Tablero ROAM ayuda a todos a considerar la probabilidad e impacto de los riesgos, y decidir cuáles riesgos son de baja prioridad frente a los de alta prioridad. Los principios subyacentes de SAFe (Scaled Agile Framework) son: impulsar soluciones rentables, aplicar el pensamiento sistémico, asumir que las cosas cambiarán, construir de forma incremental, basar los hitos en la evaluación de sistemas en funcionamiento y visualizar y limitar el trabajo en curso.
8 maneras diferentes de organizar tu backlog
Ideal para:
Agile
Explora 8 técnicas diferentes para gestionar y priorizar el trabajo de manera eficaz con esta plantilla. Desde matrices de priorización hasta la creación de mapas de historias, ofrece una visión integral de las estrategias de gestión de tareas pendientes. Al comprender las fortalezas y limitaciones de cada enfoque, los equipos pueden adaptar la organización de sus tareas pendientes para optimizar el flujo de trabajo, lo que les permite mantenerse organizados y enfocados en entregar valor.
Plantilla de proceso de contratación
Ideal para:
Operaciones, Organigramas, Tableros Kanban
Tener un proceso de contratación simplifica el proceso en cada paso, desde la búsqueda para el puesto hasta la finalización de las ofertas. Esta plantilla sencilla y eficaz te dará una visión clara y de alto nivel de dónde se encuentran los empleados a medida que pasan de aspirantes a nuevos contratados.