Arrivera un jour où vous devrez faire face à un incident majeur ! Cela arrive, même aux plus grands ! Le principal est d'y être préparé pour pouvoir agir, je jour où cela arrivera, avec un sang froid digne d'un démineur…
Si vous avez créé une documentation technique de votre infrastructure et de ses services et que vous l'avez bien maintenue au fil du temps vous avez déjà fait une bonne partie du chemin vers la résolution de votre problème. A l'inverse, vous risquez de chercher une aiguille dans une botte de foin !!!
Voir la page : Documentation technique
Ça y est, le jour de l'incident majeur est arrivé…
Vous pouvez vous inspirer de la petite méthode (P.A.R.C) ci-dessous afin de traiter le problème dans de bonnes conditions.
Protéger votre infrastructure pour ne risquer aucune perte de données ou aucune aggravation de la situation (exemple, si un service est en train de remplir un disque ou de consommer tout le CPU disponible, stoppez-le !).
Indiquer à vos utilisateurs que vous subissez un incident cela évite qu'ils vous inondent de messages pour vous dire que cela ne marche plus (alors que vous le savez déjà…). C'est avant tout un acte de politesse et une manière de prouver à vos utilisateurs que vous maîtrisez la situation,
Isoler le composant qui met le bazar dans votre infrastructure, comprenez ce qui se passe, mettez en place le ou les correctifs nécessaires.
Faites une nouvelle annonce auprès de vos utilisateurs en leur indiquant si tout est revenu à la normale ou pas. Si vous prévoyez une interruption totale ou partielle de vos services durant une période longue (plusieurs jours par exemple) mettez aussi à jour vos informations sur le site chatons.org.
Utilisez également le forum pour donner votre retour d'expérience et éviter que d'autres CHATONS puissent rencontrer ce même genre de problème (ex. update d'une version de Nextcloud qui tourne mal…).