Raoul Fernandes et Marc Legru, Operae Partners
Dans de nombreuses DSI, la gestion des changements IT en production est devenue un mécanisme essentiel de maîtrise du risque.
Chaque modification applicative ou technique doit être analysée, planifiée, validée et suivie pour éviter les incidents IT en production. Avec le temps, les organisations mettent en place des processus, des comités et des contrôles destinés à sécuriser les mises en production.
Mais des questions se posent souvent :
ces mécanismes améliorent-ils réellement la fiabilité des changements ou finissent-ils par créer eux-mêmes de la complexité et du retravail ? Est-ce que l’équipe travaille sereinement ? Est-ce que les utilisateurs sont pleinement satisfaits avec très peu d’incidents informatiques impactant leur travail quotidien ?
Le retour d’expérience présenté ici illustre comment une équipe de gestion des changements d’une DSI d’assurance a été accompagnée pat un coach Lean IT d’Operae Partners pour simplifier son fonctionnement, réduire les charges inutiles et améliorer la qualité des mises en production.
Le Lean IT, déclinaison du système de production Toyota dans les activités IT, vise à améliorer la performance des organisations informatiques en comprenant mieux la valeur à apporter aux utilisateurs/métier, en améliorant les flux de travail par la réduction des obstacles grâce à la pratique de la méthode scientifique de résolution de problèmes au plus près du terrain.
Une équipe critique pour la fiabilité de la production IT
Dans cette DSI, l’équipe de gestion des changements occupe une position centrale dans le fonctionnement des opérations IT.
Chaque mois, elle traite environ :
- 700 demandes de changements
- dont environ 400 changements examinés en comité
- 200 changements automatisés
- et 90 changements nécessitant une coordination avec des équipes techniques locales
Malgré un processus structuré, les incidents liés aux changements IT restent une préoccupation importante.
Sur la période janvier à juin :
- une moyenne de 5,5 incidents P1/P2 par mois sont générés par des changements
- les changements IT représentent 27 % des incidents de production
Autrement dit, plus d’un quart des incidents majeurs de production trouvent leur origine dans une modification du système. D’autre part les abaques des surcoûts engendrés par les incidents critiques dans de moyennes à grandes entreprises donnent une fourchette de 15 000 à 150 000 euros par incident critique. Soit dans notre cas des surcouts de 907 000 à 9 070 000 d’euros à l’année… (sur 11 mois, 1 mois de freeze sur l’année).
L’objectif du projet est alors triple :
- simplifier le processus de gestion des changements IT
- réduire la charge de travail des équipes
- diminuer le volume d’incidents majeurs liés aux mises en production.
Se confronter au réel
La démarche Lean IT commence par l’observation du travail réel de l’équipe par le coach Lean IT puis par l’équipe elle-même.
Les membres de l’équipe cartographient ensemble le processus de gestion des changements tel qu’il est réellement pratiqué, étape par étape.
Le constat est clair : le processus comporte 12 étapes successives, impliquant plusieurs échanges, validations et transferts d’information.
Mais surtout, une autre réalité apparaît rapidement.
Une part importante de la charge de travail de l’équipe ne provient pas du traitement normal des changements IT, mais du retravail des dossiers de demande.
Les demandes de changement IT arrivent souvent :
- incomplètes
- mal renseignées
- sans les documents attendus
- ou sans validation préalable de certains acteurs.
Chaque demande doit alors être renvoyée au demandeur ou analysée plusieurs fois, ce qui consomme du temps et génère des délais.
Pour rendre ce phénomène visible, l’équipe met en place un dispositif simple : les “bacs rouges”, un outil permettant de collecter les reworks et d’en identifier les causes.
Sur les premières semaines d’observation, les principales causes de retravail sont :
- tâches non acceptées par les implémenteurs
- informations manquantes sur les services concernés
- PV de recette absents
- accords nécessaires non obtenus
- consignes de mise en production incomplètes.
Ces faits et données permettent enfin de traiter le problème à la racine.
Simplifier le processus
Le premier levier d’amélioration consiste à simplifier le flux de traitement des changements IT.
Le travail collectif conduit à une simplification importante du processus :
le nombre d’étapes passe de 12 à 9.
Parmi les changements IT majeurs :
- simplification du fonctionnement du comité de changements
- suppression d’un rituel devenu peu utile
- réorganisation des modalités de présentation des changements.
La suppression du Comité d’Analyse Quotidien, car sans réelle valeur ajoutée, après expérimentation, permet de libérer environ 15 heures de travail par semaine pour l’équipe.
Le comité hebdomadaire (CAB, Change Advisory Board) est également réorganisé afin de réduire la durée des échanges et libérer du temps des demandeurs :
- 2 minutes de présentation par changement
- 3 minutes de questions
- organisation de créneaux de passage
- suivi des questions non résolues en séance.
Cette simplification améliore simultanément la fluidité du processus et la qualité des discussions, et permet à l’équipe de se libérer de la capacité pour mettre en place les leviers d’amélioration avec le système Lean IT.
Aider les chefs de projet à améliorer la qualité des demandes de changement IT
Le second levier consiste à améliorer la qualité des informations fournies dans les demandes de changement IT afin de réduire drastiquement le nombre d’aller-retours entre les demandeurs et l’équipe de gestion des changements.
Pour cela, l’équipe met en place plusieurs dispositifs.
Une checklist d’autocontrôle à destination des demandeurs
Une checklist simple est créée pour les demandeurs afin qu’ils vérifient par eux-mêmes que les informations nécessaires sont bien présentes avant la soumission du changement.
Cette checklist est testée auprès d’un groupe pilote de demandeurs puis ajustée avant généralisation.
Le principe de “l’œil neuf”
Une vérification rapide est réalisée dès l’arrivée d’un nouveau changement afin de contrôler :
- la complétude du dossier
- la présence des livrables nécessaires
- la cohérence des informations.
Cette vérification précoce évite que les demandes soient analysées plusieurs fois par différents membres de l’équipe.
Apprendre des problèmes
Le troisième levier d’amélioration consiste à développer la capacité de l’équipe à apprendre des incidents IT et des reworks.
Plusieurs résolutions de problème utilisant la méthode scientifique PDCA (Plan-Do-Check-Act) sont lancées sur des problèmes récurrents.
Par exemple :
- les tâches non acceptées à temps par les implémenteurs
- les PV de recette manquants
- certains incidents techniques liés à des prérequis oubliés lors des mises en production.
Dans un cas concret, un changement IT a provoqué un incident P2 en raison d’un composant technique manquant en production pour un serveur web applicatif Java.
L’analyse a permis d’identifier un défaut de traçabilité entre les environnements de test et de production.
Les actions mises en place ont notamment consisté à :
- renforcer la vérification des prérequis
- améliorer la communication avec les équipes concernées
- capitaliser les enseignements pour les changements futurs.
Les premiers résultats
Après plusieurs semaines d’implémentation, les premiers résultats apparaissent.
Parmi les évolutions observées :
- simplification significative du processus de gestion des changements IT, en passant de 50 informations à 20.
- suppression d’un rituel consommateur de temps sans valeur ajoutée
- 30 heures x personne de charge hebdomadaire libérées (soit presque un équivalent temps plein)
- meilleure visibilité sur les causes de retravail
- amélioration progressive du fonctionnement de l’équipe.
Les premiers effets sont également visibles sur la stabilité des mises en production. Alors que l’équipe observait environ 6 incidents IT majeurs (P1/P2) par mois liés aux changements IT en production, certains mois de la phase d’implémentation ont vu ce chiffre descendre jusqu’à 2 incidents. Il y a donc beaucoup moins de perturbations pour les utilisateurs finaux dans leur travail quotidien.
Même si la période d’observation reste encore courte pour conclure définitivement, cette évolution confirme que la simplification du processus et l’amélioration de la qualité des demandes et de leur traitement vont dans la bonne direction.
L’équipe travaille plus sereinement et peut consacrer encore plus de temps à valeur ajoutée pour l’analyse des demandes de changements. Sa satisfaction vis-à-vis de l’accompagnement du coach Lean IT Operae est également élevée : l’accompagnement Lean IT obtient un Net Promoter Score interne (NPS) de 71 (donc sur une échelle de -100 à +100).
Les membres de l’équipe soulignent notamment :
- l’amélioration de leur façon de travailler
- le temps dégagé pour des activités à plus forte valeur
- la dynamique d’amélioration continue engagée.
[EDIT : sur l’année suivant l’accompagnement Lean IT, le nombre moyen mensuel d’incidents IT majeurs a été en moyenne de 3 au lieu de 5. Il s’agit donc d’une réduction de -40% et 20 incidents majeurs évités sur cette année, soit une réduction des surcouts de 300 000 à 3 000 000 d’euros.]
Ce que cette expérience Lean IT peut apporter aux DSI
Dans de nombreuses organisations IT, la gestion des changements devient progressivement une machine administrative destinée à réduire les risques qui s’éloigne du terrain du système d’information et des gestes techniques qui doivent être garants de sa haute disponibilité pour ses utilisateurs.
En effet la complexité de l’activité de gestion des changements peut produire elle-même des défauts :
- dossiers incomplets
- reworks multiples
- délais supplémentaires
- non identification des risques d’incident IT
- perte de visibilité sur les problèmes réels.
L’expérience de cette équipe montre qu’une autre approche est possible, avec le système Lean IT.
En observant le travail réel, en rendant visibles les causes de retravail et en simplifiant le flux de traitement des demandes, il est possible pour une équipe d’améliorer simultanément :
- la fluidité du processus
- la qualité des changements
- sa charge de travail.
Dans les opérations IT, améliorer la gestion des changements ne consiste pas d’abord à ajouter de nouveaux contrôles.
Il s’agit surtout de permettre aux équipes de simplifier les étapes inutiles de leur processus, de rendre visibles les problèmes d’exécution / mise en production pour les supprimer. Elles apprennent ainsi à renforcer leur maitrise professionnelle et être encore plus fières d’elles-mêmes !
Parlons-en : marc.legru @ operaepartners.com, raoul.fernandes @ operaepartners.com
Chez Operae Partners, nous accompagnons depuis plus de 19 ans les DSI dans l’application du Lean IT pour que les équipes IT améliorent à la fois leur qualité de vie au travail et leur performance pour les métiers / utilisateurs.