Système Lean IT : comment une équipe des Gestion des Changements IT d’une DSI a réduit le nombre d’incidents majeurs en production de 6 à 2 par mois

Système Lean IT : comment une équipe des Gestion des Changements IT d’une DSI a réduit le nombre d’incidents majeurs en production de 6 à 2 par mois

Une équipe critique pour la fiabilité de la production IT

Dans cette DSI, l’équipe de gestion des changements occupe une position centrale dans le fonctionnement des opérations IT.

Chaque mois, elle traite environ :

  • 700 demandes de changements
  • dont environ 400 changements examinés en comité
  • 200 changements automatisés
  • et 90 changements nécessitant une coordination avec des équipes techniques locales

Malgré un processus structuré, les incidents liés aux changements IT restent une préoccupation importante.

Sur la période janvier à juin :

  • une moyenne de 5,5 incidents P1/P2 par mois sont générés par des changements
  • les changements IT représentent 27 % des incidents de production

Autrement dit, plus d’un quart des incidents majeurs de production trouvent leur origine dans une modification du système. D’autre part les abaques des surcoûts engendrés par les incidents critiques dans de moyennes à grandes entreprises donnent une fourchette de 15 000 à 150 000 euros par incident critique. Soit dans notre cas des surcouts de 907 000 à 9 070 000 d’euros à l’année… (sur 11 mois, 1 mois de freeze sur l’année).

L’objectif du projet est alors triple :

  • simplifier le processus de gestion des changements IT
  • réduire la charge de travail des équipes
  • diminuer le volume d’incidents majeurs liés aux mises en production.

Se confronter au réel

La démarche Lean IT commence par l’observation du travail réel de l’équipe par le coach Lean IT puis par l’équipe elle-même.

Les membres de l’équipe cartographient ensemble le processus de gestion des changements tel qu’il est réellement pratiqué, étape par étape.

Le constat est clair : le processus comporte 12 étapes successives, impliquant plusieurs échanges, validations et transferts d’information.

Mais surtout, une autre réalité apparaît rapidement.

Une part importante de la charge de travail de l’équipe ne provient pas du traitement normal des changements IT, mais du retravail des dossiers de demande.

Les demandes de changement IT arrivent souvent :

  • incomplètes
  • mal renseignées
  • sans les documents attendus
  • ou sans validation préalable de certains acteurs.

Chaque demande doit alors être renvoyée au demandeur ou analysée plusieurs fois, ce qui consomme du temps et génère des délais.

Pour rendre ce phénomène visible, l’équipe met en place un dispositif simple : les “bacs rouges”, un outil permettant de collecter les reworks et d’en identifier les causes.

Sur les premières semaines d’observation, les principales causes de retravail sont :

  • tâches non acceptées par les implémenteurs
  • informations manquantes sur les services concernés
  • PV de recette absents
  • accords nécessaires non obtenus
  • consignes de mise en production incomplètes.

Ces faits et données permettent enfin de traiter le problème à la racine.


Simplifier le processus

Le premier levier d’amélioration consiste à simplifier le flux de traitement des changements IT.

Le travail collectif conduit à une simplification importante du processus :

le nombre d’étapes passe de 12 à 9.

Parmi les changements IT majeurs :

  • simplification du fonctionnement du comité de changements
  • suppression d’un rituel devenu peu utile
  • réorganisation des modalités de présentation des changements.

La suppression du Comité d’Analyse Quotidien, car sans réelle valeur ajoutée, après expérimentation, permet de libérer environ 15 heures de travail par semaine pour l’équipe.

Le comité hebdomadaire (CAB, Change Advisory Board) est également réorganisé afin de réduire la durée des échanges et libérer du temps des demandeurs :

  • 2 minutes de présentation par changement
  • 3 minutes de questions
  • organisation de créneaux de passage
  • suivi des questions non résolues en séance.

Cette simplification améliore simultanément la fluidité du processus et la qualité des discussions, et permet à l’équipe de se libérer de la capacité pour mettre en place les leviers d’amélioration avec le système Lean IT.


Aider les chefs de projet à améliorer la qualité des demandes de changement IT

Le second levier consiste à améliorer la qualité des informations fournies dans les demandes de changement IT afin de réduire drastiquement le nombre d’aller-retours entre les demandeurs et l’équipe de gestion des changements.

Pour cela, l’équipe met en place plusieurs dispositifs.

Une checklist d’autocontrôle à destination des demandeurs

Une checklist simple est créée pour les demandeurs afin qu’ils vérifient par eux-mêmes que les informations nécessaires sont bien présentes avant la soumission du changement.

Cette checklist est testée auprès d’un groupe pilote de demandeurs puis ajustée avant généralisation.

Le principe de “l’œil neuf”

Une vérification rapide est réalisée dès l’arrivée d’un nouveau changement afin de contrôler :

  • la complétude du dossier
  • la présence des livrables nécessaires
  • la cohérence des informations.

Cette vérification précoce évite que les demandes soient analysées plusieurs fois par différents membres de l’équipe.


Apprendre des problèmes

Le troisième levier d’amélioration consiste à développer la capacité de l’équipe à apprendre des incidents IT et des reworks.

Plusieurs résolutions de problème utilisant la méthode scientifique PDCA (Plan-Do-Check-Act) sont lancées sur des problèmes récurrents.

Par exemple :

  • les tâches non acceptées à temps par les implémenteurs
  • les PV de recette manquants
  • certains incidents techniques liés à des prérequis oubliés lors des mises en production.

Dans un cas concret, un changement IT a provoqué un incident P2 en raison d’un composant technique manquant en production pour un serveur web applicatif Java.
L’analyse a permis d’identifier un défaut de traçabilité entre les environnements de test et de production.

Les actions mises en place ont notamment consisté à :

  • renforcer la vérification des prérequis
  • améliorer la communication avec les équipes concernées
  • capitaliser les enseignements pour les changements futurs.

Les premiers résultats

Après plusieurs semaines d’implémentation, les premiers résultats apparaissent.

Parmi les évolutions observées :

  • simplification significative du processus de gestion des changements IT, en passant de 50 informations à 20.
  • suppression d’un rituel consommateur de temps sans valeur ajoutée
  • 30 heures x personne de charge hebdomadaire libérées (soit presque un équivalent temps plein)
  • meilleure visibilité sur les causes de retravail
  • amélioration progressive du fonctionnement de l’équipe.

Les premiers effets sont également visibles sur la stabilité des mises en production. Alors que l’équipe observait environ 6 incidents IT majeurs (P1/P2) par mois liés aux changements IT en production, certains mois de la phase d’implémentation ont vu ce chiffre descendre jusqu’à 2 incidents. Il y a donc beaucoup moins de perturbations pour les utilisateurs finaux dans leur travail quotidien.

Même si la période d’observation reste encore courte pour conclure définitivement, cette évolution confirme que la simplification du processus et l’amélioration de la qualité des demandes et de leur traitement vont dans la bonne direction.

L’équipe travaille plus sereinement et peut consacrer encore plus de temps à valeur ajoutée pour l’analyse des demandes de changements. Sa satisfaction vis-à-vis de l’accompagnement du coach Lean IT Operae est également élevée : l’accompagnement Lean IT obtient un Net Promoter Score interne (NPS) de 71 (donc sur une échelle de -100 à +100).

Les membres de l’équipe soulignent notamment :

  • l’amélioration de leur façon de travailler
  • le temps dégagé pour des activités à plus forte valeur
  • la dynamique d’amélioration continue engagée.

[EDIT : sur l’année suivant l’accompagnement Lean IT, le nombre moyen mensuel d’incidents IT majeurs a été en moyenne de 3 au lieu de 5. Il s’agit donc d’une réduction de -40% et 20 incidents majeurs évités sur cette année, soit une réduction des surcouts de 300 000 à 3 000 000 d’euros.]


Ce que cette expérience Lean IT peut apporter aux DSI

Dans de nombreuses organisations IT, la gestion des changements devient progressivement une machine administrative destinée à réduire les risques qui s’éloigne du terrain du système d’information et des gestes techniques qui doivent être garants de sa haute disponibilité pour ses utilisateurs.

En effet la complexité de l’activité de gestion des changements peut produire elle-même des défauts :

  • dossiers incomplets
  • reworks multiples
  • délais supplémentaires
  • non identification des risques d’incident IT
  • perte de visibilité sur les problèmes réels.

L’expérience de cette équipe montre qu’une autre approche est possible, avec le système Lean IT.

En observant le travail réel, en rendant visibles les causes de retravail et en simplifiant le flux de traitement des demandes, il est possible pour une équipe d’améliorer simultanément :

  • la fluidité du processus
  • la qualité des changements
  • sa charge de travail.

Dans les opérations IT, améliorer la gestion des changements ne consiste pas d’abord à ajouter de nouveaux contrôles.

Il s’agit surtout de permettre aux équipes de simplifier les étapes inutiles de leur processus, de rendre visibles les problèmes d’exécution / mise en production pour les supprimer. Elles apprennent ainsi à renforcer leur maitrise professionnelle et être encore plus fières d’elles-mêmes !

Parlons-en : marc.legru @ operaepartners.com, raoul.fernandes @ operaepartners.com

Chez Operae Partners, nous accompagnons depuis plus de 19 ans les DSI dans l’application du Lean IT pour que les équipes IT améliorent à la fois leur qualité de vie au travail et leur performance pour les métiers / utilisateurs.


Laisser un commentaire