La réduction des incidents informatiques, une priorité pour les grandes banques européennes.

Plus de transparence sur les incidents informatiques.

Les banques britanniques doivent depuis le 15 août indiquer sur leur site web le nombre d’incidents informatiques ayant provoqué des interruptions des services de paiement. On découvre ainsi selon le journal les échos du 17 août 2018, que les cinq plus grandes banques du Royaume-Uni ont indiqué avoir connu 67 incidents ayant provoqué des interruptions de leurs services de paiement. De son côté, depuis l’été 2017, la Banque Centrale Européenne impose aux 130 banques de la communauté de rendre public les incidents informatiques majeurs. Ces mesures visent en premier lieu à protéger les clients d’un incident critique qui pourrait avoir des conséquences financières importantes pour les particuliers et les entreprises. Cette obligation de transparence influe en outre directement sur la réputation des banques. L’amélioration de la qualité des applications et des systèmes d’information devient pour les banques un enjeu stratégique majeur.

Le point de vue du lean management

Cet enjeu se traduit par les objectifs opérationnels suivant :

  1. Diminuer l’impact des incidents sur la qualité et le taux de service pour améliorer la satisfaction des clients et réduire les risques.
  2. Accélérer la résolution des incidents pour consacrer plus de temps aux projets créant de la valeur.

Un moyen efficace pour réduire les incidents

Je travaille depuis plusieurs années sur le sujet. Récemment je suis intervenu au sein d’une équipe IT d’une trentaine de personnes spécialisée dans un processus bancaire clef dans une grande banque européenne. La situation était assez délicate. Les projets sortaient au ralenti malgré un fort engagement des collaborateurs. Le moral de l’équipe était au plus bas.  

Des résultats impressionnants

Grâce à cette démarche, l’équipe a réussi en 2 mois, à réduire le stock d’incidents de 80% et le volume de nouveaux incidents de 50%. La non qualité des correctifs, c’est à dire le fait de s’y prendre à plusieurs fois pour résoudre un incident, est passée de 45% à 5%. Le nombre de mise en production a été multiplié par 5. La satisfaction client a progressivement augmenté pour passer d’une note de 6/10 à 8/10.results

La situation initiale

L’équipe était confrontée chaque jour à de nouveaux incidents ayant un impact critique et direct sur le client.

Régulièrement le directeur de la production devait monter une task force pour résoudre un incident majeur, expliquer la situation à la direction générale et s’excuser auprès des clients de la banque. Tout le monde était en permanence sur le qui-vive dans l’attente du prochain incident majeur. Je me souviens d’une discussion au cours de laquelle il me disait que les conditions de travail n’étaient plus tenables pour ses équipes, continuellement en train d’éteindre des incendies et incapables de tenir les engagements sur les projets.

La situation était en effet très difficile. L’équipe faisait face à 2 incidents par jour. Sous la pression du projet, le change d’abord le run après, chacun faisait de son mieux pour réparer les effets des incidents sans les corriger définitivement. Les causes véritables n’étant pas traitées, le stock d’incidents était en augmentation constante et s‘élevait à 68 incidents. L’équipe mettait 3 corrections d’incidents en production chaque mois. Le délai de correction était d’environ 6 mois.

Voilà donc la situation telle que je la découvre au début de l’accompagnement de l’équipe.

Comment je m’y suis pris ?

1 – Construire une équipe stable

La première chose que nous avons mis en place avec le responsable de la production est la création d’une petite équipe avec toutes les compétences techniques nécessaires. Cette équipe était composée de 7 personnes, un responsable, deux analystes, deux développeurs et deux testeurs. Cette réorganisation, véritable décision managériale, n’a eu aucun impact sur le budgétaire.

2 – Développer la collaboration : voir et comprendre ensemble

Nous avons tout d’abord construit avec cette équipe un management visuel pour révéler les problèmes de qualité et d’attente dans le processus de résolution. Cela nous a permis d’avoir chacun le même niveau de compréhension de la situation, de voir le nombre total d’incidents à résoudre, d’identifier d’un seul coup d’œil à quelle étape de correction se trouvaient les incidents en cours et de comprendre les difficultés de résolution.

3 – Accélérer la production

Avec le responsable d’équipe et le métier, nous avons ensuite identifié dans le stock, les 10 premiers incidents les plus importants pour le client. Puis, avec l’équipe nous avons choisi dans quel ordre nous allions les traiter en donnant la priorité aux incidents les plus simples à résoudre. Une fois cette nouvelle organisation mise en place, nous nous sommes réunis chaque matin devant le management visuel pour comprendre les obstacles à la correction des incidents choisis la veille et nous accorder sur l’engagement de la journée : quels incidents nous allions mettre à disposition de la production.

Le fait d’avoir chaque jour une liste concrète et partagée par tous de 2 ou 3 corrections à livrer, nous a permis de nous concentrer collectivement sur les obstacles qui pouvaient nous empêcher d’atteindre cet objectif. Chaque obstacle était identifié clairement et mis en évidence dans un « bac rouge » situé à proximité de l’étape du processus concernée. Dès qu’un obstacle était identifié, si le collaborateur responsable l’opération ne trouvait pas de solution, le problème était alors pris en charge par le chef d’équipe.

Il faut bien comprendre que le lean s’attaque aux causes réelles des difficultés constatées et n’a vraiment rien du brainstorming sur le processus. C’est bien la réalité que l’on se propose d’affronter avec la résolution de problèmes et non pas une idée préconçue des dysfonctionnements.

4 – Améliorer l’efficacité opérationnelle

Dans la plupart des cas le responsable était en mesure d’aider son coéquipier ou de trouver une solution de contournement. Cette technique a permis d’accélérer considérablement la production en supprimant une grande part des attentes dans le processus.

Avec le responsable et l’équipe nous avons ensuite analysé de manière systématique chacun des obstacles recensés dans les bacs rouges. Pour chacun d’entre eux, un par un, nous avons démarré une démarche de résolution de problème avec la technique lean du PDCA (Plan, Do Check Act), démarche scientifique de résolution de problèmes. Ceci a permis à chaque collaborateur d’améliorer son expertise métier ou de développer des compétences totalement nouvelles. Ainsi les analystes ont-ils pu développer des compétences de testeurs et les testeurs des compétences d’analyste. Les testeurs ont appris à automatiser certains tests avec PowerShell. Les analystes ont rédigé des standards pour décrire le travail à faire par les développeurs.

5 – Prendre conscience de l’effet des incidents sur le client

Afin de mieux comprendre l’incidence de la non qualité sur la satisfaction des clients nous avons mis en place deux rituels avec le responsable d’équipe :

  1. Tant qu’il y a du stock, définir avec le métier les 10 incidents à corriger en priorité et comprendre pourquoi c’est important du point de vue du client.
  2. Après chaque résolution d’incident appeler le client pour lui demander son niveau de satisfaction et suivre son évolution en permanence.

De cette manière nous avons développé une culture du client très forte au sein de l’équipe.

Des résultats impressionnants

Grâce à cette démarche, l’équipe a réussi en 2 mois, à réduire le stock d’incidents de 80% et le volume de nouveaux incidents de 50%. La non qualité des correctifs, c’est à dire le fait de s’y prendre à plusieurs fois pour résoudre un incident, est passée de 45% à 5%. Le nombre de mise en production a été multiplié par 5. La satisfaction client a progressivement augmenté pour passer d’une note de 6/10 à 8/10.

results

Une équipe transformée qui poursuit l’amélioration

3 mois après mon intervention, l’équipe a basculé sur le change. En effet elle a réussi à supprimer complétement son stock d’incidents, à stabiliser le système en réduisant le volume de nouveaux incidents à 2 par mois. Elle a continué à appliquer les principes lean découverts sur le traitement des incidents et poursuivi son accélération en s’attaquant dans un premier temps aux petits changements qu’elle a rapidement absorbés. Elle se consacre désormais aux fonctionnalités des projets. Cette équipe est devenue une référence pour la banque.

Le responsable de la production est ravi :

  • La culture du mode pompier a totalement disparu.
  • Son bureau a cessé d’être le bureau des pleurs.
  • Il n’est plus réveillé le week-end pour gérer des situations de crise avec ses équipes, la direction générale et ses clients.
  • Il peut désormais se consacrer au développement du système d’information et à l’innovation.

Cette approche radicalement différente de la démarche ITIL permet d’améliorer rapidement la qualité de service des systèmes d’information. Elle répond concrètement aux exigences des instances européennes soucieuses d’un meilleur service pour les clients du secteur bancaire.

Conclusion

Pour conclure la mise en œuvre d’une démarche lean dans le cadre de la réduction des incidents de production offre à chaque fois des résultats exceptionnels et permet aux DSI de dégager de la capacité initialement dévolue au RUN pour renforcer les activités de CHANGE.

Ce faisant la culture du mode pompier disparaît, les conditions de travail s’améliorent significativement. Les équipes sont plus sereines et peuvent se consacrer au développement de la valeur pour des clients plus satisfaits.

Le point important : il n’y a pas de fatalité sur les incidents. Dans 100% des cas avec le lean management nous arrivons avec les équipes à réduire par 2, 3 ou 5 le volume d’incidents et à supprimer les stocks.

Pour plus d’information contactez moi :

Pierre Jannez – e-mail : pierre.jannez@operaepartners.com – Tél : +33 619 053 493

 

 

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s