Aller au contenu

Bonnes pratiques pour garantir la disponibilité des systèmes IT et OT

Blog Bonnes pratiques pour garantir la disponibilité des systèmes IT et OT

Aujourd’hui, garantir la disponibilité des systèmes IT et OT est primordiale pour la réussite des organisations. Les interruptions de service peuvent avoir des effets dévastateurs sur la productivité, la satisfaction des utilisateurs et des clients, l’image, les activités et les revenus de l’entreprise. Pour les responsables d’exploitation (IT Opérations), le maintien d’une disponibilité des systèmes IT et OT en continu n’est pas seulement un objectif, mais une nécessité. 

Ce blog explore les meilleures pratiques de supervision pour assurer la disponibilité des systèmes IT et OT, en s’appuyant sur l’étude de cas réelle de Monoprix, leader dans la vente au détail en centre-ville. 

Supervision proactive : la clé pour éviter les interruptions de services

Mettre en place des outils de supervision en temps réel

Une solution de supervision avancée fournit des données en temps réel sur les performances et l’état des systèmes. Ce type de solution offre une visibilité complète sur tous les composants des infrastructures, qu’il s’agisse des serveurs, des réseaux, des applications, des bases de données et des Technologies Opérationnelles (OT).

Mise en place d’alertes automatisées

Les alertes automatisées sont essentielles pour intervenir à temps. Il ne faut donc pas sous-estimer la configuration de la supervision pour l’envoi d’alertes en cas d’anomalie ou de dégradation des performances. Ces alertes doivent être classées par ordre de priorité en fonction de la gravité du problème, afin que les alertes critiques puissent être traitées en priorité.

Contrôles de santé réguliers

Il s’agit aussi de procéder à des contrôles réguliers de l’état de vos systèmes IT et OT. Il s’agit d’examiner et de mettre à jour périodiquement les configurations des systèmes, les versions des logiciels et les correctifs de sécurité. Des contrôles réguliers permettent d’identifier les vulnérabilités potentielles qui pourraient entraîner des temps d’arrêt et des interruptions de services aux conséquences désastreuses.

Capacity Planning

En parallèle, il convient de veiller à ce que les infrastructures puissent faire face aux pics de charge. Le Capacity Planning consiste à analyser l’utilisation actuelle des ressources et à prévoir les besoins futurs en fonction des tendances et de la croissance de l’entreprise. Une planification adéquate des capacités permet d’éviter les surcharges de systèmes et de garantir des performances optimales.

Exploiter les alertes en temps réel pour une action immédiate

Classer les alertes par ordre de priorité

Toutes les alertes ne nécessitent pas une action immédiate. Elles doivent être classées par ordre de priorité en fonction de leur impact sur les activités de l’entreprise. Les alertes critiques, telles que les pannes de systèmes ou les atteintes à la sécurité, doivent déclencher des protocoles de réponse immédiate.

Automatiser les actions de réponse

Le système d’alertes doit intégrer des actions de réponse automatisées, pour plus d’efficacité. Par exemple, si une alerte indique qu’un serveur est proche de sa capacité, un script automatisé peut être déclenché pour allouer des ressources supplémentaires ou redémarrer les services.

Créer des plans de réponse aux incidents

Des plans d’intervention en cas d’incident doivent être créer en entretenus régulièrement. Ces plans doivent décrire les mesures à prendre pour différents types d’alertes, y compris les personnes à avertir, les actions à entreprendre et la manière de communiquer avec les parties prenantes.

Analyser et apprendre

Après avoir résolu une alerte, l’analyse de l’incident permet d’en comprendre la cause profonde et d’éviter qu’il ne se reproduise. Ces informations permettent d’améliorer en permanence vos systèmes de supervision et d’alerte.

Étude de cas, secteur retail : comment Monoprix garantit une expérience utilisateur optimale

Monoprix, l’une des principales chaînes de magasins urbains de proximité en France, est un excellent exemple de la manière dont la supervision proactive et les alertes en temps réel peuvent garantir la disponibilité des systèmes IT et OT et améliorer l’expérience des utilisateurs. Avec plus de 725 magasins supervisés et une présence importante dans le domaine du commerce électronique, les équipes IT de Monoprix s’appuient sur Centreon pour assurer une exploitation sans faille.

« Nous devons superviser le SI local de nos magasins, les firewalls avec SDWan, le système de monétique ou encore des applications en lien direct avec les clients comme les logiciels de caisses manuelles ou automatiques, ou les applications de fidélité client et de livraison à domicile.» Laurent Lelong – Chef de département Infrastructure et Réseau – DSI Monoprix. Lire le témoignage.

 

Objectif

Monoprix avait pour objectif de garantir la disponibilité et l’efficacité des systèmes dans l’ensemble de ses magasins afin d’offrir aux clients une expérience sans faille. Cela impliquait de superviser les applications critiques comme, par exemple, les balances électroniques, les systèmes de livraison à domicile et l’architecture SD-WAN.

Bonnes pratiques 

Monoprix a mis en œuvre la solution de supervision Centreon dans le but d’obtenir une visibilité complète et une gestion proactive des incidents. Les points clés de réussite sont les suivantes :

Supervision unifiée

Avec Centreon, Monoprix supervise à ce jour 17 000 équipements sur 725 points de ventes et plus de 130.000 services. Cette visibilité complète a permis à Monoprix de superviser tous les équipements et systèmes critiques à partir d’une plateforme de supervision unifiée.

« Tout le système est supervisé en permanence. Il est très important pour nous d’avoir une vue complète et exhaustive des sites, des applications et des équipements et de limiter le nombre de consoles.  Nous collectons et agrégeons les données provenant de plusieurs sources (firewall, applications, etc.) et de différentes natures comme le nombre de transactions que nous devons restituer de façon synthétique pour faciliter la lisibilité. Nous avons une supervision centralisée qui nous permet de superviser aussi bien le réseau social d’entreprise que des VDI (postes de travail virtuels) qui sont hébergées chez Google Cloud Platform ou des micro-services Microsoft Azure et les PODs Kubernetes. Nous supervisons aussi les mails envoyés aux clients et les services des partenaires qui livrent, du côté Microsoft Azure. » Laurent Lelong – Chef de département Infrastructure et Réseau – DSI Monoprix. Lire le témoignage.

 

Détection proactive des incidents

L’intégration avec un système de messagerie SMS permet une gestion pertinente et appropriée des alertes. Ainsi, les problèmes potentiels peuvent être détectés et traités avant d’avoir un impact sur le parcours client.

« Les alertes SMS sont vraiment un plus pour nous. Nous avons interfacé Centreon avec l’outil de SMS Orange ce qui nous permet de mieux gérer nos astreintes et d’automatiser les envois de SMS. » Laurent Lelong – Chef de département Infrastructure et Réseau – DSI Monoprix. Lire le témoignage.

 

Tableaux de bord visuels synthétiques incluant des indicateurs et des alertes critiques pour une expérience client zéro défaut

Les tableaux de bord visuels synthétiques de Centreon permettent à plus de 100 utilisateurs d’avoir un aperçu en temps réel des performances des systèmes. Ces tableaux de bord sont adaptés aux différents acteurs, garantissant que chacun, des techniciens IT aux responsables métiers, dispose des informations dont il a besoin.

Chez Monoprix, la criticité de la performance du SI porte essentiellement sur la base de données, l’accès au réseau, les performances de la monétique et les applications liées à la fidélisation des clients.

« Si vous tapez votre code et que la transaction dure trop longtemps, cela a un impact direct sur la file d’attente et votre expérience client est dégradée. Nous avons donc mis en place un nouvel indicateur qui repose sur un seuil et non sur la disponibilité du système. Il permet d’envoyer une alerte dès que le temps de paiement dépasse 30 secondes afin que nous puissions identifier si le problème vient de chez nous ou de notre partenaire Ingenico. » Laurent Lelong – Chef de département Infrastructure et Réseau – DSI Monoprix. Lire le témoignage.

 

Résultats

« Nous devons garantir une expérience client optimale dans un secteur d’activité concurrentiel où chaque étape du parcours client est critique. C’est la raison pour laquelle il est important de superviser un maximum d’équipements et d’applications au sein d’une seule plateforme et de prévoir des alertes liées au comportement du système. Nous supervisons aussi bien les firewalls que les applications de gestion de caisse, d’étiquettes et de balances électroniques, de tickets dématérialisés ou encore de livraisons à domicile et nous avons mis en place des alertes sur les ralentissements au niveau du paiement par exemple. » Laurent Lelong – Chef de département Infrastructure et Réseau – DSI Monoprix. Lire le témoignage.

 

La mise en œuvre de la solution de supervision Centreon a permis de rendre les opérations de Monoprix plus fiables et les équipes plus efficaces. Les principaux avantages sont les suivants :

Amélioration de la détection des incidents

La supervision proactive permet de détecter plus tôt les anomalies, de les résoudre plus rapidement et de minimiser les temps d’arrêt.

Une expérience utilisateur améliorée

Le fait de garantir la disponibilité et l’efficacité des systèmes dans tous les magasins s’est traduit par une meilleure expérience client, car les systèmes tels que les caisses et les applications de livraison à domicile fonctionnent de manière optimale.

Efficacité opérationnelle

Grâce à une supervision automatisée et à des tableaux de bord personnalisés, l’équipe IT de Monoprix peut se concentrer sur des tâches à valeur ajoutée plutôt que sur les incidents.

« Sans Centreon, nous sommes vraiment dans le noir et nous ne savons plus travailler efficacement. La supervision Centreon est devenue un élément important voire critique de notre organisation IT et de notre performance, en particulier pour assurer une expérience client zéro défaut. » Laurent Lelong – Chef de département Infrastructure et Réseau – DSI Monoprix. Lire le témoignage.

 

Conclusion

Garantir la disponibilité des systèmes est un défi à multiples facettes qui nécessite une approche proactive, en tirant parti d’outils de supervision en temps réel et d’alertes automatisées. En adoptant ces meilleures pratiques, les responsables et équipes ITOps peuvent non seulement prévenir les temps d’arrêt, mais aussi améliorer l’efficacité opérationnelle globale. La réussite de Monoprix souligne l’importance de solutions de supervision complètes telles que Centreon pour atteindre ces objectifs. En mettant en œuvre de telles stratégies, les entreprises peuvent garantir la disponibilité des systèmes, ce qui se traduit par une amélioration de la productivité et de la satisfaction des clients.

Pour aller plus loin :

 

Partager

Facebook picto Twitter picto Twitter picto

Publications similaires

Découvrez comment Centreon va transformer votre business

Restez informés sur notre actualité