Les centres de données et les autres systèmes informatiques vitaux n’ont cessé de gagner en fiabilité au fil des ans. Pourtant, les interruptions et les temps d’arrêt ( downtime ) semblent augmenter malgré ces progrès. Près d’un tiers (31 %) des répondants a été confronté à un arrêt ou une panne informatique l’an dernier, contre 25 % un an plus tôt. Ceci pourrait s’expliquer par la complexité et l’interdépendance croissantes des systèmes informatiques.

Les principales causes d’interruptions dans les services informatiques sont les pannes de courant (33 %), suivies par les problèmes de réseau (30 %) et les erreurs logicielles (28 %). Les incidents survenus chez des tiers dans des environnements hybrides (ex. fournisseurs d’hébergement ou fournisseurs cloud) jouent également un rôle. Heureusement, deux acteurs sur trois (68 %) prévoient des back-ups réguliers vers un deuxième site pour une restauration rapide suite à un problème.

Fait remarquable, 43 % des opérateurs de centres de données et informaticiens ayant été confrontés à une panne n’ont pas calculé le coût de l’incident. Celui-ci peut toutefois être élevé, car l’informatique joue un rôle crucial dans un nombre croissant de rouages de l’entreprise. La moitié des incidents rapportés ont coûté moins de 100 000 dollars (env. 90 000 euros), mais 15 % des interruptions ont donné lieu à des dommages excédant le million de dollars.

Comme partout, il vaut mieux prévenir que guérir. Selon 80 % des répondants, leur panne la plus récente aurait pu être évitée. Cela peut indiquer que la cause de la plupart des problèmes relève plutôt du mode de travail que de l’infrastructure ou des équipements.

Chez LCL, nous testons régulièrement les systèmes de back-up, qui sont d’ailleurs conçus de façon totalement redondante. De plus, nous investissons dans la mise à niveau de l’infrastructure et dans la formation des collaborateurs. Nous coupons le courant tous les mois dans le but de tester les générateurs qui assurent alors l’approvisionnement en électricité. Lors de travaux d’entretien, nous établissons un planning détaillé à l’avance afin d’éviter les incidents. Grâce à toutes ces mesures, nous sommes préparés à résoudre des situations imprévues. Et comme nous disposons de trois sites différents (Diegem, Anvers et Alost), nos clients peuvent réagir plus facilement en cas de reprise après sinistre (disaster recovery).

En savoir plus : Uptime Institute data shows outages are common, costly, and preventable (juin 2018).


 
Partager sur: