Que faire pour éviter l'obscurité totale

Le projet du gouvernement de couper temporairement certaines parties de l’approvisionnement en électricité pendant les rigueurs de l’hiver aura probablement un impact majeur sur les entreprises - essayez simplement de travailler dans des locaux industriels sans éclairage. Les employés devront trouver de nouveaux moyens de maintenir les communications internes et externes, et je ne mentionnerai même pas l’impact sur les principales activités quotidiennes de l’entreprise ou sur ce qui devrait être fait si tous les processus commerciaux étaient au point mort. En tant que centre de traitement de données, LCL est un spécialiste de la redondance avec des fonctions de sauvegarde pour chaque partie de notre offre. Nous effectuons également un test de coupure de courant une fois par mois. Comme nous tenons à partager notre vaste expérience, ce blog contient un certain nombre de conseils et astuces que vous pouvez utiliser avant, pendant et après une panne de courant.

L'économie numérique

On prétend que les entreprises ne rencontreront pas trop de problèmes à la suite des pannes d'électricité annoncées. Des pannes d'électricité devraient avoir lieu en début de soirée, vers 17 heures, lorsque la plupart des entreprises terminent leurs activités quotidiennes. Toutefois, une panne de courant peut avoir des conséquences majeures sur les informations critiques de l'entreprise, même si toutes les mesures de précaution ont été prises, ce qui semble avoir été ignoré. Les serveurs exécutés en arrière-plan pour prendre en charge les processus métier peuvent être arrêtés. L'impact de ceci ne peut pas être sous-estimé. De plus, les conséquences des pannes de courant sur les centres de données et les lignes de communication sont assez faciles à oublier. Les centres de données et les salles de serveurs sont souvent situés dans des endroits inaccessibles au reste de l'entreprise. Outre les pannes d'électricité prévues, des pannes imprévues peuvent également se produire. Si la consommation est trop importante pour que le réseau puisse la gérer, il est possible que l'alimentation soit instantanément perdue.

Cela peut-il être anticipé? La législation existante sur les infrastructures critiques ne couvre que l'énergie, les transports, le secteur financier et la communication numérique. Selon la loi, l'informatique n'est pas une infrastructure critique. Cependant, rien ne pourrait être plus éloigné de la vérité. Les technologies de l’information sont omniprésentes, telles que le simple API utilisé dans une cafetière, l’informatique utilisée dans les verrous de canaux et les chaînes de production en usine gérées par des ordinateurs de bureau et des ordinateurs centraux. Les législateurs n’ont pas du tout pris en compte l’économie numérique d’aujourd’hui, comme le montrent les cyberattaques de l’année dernière.

Compte tenu de cela, je recommande aux entreprises disposant d'une salle de serveurs ou d'un centre de données de bien se préparer. Ils peuvent le faire en effectuant un certain nombre de tests en fonction des questions suivantes. L'alimentation de secours fonctionne-t-elle si l'alimentation du réseau est interrompue? Quel plan d’action faut-il suivre en cas de panne de courant et quelles mesures faut-il prendre lors du rétablissement de l’alimentation?
Tout dépend de la conception, l’entreprise dispose-t-elle de quelques serveurs dans une salle de serveurs ou d’un centre de données complet avec dix racks ou plus.

A EPP D 001 591
 

Astuces pour la salle des serveurs

Si votre entreprise stocke ses données dans une salle de serveurs, la meilleure chose à faire est de vérifier si la capacité de la batterie est suffisante pour traverser la salle de serveurs pendant une panne de courant. Vous pouvez effectuer un court test de décharge pour mesurer la capacité réelle des batteries. Vous devez également vérifier que seuls les équipements critiques sont connectés au système de sauvegarde. Il a été dit que les coupures de courant peuvent durer jusqu'à trois heures. Pour les salles de serveurs avec des batteries mais pas de génération d’énergie de secours, cela signifie que les serveurs s’arrêteront. L'autonomie de la plupart des systèmes de sauvegarde est de dix minutes. Cela suffit pour faire face à une panne de courant de courte durée, mais pas pour en couvrir une de trois heures. De plus, le système de refroidissement s’arrêtera également à moins d’être connecté à l’alimentation de secours. Cela peut entraîner une surchauffe des processeurs des serveurs, entraînant des défauts et une perte de données.
Les entreprises doivent s’assurer que leur système de refroidissement est connecté à leur groupe électrogène, le cas échéant. Le système de refroidissement s'arrêtera brièvement s'il y a une panne de courant, mais il redémarrera une fois que le générateur commencera à produire de l'électricité.

Comme de nombreux centres de données ont connu une croissance organique, il est essentiel de mesurer la consommation d'énergie réelle. Fréquemment, la consommation dépasse la capacité de l'onduleur en raison de la connexion d'un équipement non critique à l'onduleur. Si l'onduleur est surchargé, il est très probable qu'il ne fonctionne pas correctement et qu'il tombe en panne.
Il en va de même pour le générateur de secours. Est-il capable de supporter la charge complète des serveurs et du système de refroidissement?

CONSEILS:

  • Vérifiez l'âge des batteries et effectuez un test de décharge.

  • Assurez-vous de disposer d’une génératrice et de suffisamment de carburant pour couvrir trois jours d’utilisation.

  • ​Préparez un plan d'urgence pour les pannes de courant plus longues.

  • Éteignez tous les serveurs qui ne seront pas utilisés.

  • Certains onduleurs permettent à vos serveurs d’être «arrêtés avec élégance». Utilisez cette option si elle est disponible dans votre UPS.

  • Vérifiez si tout l'équipement est connecté à l'alimentation de secours. Le passage de l'alimentation normale à l'alimentation de secours doit également se dérouler sans accroc.

  • Assurez-vous que toutes les installations sont entretenues avant le début de l'hiver.

Astuces pour le centre de données

Un centre de données a plus de racks contenant des données d’entreprise qu’une salle de serveurs. Habituellement, les installations sont meilleures que celles trouvées dans une simple salle de serveur. Néanmoins, il est toujours important de tester les batteries, de comparer la consommation de capacité à la puissance fournie par les batteries installées et de s'assurer qu'il y a suffisamment de carburant pour le générateur de secours.

Cela dit, la complexité des grands centres de données nécessite une liste de contrôle plus longue:

  • Le système de contrôle d'accès est-il connecté au groupe électrogène de secours?

  • Les serveurs sont-ils connectés à deux sources d'alimentation indépendantes?

  • Le système de refroidissement peut-il gérer le passage de l’alimentation normale à l’alimentation de secours fournie par le générateur?

  • Les alarmes sont-elles correctement enregistrées?

  • Toutes les alarmes sont-elles correctement connectées?

Les onduleurs A et B ont-ils été testés et l'onduleur de secours fonctionne-t-il correctement?
​Je recommande de simuler une panne de courant. Vérifiez l’installation et éteignez l’interrupteur principal pour voir ce qui se passe. De nombreuses entreprises ont peur d'effectuer cet exercice car elles n'ont jamais testé l'installation ou sont incapables d'en évaluer les implications. Si tel est le cas, le moment est précisément choisi pour effectuer le test.


CONSEILS:

  • Toujours opter pour le diesel d'hiver lors de la commande de carburant pour la génératrice. Le diesel d’été est livré en standard pendant l’été, mais il gèle pendant les hivers froids et les coupures de courant sont plus susceptibles de se produire lorsque la température extérieure est très basse.Connectez le tout à l’alimentation redondante. Utilisez des commutateurs de transfert de source, etc. pour un équipement non redondant.

  • Conservez le schéma de câblage de votre installation électrique à portée de main en cas de problème. Un centre de données est une installation vivante et plus vous aurez de documentation, mieux ce sera.

  • Vérifiez quelles applications sont considérées comme critiques pour l'entreprise en cas de panne de courant et préparez un plan afin de pouvoir les redémarrer en premier.

  • Par mesure préventive, remplacez si possible les anciens serveurs avant que le plan de coupure partielle de l’alimentation en électricité ne prenne temporairement effet (c’est-à-dire maintenant!). Des années d’utilisation peuvent avoir entraîné une usure de la source d’alimentation et il est probable que les serveurs ne redémarrent pas.

  • Les fluctuations du réseau électrique peuvent provenir de l'une ou l'autre direction, pensez donc à la protection contre les surcharges.

  • En cas de panne de courant, déconnectez les fusibles des serveurs et isolez-les du réseau.

Que faire après une panne de courant

  • Les batteries de l'onduleur doivent être chargées avant que les serveurs puissent être alimentés. Le fusible principal risque de fondre si les serveurs sont démarrés alors que les batteries sont en cours de chargement.

  • N'autorisez pas les serveurs à démarrer automatiquement lors du retour de l'alimentation. Utilisez les paramètres du BIOS pour configurer les serveurs afin qu’ils ne se lancent pas automatiquement à la remise sous tension. Essayez de faire démarrer les serveurs de manière séquentielle. Le courant de démarrage peut également déclencher le fusible. Le réseau est souvent instable à la suite d’une panne de courant et les fluctuations du réseau peuvent entraîner la fermeture du serveur et sa défaillance. L'infrastructure de serveur et de stockage ne peut être redémarrée en toute sécurité que si l'alimentation est stable pendant 15 minutes.

  • Préparez un plan pour redémarrer l'infrastructure. Documentez tout le mieux possible. Identifiez les serveurs qui peuvent être redémarrés en premier et vérifiez-en la présence de défauts.

  • Consultez les instructions pour vos installations et les fournisseurs.

  • Préparez un bon plan de sauvegarde de la configuration de vos commutateurs et routeurs. Cela peut s'avérer inestimable si les données stockées sur votre équipement sont perdues.

Basé sur l'expérience…

Nos années d'expérience avec trois centres de données nous ont amenés à construire des installations très redondantes pouvant fonctionner avec une alimentation électrique d'urgence pendant des mois. Il y a assez de carburant disponible pour 72 heures d'alimentation d'urgence, qui peut être constamment remplie.
Les centres de données ont été construits avec toute la redondance nécessaire pour faire face aux interruptions d'alimentation. L'ingénierie d'une grande installation est importante et nous avons pris en compte des circonstances imprévues. Pendant de nombreuses années, nous avons formé notre personnel technique à la gestion des interruptions de l’alimentation.
Nous testons l’ensemble de l’installation et simulons une véritable interruption tous les mois. Au cours de cet exercice, l’ensemble du centre de données est alimenté par des générateurs de secours. L'exercice prend presque une journée entière et est effectué par deux personnes.
Nos employés sont pleinement conscients de l’importance de la continuité des activités et, comme ils traitent ce problème tous les jours, ils pensent au redondance. La pratique porte ses fruits, comme l’accorderont les employés de LCL Belgium. Ils savent mieux que quiconque comment les installations doivent réagir et ont développé un talent pour eux. Toute l’équipe des opérations de LCL s’emploie à faire en sorte que nos trois centres de données continuent de fonctionner sans problème au cours des mois et des années à venir, quelles que soient les pannes de courant pouvant survenir.

Partager sur: