Publicité
Une sauvegarde des données efficace avec la supervision. (Image d'illustration geralt Pixabay_CC).

Comment se prémunir des incidents de sauvegarde grâce à la supervision ?

L’incendie du data center d’OVHcloud a rappelé de façon douloureuse à certaines entreprises qu’il est indispensable de sécuriser ses sauvegardes et de disposer d’un plan de reprise d’activité. Une supervision est à ce titre essentielle pour garantir que tout est sous contrôle.

Survenu dans la nuit du 10 mars 2021, l’incendie du centre de données d’OVHcloud à Strasbourg a mis en lumière certaines facettes des contrats d’hébergement de données dans le cloud. Des entreprises clientes du fleuron de la tech française ont en effet perdu toutes leurs données dans le désastre et se sont aperçues avec effroi qu’elles n’avaient pas souscrit d’option complémentaire de redondance des backups auprès d’OVHcloud ni sécurisé d’autres sauvegardes hébergées ailleurs.

Effectivement, ce n’est pas parce que l’on confie ses données et ses applications à un fournisseur de cloud que cela garantie leur protection de manière automatique. C’est au patron de l’entreprise et à son directeur informatique qu’il incombe de sécuriser les données et de mettre en place un PRA (plan de reprise d’activité), seul garant de rebond rapide lors de ce type d’incident et qui n’est pas inclus d’office dans les offres des hébergeurs cloud.

Un grand data center « public » qui part en fumée est un événement plutôt rare, mais cela arrive, comme on a également pu le constater au Japon il y a quelques années avec l’incendie d’un centre de données d’AWS, leader mondial du cloud. Anticiper ce type de sinistre doit donc être pris au sérieux, notamment grâce à la supervision, outil clé d’une bonne gestion IT de l’entreprise.

Un plan de reprise d’activité pour parer à toute éventualité

Les menaces qui pèsent sur l’intégrité des données de l’entreprise sont nombreuses et ne se limitent pas aux incendies : cyberattaques, sabotages physiques, configurations défectueuses, mises à jour défaillantes, etc. Un plan de reprise d’activité (PRA) est donc primordial pour contrer ces imprévus et leurs conséquences immédiates (arrêt de production, des ventes…) ou plus durables sur chaque service métier.

Ce plan consiste à envisager tous les incidents et scénarios possibles puis à prévoir une parade correspondante, que ce soit en interne ou à l’aide d’un prestataire. Le cœur du PRA réside dans le fait de disposer de plusieurs sauvegardes de l’ensemble de ses données, mais pas seulement.

Le PRA doit inclure la liste des intervenants impliqués à contacter ainsi que les actions à entreprendre en cas d’incident, pour chacun des rôles, que l’on parle des responsables informatiques, patrons, utilisateurs, prestataires, sous-traitants ou de la police… Un scénario précis de remise en route de l’activité doit également être défini, avec notamment l’ordre dans lequel les backups doivent être restaurés ainsi que la vérification de l’intégrité des données récupérées et leur caractère réutilisable.

Il convient également d’anticiper le temps de remise en route des applications et d’accès aux données, cela pouvant être rapide comme prendre plusieurs jours selon le type de contrat de PRA souscrit auprès d’un hébergeur. C’est pourquoi il est important d’identifier clairement les activités critiques de l’entreprise afin de prioriser les actions, définir les besoins humains et matériels ainsi que les coûts afférents. Il est enfin essentiel de procéder régulièrement à des tests de bon fonctionnement de ce PRA, en s’entraînant aux différentes procédures prévues.

Des sauvegardes multiples et supervisées

Comme évoqué, veiller à disposer à tout moment de plusieurs sauvegardes du patrimoine informationnel de l’entreprise est la clé de voûte du PRA. On parle ici d’appliquer la méthode 3-2-1 qui consiste à détenir 3 copies de données, sur au moins 2 supports de stockage différents (cloud, serveurs, bandes…), dont 1 copie que l’on aura pris soin de placer hors-site pour limiter les conséquences d’une panne informatique et si possible non connectée au réseau pour se protéger des cyberattaques. Sachant qu’une copie se trouve bien entendu sur site pour redémarrer l’activité rapidement lors des incidents mineurs.

Les sauvegardes doivent être planifiées de façon régulière et automatisées pour réduire l’impact des disparitions de données, avec des fréquences qui pourront varier en fonction de leur importance et de leur caractère sensible. Ces backups doivent être vérifiés et testés là aussi régulièrement en procédant à des restaurations de données pour s’assurer de leur cohérence.

Reste un aspect important à prendre en compte : s’assurer du bon déroulement des sauvegardes lorsque celles-ci sont censées s’effectuer. La supervision IT a ici son rôle à jouer pour surveiller ces backups et ainsi garantir un PRA effectivement fonctionnel. Plusieurs aspects peuvent être contrôlés, à commencer par le dossier de sauvegarde sur lequel on place un capteur pour vérifier que de nouveaux fichiers ont écrasé les précédents à une certaine heure par exemple.

Une autre option consiste à vérifier de façon automatisée les notifications email envoyées par les solutions de sauvegarde ainsi que la présence de mots-clés dans les messages reçus. Il est également possible de se servir de la supervision pour scanner les journaux d’événements du système d’exploitation afin d’être averti d’un échec de backup. Il existe par ailleurs d’autres capteurs de supervision spécifiques pour surveiller précisément les sauve