Logo PG Software
mardi, 29 janvier 2013 14:48

Conseils aux DSI contre les ouragans, les pirates et les extra-terrestres!

Évaluer cet élément
(1 Vote)

logoGoogle est si soucieux de son plan de reprise d’activité qu'il envisage les scénarios les plus fous, même s’ils sont improbables, telle qu’une invasion extra-terrestre de ses bureaux. Vous voyez, rien ne fait plus peur à un DSI qu’une panne système - cela donne un nouveau sens aux « sales journées » au bureau.

Mais étonnamment, contrairement à Google, très peu d'entreprises ont un plan de reprise d’activité. Un récent sondage a révélé que seulement 26 % des PME en avait un. En cette période de résolutions pour la nouvelle année, voici les cinq étapes que vous et votre organisation devriez suivre pour réduire considérablement les retombées de votre prochain sinistre.

#1 : Il y aura une prochaine fois

J'ai bien dit : « prochain sinistre », ce qui implique qu'il y aura une autre panne ou sinistre qui mettra a mal votre activité. Penser que cela ne se reproduira pas, rend les entreprises moins vigilantes et peut même rallonger le temps de récupération.

Le meilleur moment pour élaborer votre plan de reprise ou mettre à jour votre plan actuel est juste après subi un sinistre. Chaque entreprise devrait faire une « autopsie » approfondie suite à une panne dont une analyse « médico-légale » avant et après la panne. Comprendre ce qui s'est passé et comment cela peut être évité à l'avenir est essentiel, mais il faut aussi se demander : « Comment aurions-nous pu récupérer plus vite ? »

Sur la base des informations recueillies, les tests de préparation aux sinistres doivent être mis à jour ou même étendus. Plus vos tests seront exhaustifs, moins vous serez surpris quand ce scénario se présente - et ce n'est pas un exercice.

#2 Mettre l'accent sur la prévention et la récupération des pannes

La première exigence de tout plan de reprise d’activité, c’est d'avoir un plan. Sur le net, il existe de nombreux documents sur la reprise d’activité que vous pouvez utiliser comme guide, mais le plus important, c’est de commencer par identifier vos systèmes d'entreprise critiques. Ensuite, se concentrer sur la mise en place d’une redondance pour ces systèmes et identifier ce qui est nécessaire à une restauration.

#3 Avoir une équipe dédiée à la reprise d’activité

Lorsque votre entreprise affronte la tempête suite à une panne, ce n'est pas le moment de décider ce qu'il faut faire ou qui fait quoi. Bien sûr, il y aura certaines décisions à prendre « à chaud », mais la plupart du temps, les réponses devront être chorégraphiées et répétées (plusieurs fois) par une équipe dédiée d'ingénieurs.

Vous avez également besoin d'un responsable efficace qui peut orienter le diagnostic du problème et les systèmes de réparation. Un bon responsable est la clef lors d'un sinistre car la réputation de l'entreprise repose en définitive sur ses décisions.

#4 Votre infrastructure est tout autant élastique que celle de vos fournisseurs

Les entreprises s'appuient généralement sur des prestataires de services tels que les FAI, les fournisseurs de colocation ou de cloud comme Amazon Web Services. Bien que rare, même un fournisseur de cloud de classe mondiale comme Amazon a des pannes qui peuvent laisser les deux systèmes et les DSI dans l’incapacité de savoir quel est le problème et quand il sera résolu.

Netflix, un gros client d’AWS, a subi des dommages collatéraux suite à plusieurs pannes chez AWS au cours des dernières années. Mais, Netflix n’imagine pas qu’AWS puisse avoir une disponibilité de 100%. En fait, Netflix a créé ce qu'il appelle « Simian Army » qui désactive au hasard des instances de production étroitement surveillées simplement pour voir ce qu’il se passe et s'assurer que leurs ingénieurs peuvent réagir avant que cela affecte leurs clients. Les ingénieurs Netflix ne cessent de perfectionner leurs compétences et le temps de réaction au moyen d'essais en continu.

#5 Communiquer rapidement avec vos clients

Chez Zoho, nous avons des millions d'utilisateurs qui dépendent de nos services de cloud computing. Ils comptent sur nous pour maintenir leurs activités en cours d'exécution. Lorsque nous sommes à l’arrêt, ils le sont aussi. Ne plus être en mesure d'accéder à des applications ou des services qui sont essentiels à votre entreprise vous donne le sentiment d’être impuissant. C'est dans ces moments-là que vos clients ont besoin de vous rapidement.

En cas de panne chez Zoho, la communication avec nos clients est assurée directement par notre PDG, nous voulons qu'ils sachent qu'il n'y a rien de plus important que la résolution de la panne. Comme les moyens de communication habituels avec nos clients peuvent être coupés en cas de panne IT, nous utilisons les réseaux sociaux comme Twitter et Facebook pour les tenir au courant.

Être ouvert, clair et rapide avec vos clients peut vous éviter de faire face à une fronde sur les réseaux sociaux. Rappelez-vous, les clients tweet quand ils sont contrariés !

Tous les DSI qui lisent ceci doivent se rappeler qu'il n’y a pas de bon moment pour faire face à ses peurs. Commencez la nouvelle année en mettant en place un plan de reprise d’activité. Et n'oubliez pas de faire des tests pour tout - même les extra-terrestres.

Lu 2594 fois

Vous avez la possibilité de créer un compte lors du téléchargement d'un produit.