Nos confrères de Datacenter Knowledge publient un article décapant sur les risques provoqués par des opérations de maintenance abusives.
La thèse est soutenue par Steve Fairfax, Président de MTechnology (des spécialistes de l’analyse de risque), lequel explique que la maintenance est un business lucratif, qui entraîne les prestataires à « pousser à la consommation », à entretenir un climat de suspicion et de doute dans l’esprit de leur client. Or, il semble que le principe du « on ne doit pas toucher un outil qui fonctionne » s’applique à pratiquement tous les corps de métier. Statistiquement, explique Fairfax, plus les opérations de maintenance sont intensives, plus elles sont susceptibles de provoquer des accidents. Et de citer comme preuve l’accident de la centrale nucléaire de Three Miles Islande aggravé par la fermeture d’une vanne stratégique durant une opération de maintenance préventive.
Chaque opération de maintenance préventive doit être mûrement réfléchie et documentée, particulièrement dans le domaine si critique des Datacenters. Et Fairfax de déclarer « if you buy a 2N data center, you’ll have twice as many component failures as a 1N data center. But you’ll be more reliable ». Ce principe, baptisé le syndrome du bimoteur, avait été énoncé par IBM dans les années 50 : statistiquement, un avion bimoteur tombe deux fois plus souvent en panne qu’un monomoteur, mais le niveau de risque est fortement diminué.
Reste qu’une redondance des architectures d’un Datacenter peut être compromise si les opérations de maintenance préventive sont entachées de mauvaises pratiques et si leurs applications sont codifiées et strictement appliquées aux deux installations. C’est ce que l’on pourrait appeler le principe de la duplication virale des disques montés en RAID 1.