Panne de Microsoft : « Probablement une erreur humaine » | RCI
Stéphanie Dupuis
15 h 18Mis à jour à 16 h 48
Une mise à jour du logiciel antivirus CrowdStrike déployée sur les technologies de Microsoft vers minuit continue de causer des maux de tête aux aéroports, réseaux ferroviaires, hôpitaux, banques et entreprises de télécommunications. Et si tout ce brouhaha avait pu être évité?
Aux aurores, des gens de partout dans le monde ont vu un écran bleu apparaître sur leur ordinateur de Microsoft. Même si on a un système hébergé chez Amazon ou Google, si le système d’exploitation est de Microsoft, ça peut l'affecter si on a la combinaison avec le produit CrowdStrike installée, explique Éric Parent, fondateur et président-directeur général d'Eva Technologies.
Il n’y a pas un pays dans le monde qui n’est pas touché.L'origine de cette panne majeure est probablement humaine : On semble avoir fait l’erreur de pousser en production cette mise à jour sur tout le monde, sans que tous les bons tests aient été faits, note le spécialiste en cybersécurité.
CrowdStrike est un produit américain plus évolué qu’un simple antivirus. Il utilise le partage d’informations entre les différents clients afin de détecter que quelque chose est en train de se passer, précise M. Parent.
Sa nature d’antivirus fait en sorte qu’il s’incruste près du noyau du réseau, et plus on s’approche du noyau, plus les conséquences peuvent être catastrophiques : Le périmètre dans le réseau a des couches, des cercles autour du noyau. À mesure qu’on se rapproche du cercle 0, on peut briser le système d’exploitation.
CrowdStrike s’intègre au cercle 0, dans le milieu. C’est très intime, car c'est un antivirus. Il doit tout voir sur le système. Donc quand quelque chose brise là, on a cet effet [de panne majeure].En entrevue au réseau américain CNBC vendredi matin, le PDG et cofondateur de CrowdStrike George Kurtz a affirmé que la mise à jour avait été testée en laboratoire, mais qu'aucune anomalie n'avait alors été détectée. Ce n'est que lorsqu'elle a été déployée que des problèmes se sont manifestés et que l'équipe a fait marche arrière.
Ce qu'il aurait été mieux de répondre, c'est : "nous allons travailler avec Microsoft pour comprendre pourquoi les tests que nous avons faits n'ont pas décelé le problème.", réplique Éric Parent.
Il ne faut pas oublier que ce type de mise à jour se fait à tous les jours. Donc s'il y a un problème dans la chaîne de tests, s'ils ont fait les tests et que pour eux, tout est beau, il y a clairement [une faille dans leur façon de faire], ajoute-t-il.
Il faut faire nos devoirsD’après Éric Parent, si les répercussions sont aussi grandes, c'est parce que nous sommes, certes, dépendants de ces technologies, mais surtout parce que nous ne sommes pas assez résilients face à elles.
Afin d’éviter ce genre de situation, il suggère de doubler les systèmes. Une infrastructure A pourrait utiliser une technologie X, et une infrastructure B, une technologie Y. Ou encore, les infrastructures A et B pourraient utiliser la même technologie, mais l’une des deux serait configurée pour être mise à jour 24 heures plus tard.
Ainsi, lorsqu’il y a une panne ou un bris, ça ne touche que la moitié de notre infrastructure. Oui, on tombe en mode dégradé, mais on continue à livrer des services, indique-t-il.
Éric Parent, spécialiste en sécurité informatique et PDG d'Eva Technologies
Photo : Radio-Canada / Vincent Champagne
Éric Parent insiste : ce sont des risques que les spécialistes relèvent depuis des années. [Les entreprises] qui laissent ça comme ça, ça veut dire qu’elles acceptent le risque, que ça se peut qu’elles se réveillent un matin et que rien ne fonctionne.
Il faut faire nos devoirs et monter notre infrastructure en conséquence. Que faire si votre écran est bleu?Les personnes qui font face à un écran mort sur leur ordinateur peuvent tenter de le redémarrer. Dans beaucoup de cas, c’est suffisant pour régler le problème, note Éric Parent.
Si le problème persiste, c’est du côté des services de technologie de l’information (TI) qu’il faut se tourner.
Des fois, ça prend une interaction humaine, manuelle, pour faire plusieurs actions et effacer certains fichiers, redémarrer les systèmes un à la fois. Ça ne se fait pas en claquant des doigts.Ce qui est certain, c’est que les TI n’auront pas de vacances cette fin de semaine, note l’expert, soulagé que ça ne soit pas arrivé pendant les Jeux olympiques de Paris, où les conséquences auraient été décuplées.