Les pratiques opérationnelles d’Orange en question lors de la panne des numéros d’urgence

Les pratiques opérationnelles d’Orange en question lors de la panne des numéros d’urgence

La panne des numéros d’urgence le mercredi 2 juin 2021 a révélé des insuffisances chez Orange.Au point que le gouvernement demande à l’Autorité de régulation des télécoms, de vérifier, en substance, si l’opérateur fait correctement son métier. Le manque de réactivité et de compréhension des enjeux par Orange apparaît clairement à la lecture du rapport qui vient d’être remis au Premier ministre. Six cas de décès signalés peuvent être liés à l’événement. La panne a touché les numéros d’urgence 15 (Samu), 17 (police), 18 (pompiers) et 112 (numéro européen unique).Trop de temps pour prendre des décisions clés Les équipes d’Orange ont mis beaucoup trop de temps pour prendre des décisions clés lors de la dégradation de leurs services de téléphonie malgré les messages venant de leurs clients. Des personnes d’Orange ont diffusé des messages inexacts sur les délais de retour à la normale. De plus, certains responsables d’Orange désignés comme les personnes à contacter en situation de crise ont été difficilement voire impossible à joindre. Le rapport d’audit a été établi par l’Anssi (Agence nationale de la sécurité des systèmes d’information) avec le concours de l’IGAS (Inspection générale des affaires sociales), de l’IGA (l’inspection générale de l’administration), du CGE (le Conseil général de l’économie) et du CCED (le Commissariat aux communications électroniques de défense).

La panne est due au dysfonctionnement des serveurs d’appels, fournis par Italtel, et dont la configuration a été modifiée par un technicien d’Orange le mercredi 2 juin à 16 h 44. L’impact très important de cette panne est dû à un bug informatique du constructeur, reconnaît le rapport. Néanmoins, les actions réalisées par le technicien auraient dans tous les cas causé une indisponibilité du service car l’ordre d’exécution des commandes de configuration n’était pas le bon. Sans le bug logiciel de l’équipementier, cette indisponibilité aurait toutefois été de courte durée, d’au maximum 15 minutes. La manière de modifier le paramétrage des équipements en production par l’opérateur est pointée du doigt. Il n’y a pas eu de phase de test de la nouvelle configuration et celle-ci a été installée simultanément sur tous les serveurs d’appel. Les opérations qui ont conduit au bug logiciel sur les serveurs d’appels n’ont pas été testées sur la plateforme de pré-production, car Orange ne considérait pas cette opération comme sensible. De toute façon, cette plateforme de pré-production ne possède pas d’équipements permettant de simuler la montée en charge du trafic téléphonique. Des dysfonctionnements ont été visibles dans les 5 à 10 minutes qui ont suivi le changement de configuration.

Il a fallu 1 heure pour prendre conscience de l’impact sur les numéros d’urgence Le rapport s’étonne que la mise en place d’un dispositif de gestion de crise par Orange adapté à l’ampleur des problèmes a été plus lente que celui de l’État. On pourrait s’attendre à ce qu’Orange dispose d’une surveillance plus précise et plus réactive de son réseau. En particulier, Orange a mis près de 1 heure à prendre conscience que la panne touchait en particulier les services d’urgence, 2 heures pour en informer les autorités et près de 3 heures pour mettre en place un dispositif adapté. « Cela est dû à plusieurs dysfonctionnements internes à Orange » souligne le rapport.

Aucun exercice de crise simulant une défaillance logicielle ou une attaque informatique impactant le service des numéros d’urgence n’a été réalisé par Orange ou n’a été organisé par l’État. Un retour d’expérience sur un incident de mai 2018 n’a pas profité aux exploitants ou à l’équipe de maîtrise d’œuvre des serveurs d’appels alors qu’un bug logiciel était également à l’origine de l’incident. Il existe un manque de compréhension fine du produit d’Italtel par Orange en partie dû au fait que cette technologie est vieillissante et qu’il est donc difficile de se former. Les explications fournies par Orange lors de certains entretiens ont pu se révéler inexactes.La crise qui a affecté de façon notable les communications téléphoniques les 2 et 3 juin 2021 a montré que le dispositif de crise existant au sein d’Orange devait être amélioré pour prendre en compte de façon spécifique d’éventuels dysfonctionnements affectant les services d’urgences, au niveau des délais de réaction d’une part, de la relation avec les pouvoirs publics d’autre part.

Aucune mesure particulière n’était prise pour les numéros d’urgence Dans le dispositif de gestion de crise d’Orange, la qualité de l’abonné – en l’occurrence les services d’urgences – ne constitue nullement un élément d’appréciation utilisé par l’opérateur pour caractériser une situation de crise. Il n’y a ainsi aucune mesure particulière de prévue pour des abonnés aussi sensibles que les services d’urgence, hormis une éventuelle approche commerciale renforcée avec des informations via des équipes dédiées, et ce uniquement pour ceux d’entre eux ayant souscrit un contrat spécifique auprès d’Orange Business Services.


D’ailleurs, lors des auditions des responsables d’Orange, il a été indiqué à la mission d’audit que « la décision d’activer le dispositif de crise n’avait pas été déclenchée par la remontée d’alerte de services d’urgences mais par la dégradation du trafic sur l’interconnexion entre les réseaux IP et RTC qui concernait tous les numéros ». Cette situation explique la réaction spontanée d’un représentant d’Orange durant une réunion du centre interministériel de crise indiquant « que des entreprises aussi ont été touchées », remarque perçue par certains comme l’indice d’une absence de prise en considération du caractère d’urgence vitale qui était lié à cette crise. Le rapport reconnait cependant que le caractère aléatoire des dysfonctionnements (coupures intermittentes, pas de black-out) et de leur localisation, n’a pas facilité pour Orange l’identification de la réalité et de l’ampleur du problème, ni de détecter immédiatement l’impact particulier qu’il pouvait avoir sur certains numéros sensibles. Il manquait un dispositif qui permette de détecter plus tôt un impact qui est intervenu dès 16 h 45 mais dont Orange ne semble avoir identifié l’ampleur qu’une heure plus tard, si l’on se réfère à sa main courante. Même la veille des réseaux sociaux assurée par les services marketing d’Orange, faute de lien avec les services techniques de supervision, n’a pas permis d’accélérer la détection du problème. L’un des opérateurs tiers n’a pu entrer en contact avec Orange qu’à 20 h 42.Absence de conseil de la part d’Orange pour contourner le problème Orange n’a pas fourni, que ce soit au niveau local ou au niveau national, de véritable conseil et d’aide la décision, ni de solutions de contournement, au moins durant la soirée et la nuit du 2 au 3 juin. D’une façon générale, les messages d’Orange semblent surtout avoir eu pour objet de rassurer, voire de faire patienter, comme on le ferait dans une relation commerciale classique.

Déroulé des événements chez Orange :

Les infos clés sur ce sujet


Newsletters de La Revue du Digital Retrouvez les clés de la transformation numérique chaque semaine