Vers un modèle fiable : données disponibles et données à collecter

En bref. Le système actuel peut aider à classer les alarmes critiques pour savoir lesquelles inspecter en premier. Il ne peut pas encore affirmer qu'un appareil contient une fuite réelle ni détecter correctement les fuites sur tout le réseau.

Ce que nous avons aujourd'hui

Donnée Volume Utilité
Appareils 443 Réseau surveillé
Mesures acoustiques 262 910 Historique de Minimal, Frequency et Spread
Visites de techniciens 344 Résultats observés sur le terrain
Fuites confirmées 105 Exemples positifs disponibles
Visites utilisables par les modèles 320 Appareil relié et mesure du matin disponible
Fuites utilisables par les modèles 99 Positifs réellement exploitables
Non-fuites utilisables 221 Exemples négatifs vérifiés parmi les visites
Campagnes 40 Groupes indépendants pour la validation

Les 262 910 mesures sont nombreuses, mais elles ne représentent pas 262 910 fuites connues. Les étiquettes proviennent des visites : nous disposons de 99 fuites exploitables pour apprendre après correction de l'étiquette métier BRT.

Les appareils écoutent-ils réellement le son ?

Oui. Les appareils captent une activité acoustique. Cependant, l'export utilisé actuellement contient surtout trois résumés calculés à partir du signal :

Nous ne disposons pas encore d'un corpus d'enregistrements audio bruts reliés aux visites. Le modèle actuel apprend donc le comportement des résumés acoustiques dans le temps, pas directement le son complet.

Pourquoi les fuites confirmées ne suffisent pas

Le modèle doit apprendre deux choses :

  1. à quoi ressemble une fuite confirmée ;
  2. à quoi ressemble un bruit suspect qui n'est pas une fuite.

Les non-fuites vérifiées sont indispensables : pompe, vanne, trafic, consommation normale, fontaine, bruit mécanique ou défaut du capteur. Sans ces contre-exemples, le système classerait facilement tout bruit inhabituel comme une fuite.

Un appareil jamais visité reste inconnu. Il ne doit pas être automatiquement étiqueté « pas de fuite ».

Le biais créé par la méthode actuelle

Les techniciens se déplacent principalement après une alarme critique. Les données disponibles répondent donc surtout à cette question :

Parmi les alarmes critiques déjà sélectionnées, lesquelles ont le plus de chances de correspondre à une fuite ?

Elles ne permettent pas encore de répondre correctement à cette question plus large :

Parmi les 443 appareils du réseau, où se trouvent toutes les fuites, y compris celles qui ne déclenchent pas d'alarme critique ?

C'est un biais de sélection. Aucun algorithme ne peut apprendre les résultats des appareils que personne ne vérifie.

Ce que fait le classement actuel

La meilleure combinaison observée dans le benchmark est :

Anomalie propre à l'appareil + Extra Trees + Random Forest

Elle combine :

Le résultat est une priorité relative d'inspection, pas une probabilité certaine de fuite. Le classement indique « inspecter cet appareil avant celui-là ». Le technicien confirme ensuite la cause réelle.

Combien de données supplémentaires faut-il ?

Il n'existe pas de nombre magique. Les volumes suivants sont des objectifs pratiques ; la décision finale devra dépendre des performances sur de nouvelles campagnes jamais utilisées pendant l'entraînement.

Pour un classement solide parmi les alarmes critiques

Objectif Disponible Reste approximatif
Fuites confirmées indépendantes 150 à 200 99 51 à 101
Non-fuites confirmées 800 à 1 200 221 579 à 979

Ce niveau peut permettre un outil fiable d'aide à la priorisation, à condition que les nouvelles données couvrent plusieurs appareils, campagnes, périodes et conditions de terrain.

Les 99 positifs disponibles sont des visites étiquetées, pas encore 99 événements physiques indépendants. Les colonnes « reste » sont donc optimistes tant qu'un identifiant unique de fuite ne permet pas de regrouper les visites liées à la même fuite.

Pour détecter sur l'ensemble du réseau

Objectif Disponible Reste approximatif
Fuites confirmées indépendantes 200 à 500 99 101 à 401
Non-fuites représentatives 1 000 à 3 000 221 779 à 2 779

Les non-fuites devront alors inclure des audits d'appareils normal et alarming, pas uniquement des appareils déjà critiques.

Le nombre important est celui des événements physiques indépendants. Mille mesures provenant de la même fuite ne remplacent pas mille fuites différentes.

Données à enregistrer lors de chaque visite

Politique de collecte recommandée

Pour chaque campagne :

  1. inspecter les sept premières alarmes classées ;
  2. ajouter une visite d'audit aléatoire en dehors de cette sélection ;
  3. enregistrer le résultat avec les mêmes champs structurés ;
  4. comparer les recommandations aux résultats réels ;
  5. réentraîner et revalider périodiquement le benchmark.

Si une visite hors alarme est impossible pour le moment, le système peut quand même améliorer l'ordre des alarmes critiques. Il faudra simplement présenter clairement sa portée : classement des alarmes, pas détection complète du réseau.

Étapes vers la production

Étape Utilisation Condition de passage
Mode observation Le classement fonctionne sans modifier les décisions des techniciens Vérifier les résultats sur de nouvelles campagnes
Pilote assisté Sept visites classées + une visite d'audit Gain stable, erreurs comprises et résultats bien enregistrés
Aide à la décision en production Le classement organise réellement les tournées Validation temporelle et géographique suffisante
Classification élargie Estimation fuite / non-fuite au-delà des alarmes critiques Audits représentatifs sur tous les statuts

Le meilleur objectif à court terme n'est pas de remplacer le technicien. Il est de lui donner un meilleur ordre de visite tout en collectant les données nécessaires à un futur système plus fiable.