Détection acoustique des fuites : lecture critique 1999–2026
Conclusion centrale. La difficulté principale n'est plus de choisir entre CNN, XGBoost ou SVM. Elle consiste à obtenir une vérité terrain indépendante et à démontrer qu'un modèle reste fiable sur de nouveaux appareils, de nouvelles conduites, d'autres saisons et des bruits jamais observés.
Trajectoire des travaux doctoraux
| Année | Sujet doctoral | Apport | Difficulté restée ouverte |
|---|---|---|---|
| 2011 | Bruit de fuite dans les conduites plastiques | Caractérisation expérimentale de la propagation | Forte atténuation selon pression, fréquence et distance |
| 2013 | Corrélation acoustique dans le plastique enterré | Choix de bande, vitesse d'onde et intervalles d'incertitude | Résonances et vitesse inconnue rendent la localisation instable |
| 2018 | Détection et localisation automatisées | Accéléromètres, noise loggers, clustering et pilote montréalais | Les essais contrôlés représentent mal toute la ville |
| 2024 | Méthodes transitoires et stationnaires | Détection plus rapide, meilleure estimation du délai | Multipaths, plastique et paramètres physiques incertains |
| 2024–2025 | Apprentissage auto/semi-supervisé | Exploitation d'importants volumes non étiquetés | Pseudo-étiquettes, augmentation et transfert entre réseaux |
| 2026 | Capteurs vectoriels embarqués | Sensibilité à des défauts plus petits dans le plastique | Coût et déploiement d'une inspection robotisée |
Ce qui bloque encore les systèmes autonomes
1. Peu de fuites réellement indépendantes
Une étude municipale à Munich disposait de trois mois d'enregistrements sur sept capteurs, mais d'une seule fuite naturelle proche. Les fuites lointaines ont dû être simulées. Les scores proches de 100 % obtenus à proximité sont descendus vers 70–78 % pour le cas lointain synthétique.
Notre situation est comparable : 344 validations, 105 fuites étiquetées, mais seulement 320 événements strictement exploitables, dont 99 fuites avec mesure le matin même.
2. Le nombre de segments n'est pas le nombre de fuites
Certaines études divisent quelques centaines d'enregistrements en dizaines de milliers de segments d'une seconde. Si les segments d'un même fichier passent dans l'apprentissage et le test, le modèle peut reconnaître le site ou le fichier plutôt qu'une nouvelle fuite. Nos séparations doivent donc se faire par événement physique, appareil, campagne et zone — jamais par ligne aléatoire.
3. Le système existant choisit déjà ce que le technicien voit
Les appareils inspectés sont surtout ceux que l'alarme a présélectionnés. Un appareil jamais inspecté n'est pas un négatif : il est inconnu. Sans audits hors alarme, le rappel réel sur tout le réseau est impossible à mesurer.
4. Les bruits urbains ressemblent aux fuites
Pompes, réducteurs de pression, vannes, consommation, trafic, transformateurs, fontaines et bruits mécaniques persistants peuvent produire des signatures proches. Dans la règle métier corrigée, BRT désigne une fuite ; les observations STAB, fontaine et autres négatifs terrain restent des contre-exemples précieux.
5. La signature dépend de l'infrastructure
Le matériau, le diamètre, la pression, la taille de fuite, la distance, le sol, les branchements et le montage du capteur modifient le signal. Les hautes fréquences disparaissent avec la distance; les conduites plastiques sont particulièrement difficiles.
6. La confiance opérationnelle exige une explication
Un modèle doit montrer la variation par rapport au niveau habituel de l'appareil, la persistance, la fréquence, le spread et les cas terrain analogues. Un score opaque ne suffit pas pour une infrastructure critique.
Positionnement doctoral proposé
Confirmation sélective et semi-supervisée des fuites urbaines à partir d'historiques acoustiques bas débit, sous rareté des étiquettes techniciennes et biais de sélection par alarme.
Cette formulation est plus originale et défendable qu'une simple application de CNN. Elle correspond exactement aux données disponibles : des résumés commerciaux longitudinaux, de nombreuses mesures non étiquetées et peu de confirmations positives.
Changements de protocole prioritaires
- Attribuer un
leak_event_idunique à chaque fuite physique, même si plusieurs appareils l'entendent. - Enregistrer méthode de confirmation, type et taille approximative, conduite, pression, distance, réparation et confiance du technicien.
- Reprendre une mesure après réparation pour obtenir des paires avant/après au même emplacement.
- Conserver sept visites classées + une visite d'audit hors top 7.
- Valider dans le futur, sur appareils inconnus et sur zones inconnues.
- Évaluer le rappel, la PR-AUC, la calibration et les visites évitées — pas uniquement l'accuracy.
- Introduire progressivement une décision à trois sorties : fuite probable, pas de fuite probable, technicien requis.
Modèles cohérents avec nos données
L'export contient Minimal, Frequency et Spread, mais pas d'audio brut exploitable. Une CNN sur spectrogrammes serait donc prématurée. La séquence rationnelle est :
- changements relatifs à la normale propre de chaque appareil;
- gradient boosting interprétable et modèles temporels simples;
- apprentissage semi-supervisé sur l'historique non étiqueté;
- apprentissage positif–non-étiqueté pour les appareils jamais visités;
- classification sélective avec abstention;
- apprentissage contrastif audio seulement si les enregistrements bruts deviennent accessibles.
Sources primaires sélectionnées
- Papastefanou — bruit de fuite dans les conduites plastiques, thèse 2011
- Almeida — méthodes acoustiques améliorées pour le plastique enterré, thèse 2013
- El-Zahab — détection et localisation des fuites, thèse 2018
- Müller et al. — détection acoustique sur réseau municipal, 2021
- Bykerk & Valls Miro — validation terrain à Sydney, 2022
- Uchendu — méthodes transitoires et stationnaires, thèse 2024
- Liu et al. — apprentissage contrastif avec peu d'étiquettes, 2024
- Interprétabilité des modèles acoustiques, 2025
- Généralisation et transfert entre réseaux, 2025
- Watts — capteurs acoustiques vectoriels robotisés, thèse 2026