Détection acoustique des fuites : lecture critique 1999–2026

Conclusion centrale. La difficulté principale n'est plus de choisir entre CNN, XGBoost ou SVM. Elle consiste à obtenir une vérité terrain indépendante et à démontrer qu'un modèle reste fiable sur de nouveaux appareils, de nouvelles conduites, d'autres saisons et des bruits jamais observés.

Trajectoire des travaux doctoraux

Année	Sujet doctoral	Apport	Difficulté restée ouverte
2011	Bruit de fuite dans les conduites plastiques	Caractérisation expérimentale de la propagation	Forte atténuation selon pression, fréquence et distance
2013	Corrélation acoustique dans le plastique enterré	Choix de bande, vitesse d'onde et intervalles d'incertitude	Résonances et vitesse inconnue rendent la localisation instable
2018	Détection et localisation automatisées	Accéléromètres, noise loggers, clustering et pilote montréalais	Les essais contrôlés représentent mal toute la ville
2024	Méthodes transitoires et stationnaires	Détection plus rapide, meilleure estimation du délai	Multipaths, plastique et paramètres physiques incertains
2024–2025	Apprentissage auto/semi-supervisé	Exploitation d'importants volumes non étiquetés	Pseudo-étiquettes, augmentation et transfert entre réseaux
2026	Capteurs vectoriels embarqués	Sensibilité à des défauts plus petits dans le plastique	Coût et déploiement d'une inspection robotisée

Ce qui bloque encore les systèmes autonomes

1. Peu de fuites réellement indépendantes

Une étude municipale à Munich disposait de trois mois d'enregistrements sur sept capteurs, mais d'une seule fuite naturelle proche. Les fuites lointaines ont dû être simulées. Les scores proches de 100 % obtenus à proximité sont descendus vers 70–78 % pour le cas lointain synthétique.

Notre situation est comparable : 344 validations, 105 fuites étiquetées, mais seulement 320 événements strictement exploitables, dont 99 fuites avec mesure le matin même.

2. Le nombre de segments n'est pas le nombre de fuites

Certaines études divisent quelques centaines d'enregistrements en dizaines de milliers de segments d'une seconde. Si les segments d'un même fichier passent dans l'apprentissage et le test, le modèle peut reconnaître le site ou le fichier plutôt qu'une nouvelle fuite. Nos séparations doivent donc se faire par événement physique, appareil, campagne et zone — jamais par ligne aléatoire.

3. Le système existant choisit déjà ce que le technicien voit

Les appareils inspectés sont surtout ceux que l'alarme a présélectionnés. Un appareil jamais inspecté n'est pas un négatif : il est inconnu. Sans audits hors alarme, le rappel réel sur tout le réseau est impossible à mesurer.

4. Les bruits urbains ressemblent aux fuites

Pompes, réducteurs de pression, vannes, consommation, trafic, transformateurs, fontaines et bruits mécaniques persistants peuvent produire des signatures proches. Dans la règle métier corrigée, BRT désigne une fuite ; les observations STAB, fontaine et autres négatifs terrain restent des contre-exemples précieux.

5. La signature dépend de l'infrastructure

Le matériau, le diamètre, la pression, la taille de fuite, la distance, le sol, les branchements et le montage du capteur modifient le signal. Les hautes fréquences disparaissent avec la distance; les conduites plastiques sont particulièrement difficiles.

6. La confiance opérationnelle exige une explication

Un modèle doit montrer la variation par rapport au niveau habituel de l'appareil, la persistance, la fréquence, le spread et les cas terrain analogues. Un score opaque ne suffit pas pour une infrastructure critique.

Positionnement doctoral proposé

Confirmation sélective et semi-supervisée des fuites urbaines à partir d'historiques acoustiques bas débit, sous rareté des étiquettes techniciennes et biais de sélection par alarme.

Cette formulation est plus originale et défendable qu'une simple application de CNN. Elle correspond exactement aux données disponibles : des résumés commerciaux longitudinaux, de nombreuses mesures non étiquetées et peu de confirmations positives.

Changements de protocole prioritaires

Attribuer un leak_event_id unique à chaque fuite physique, même si plusieurs appareils l'entendent.
Enregistrer méthode de confirmation, type et taille approximative, conduite, pression, distance, réparation et confiance du technicien.
Reprendre une mesure après réparation pour obtenir des paires avant/après au même emplacement.
Conserver sept visites classées + une visite d'audit hors top 7.
Valider dans le futur, sur appareils inconnus et sur zones inconnues.
Évaluer le rappel, la PR-AUC, la calibration et les visites évitées — pas uniquement l'accuracy.
Introduire progressivement une décision à trois sorties : fuite probable, pas de fuite probable, technicien requis.

Modèles cohérents avec nos données

L'export contient Minimal, Frequency et Spread, mais pas d'audio brut exploitable. Une CNN sur spectrogrammes serait donc prématurée. La séquence rationnelle est :

changements relatifs à la normale propre de chaque appareil;
gradient boosting interprétable et modèles temporels simples;
apprentissage semi-supervisé sur l'historique non étiqueté;
apprentissage positif–non-étiqueté pour les appareils jamais visités;
classification sélective avec abstention;
apprentissage contrastif audio seulement si les enregistrements bruts deviennent accessibles.