La corrélation de pistes est le noyau dur de tout système de fusion multi-capteurs de défense. Un radar signale dix plots. Un récepteur RF passif signale six émetteurs. Un flux AIS signale quatre contacts. Le moteur de fusion doit décider quels rapports appartiennent au même objet physique — et lesquels sont des doublons, du clutter ou des contacts nouveaux. Mauvaise décision et l'opérateur voit des pistes fantômes, des trajectoires brisées ou des identités fusionnées. Bonne décision et la situation tactique commune devient fiable.

Cet article parcourt les quatre familles d'algorithmes qui dominent les piles de fusion défense opérationnelles : Global Nearest Neighbor (GNN), Joint Probabilistic Data Association (JPDA), Multi-Hypothesis Tracking (MHT) et Integrated Probabilistic Data Association (IPDA). Chacun a un régime où il l'emporte. Chacun échoue différemment lorsqu'on le pousse hors de ce régime.

Le problème de corrélation

À chaque cycle de fusion, le moteur détient N pistes existantes et reçoit M nouvelles observations. Le travail consiste à produire une matrice d'affectation — quelle observation met à jour quelle piste, quelle observation démarre une nouvelle piste, quelle piste ne reçoit pas de mise à jour ce cycle. L'espace de recherche naïf est combinatoire : N pistes appariées à M observations donnent jusqu'à (N+1)M affectations candidates une fois autorisées les nouvelles pistes et les détections manquées.

Avec dix pistes et dix observations, cela fait plus de 25 milliards de possibilités. Avec une centaine de chaque — une image aérienne courante au-dessus d'une région contestée — le nombre dépasse tout ce qu'un traqueur peut énumérer en temps réel. Chaque algorithme de corrélation de pistes est, à sa base, une stratégie pour élaguer cet espace combinatoire sans écarter l'affectation qui s'avère correcte.

L'élagage est contraint par la physique des capteurs. Les retours radar ont une covariance de mesure. Les capteurs passifs donnent des azimuts sans distance. Les rapports AIS portent des horodatages parfois vieux de plusieurs minutes. Le corrélateur doit raisonner dans un repère qui respecte toutes ces incertitudes simultanément — typiquement via une distance de Mahalanobis bornée par un seuil du chi-deux dérivé de la covariance de chaque capteur.

Global Nearest Neighbor (GNN)

GNN est le corrélateur sérieux le plus simple. Il construit une matrice de coûts où la cellule (i,j) est la distance de Mahalanobis bornée entre la piste i et l'observation j, puis résout le problème d'affectation — généralement avec l'algorithme hongrois ou la variante Jonker-Volgenant — pour produire une observation par piste et une piste par observation, en minimisant le coût total.

GNN fonctionne bien lorsque les contacts sont bien séparés, que la précision capteur est élevée et que les fausses alarmes sont rares. Une image maritime construite à partir d'AIS plus radar côtier avec un navire tous les quelques kilomètres est un cas d'école GNN. La résolution hongroise est en O(n3) mais avec n de l'ordre de la centaine, elle tient confortablement dans un cycle de fusion.

GNN s'effondre quand les cibles se rapprochent. Deux avions en formation génèrent des portes qui se chevauchent. L'affectation hongroise force un mapping un-à-un et s'engage durement sur le coût le plus bas — même si la différence de coût n'est que du bruit. Une fois la mauvaise affectation faite, la piste diverge, et la récupération exige l'intervention de l'opérateur ou un algorithme d'ordre supérieur. GNN n'a aucun souvenir de l'ambiguïté qu'il vient de résoudre.

Joint Probabilistic Data Association (JPDA)

JPDA remplace l'affectation dure par une affectation douce. Au lieu de s'engager sur « l'observation j met à jour la piste i », il calcule la probabilité que chaque observation appartienne à chaque piste et met à jour la piste avec une moyenne pondérée de toutes les observations bornées. Le poids de l'observation j sur la piste i est la probabilité d'association marginale βij, calculée en énumérant les événements conjoints faisables sur le cluster de portes qui se chevauchent.

Le résultat est une piste qui absorbe en douceur l'ambiguïté de mesure. Deux avions en formation serrée produisent des portes qui se chevauchent ; JPDA ne choisit pas entre eux mais met à jour les deux pistes avec une estimation mélangée reflétant l'incertitude. L'intégrité de la piste survit à la rencontre rapprochée même si l'estimation de position par cycle est légèrement plus bruitée.

JPDA convient bien aux scénarios denses mais bornés — formations d'aéronefs, convois de navires, essaims de drones avec cardinalité connue. Le calcul croît avec le nombre d'événements conjoints faisables dans chaque cluster, qui s'envole vite. Un cluster de six pistes avec six observations chacun en mutuelle bordée peut générer des milliers d'événements faisables. Les implémentations JPDA de production utilisent des approximations cheap-JPDA ou une énumération d'événements m-best pour maintenir le coût par cycle prévisible.

La faiblesse de JPDA, c'est le nombre de pistes. Il suppose un ensemble connu de pistes existantes. Il ne gère pas gracieusement la naissance ou la mort de pistes — une couche de gestion de pistes séparée doit ajouter les nouvelles pistes et élaguer les mortes en dehors de la mise à jour JPDA.

Multi-Hypothesis Tracking (MHT)

MHT est l'option lourde. Plutôt que de résoudre l'ambiguïté dans un seul cycle, MHT diffère la décision : il maintient un arbre d'hypothèses où chaque nœud représente un historique d'association globale possible. Quand une ambiguïté survient, MHT ramifie l'arbre plutôt que de choisir un gagnant. Les observations ultérieures confirment ou réfutent chaque branche, et l'élagage finit par recompresser l'arbre à une taille gérable.

L'arbre croît exponentiellement. Un scénario typique de défense aérienne avec une centaine de pistes et quelques événements ambigus par cycle peut produire des millions d'hypothèses en quelques secondes si l'élagage n'est pas agressif. Deux stratégies d'élagage sont standard. L'élagage N-scan s'engage sur la meilleure hypothèse après l'observation de N balayages supplémentaires — typiquement N de 3 à 5. L'élagage M-best ne garde que les M hypothèses globales de plus haute probabilité à chaque cycle, M étant généralement entre 10 et 100.

Les budgets mémoire sont non négligeables. Chaque hypothèse porte son ensemble complet de pistes, y compris les covariances d'état et les associations historiques. Les systèmes MHT de production utilisent des représentations track-oriented MHT (TOMHT) qui partagent le stockage entre hypothèses via un arbre d'ancêtres commun — l'empreinte mémoire pratique est bornée par le nombre de pistes distinctes sur toutes les hypothèses actives, pas par le nombre d'hypothèses lui-même.

MHT brille dans les scénarios encombrés, à fort enjeu et avec ambiguïté persistante. La défense antimissile balistique, le suivi de cibles à faible SER et les scénarios denses de cibles terrestres utilisent tous des variantes MHT car le coût d'une mauvaise affectation non détectée est plus élevé que le coût de calcul de plusieurs hypothèses pendant quelques secondes. Le cycle de vie de la corrélation dans un pipeline de fusion s'articule souvent autour de MHT pour ces raisons.

Integrated Probabilistic Data Association (IPDA)

IPDA étend PDA — association probabiliste de données mono-cible — en intégrant une probabilité d'existence de piste dans la récursion. Chaque piste porte non seulement une estimation d'état et une covariance, mais aussi une probabilité que la piste corresponde à un objet réel par opposition à une séquence de fausses alarmes.

Cela compte dans les scénarios à faible SNR. Un radar détectant un petit drone à longue portée produira des retours intermittents mélangés à du clutter. GNN ou JPDA soit engendreront beaucoup de pistes fausses éphémères, soit manqueront entièrement la vraie. La probabilité d'existence d'IPDA augmente à mesure que des observations confirmatives arrivent et chute quand les détections attendues manquent. L'opérateur voit une piste avec un score de confiance, pas une forêt de contacts fantômes.

IPDA convient aux types de capteurs où la qualité de piste compte plus que la précision d'association de données : défense aérienne à faible SER, réseaux de sonobouées, recherche-et-pistage électro-optique à la limite de détection. Il se compose bien avec GNN ou JPDA — la couche de probabilité d'existence peut s'asseoir au-dessus de l'une ou l'autre stratégie d'affectation.

Choisir entre eux

Le choix est mené par quatre facteurs. Type de capteur : un radar actif de haute précision tolère GNN ; les capteurs passifs azimut-seul nécessitent généralement JPDA ou MHT pour résoudre l'ambiguïté de distance par recoupement. Densité de cibles : les images clairsemées favorisent GNN ; les formations denses favorisent JPDA ; l'ambiguïté persistante favorise MHT. Contraintes temps réel : un cycle de fusion de 100 ms sur matériel embarqué exclut un ramifiement MHT agressif ; une image stratégique à 5 secondes l'accommode. Calcul disponible : GNN sur un seul cœur gère des milliers de pistes ; MHT avec élagage sérieux bénéficie encore de serveurs multi-socket.

Un schéma courant dans les systèmes de défense de production est en couches : GNN pour l'image large, JPDA dans les clusters denses, MHT réservé aux pistes hautement prioritaires où une mauvaise affectation est inacceptable, et la couche de probabilité d'existence d'IPDA appliquée sur tous les niveaux pour supprimer les pistes fantômes. Le moteur de fusion sélectionne l'algorithme par cluster, pas par système.

La matrice de décision n'est pas statique. Un système qui démarre la journée sous GNN peut escalader des clusters vers JPDA quand un vol de drones entre dans l'image, puis revenir à GNN une fois qu'ils se séparent. La couche d'orchestration surveille la densité des clusters et l'ambiguïté par piste, basculant les algorithmes de manière transparente. Les opérateurs n'ont rarement besoin de savoir quel algorithme tourne — seulement que l'image est stable. La sélection d'algorithme devient une affaire de runtime, pas de temps de déploiement.

Les déclarations des fournisseurs doivent être inspectées avec soin. Un corrélateur commercialisé comme MHT peut en fait être N=1 MHT — mono-balayage, qui s'effondre en GNN. Une implémentation JPDA qui ignore les événements conjoints de plus de trois fait du PDA par piste avec des étapes supplémentaires. Lisez les paramètres d'élagage, pas le marketing.

Réalités d'implémentation

Le choix du langage est rarement arbitraire. Les corrélateurs de production sont en C++ ou Rust. Les boucles internes — évaluation de distance de Mahalanobis, test de bornage, résolutions hongroises, scoring d'hypothèses — sont dominées par l'arithmétique en virgule flottante et des motifs d'accès mémoire serrés. Les langages à ramasse-miettes introduisent une variance de pause qui ronge le budget de latence de la fusion.

La vectorisation compte. Les tests de portes sur des centaines de paires piste-observation se mappent proprement sur les instructions SIMD ; le code de production utilise typiquement Eigen, xtensor ou des noyaux AVX-512 maison pour l'arithmétique matricielle. La construction de la matrice de coûts est souvent le goulot avant la résolution d'affectation.

L'évaluation multi-thread d'hypothèses paie en MHT. Les hypothèses sont indépendantes à travers l'arbre à une profondeur donnée, donc l'élagage par cycle peut s'étaler sur des threads ouvriers. Les pools mémoire — arènes pré-allouées pour les objets piste et hypothèse — empêchent l'allocateur de devenir le goulot de latence sous charge. Les systèmes de fusion de production réservent typiquement un budget mémoire fixe pour le corrélateur et refusent de le dépasser ; les modes dégradés tombent vers des algorithmes de plus faible fidélité avant de laisser tomber des pistes.

Point clé : Le bon algorithme est celui dont le mode de défaillance est tolérable pour l'opérateur. GNN échoue en s'engageant sur de mauvaises affectations. JPDA échoue en mélangeant les cibles proches. MHT échoue en épuisant la mémoire. IPDA échoue en attendant trop longtemps pour déclarer une vraie cible. Choisissez le mode de défaillance, puis choisissez l'algorithme.

Tests et réglage

Les algorithmes de corrélation de pistes ne peuvent pas être validés par les seuls tests unitaires. Le comportement qui compte émerge sur des milliers de cycles dans des scénarios avec du clutter réaliste, des décrochages capteur et des manœuvres de cibles.

Les scénarios synthétiques sont la fondation. Un générateur de scénarios produit des trajectoires vérité-terrain — transits en ligne droite, vols en formation, pistes croisées, manœuvres d'évasion — et les fait passer dans des modèles de capteurs qui injectent du bruit, des fausses alarmes et des détections manquées à des taux réalistes. Le corrélateur tourne contre le flux synthétique et les métriques sont calculées par rapport à la vérité-terrain.

Les données capteur enregistrées bouclent la boucle. Plots radar journalisés, flux AIS, interceptions RF d'exercices réels permettent de rejouer le corrélateur contre des scénarios qu'aucun générateur ne produirait — retours de fronts météorologiques, fantômes de multipath, brouillage déceptif. Les données enregistrées sont le seul test honnête du comportement face au clutter.

Quatre métriques opérationnelles comptent plus que les académiques. Continuité de piste : la fraction de la durée de vie de l'objet réel couverte par un identifiant de piste unique, non fragmentée. Précision de corrélation : la fraction d'observations affectées à la bonne piste. Taux de fausses pistes : pistes fantômes par heure d'observation. Latence de confirmation de piste : temps entre la première détection et la piste visible par l'opérateur. Ces quatre nombres déterminent si l'image est fiable, quel que soit l'algorithme qui l'a produite. Ils pilotent aussi l'analyse pattern-of-life en aval — une piste fragmentée détruit le signal comportemental dont dépend un moteur POL.

Le réglage est itératif. Seuils de portes, profondeurs d'élagage d'hypothèses, taux de décroissance de probabilité d'existence — aucun n'a de valeur optimale analytique pour une image opérationnelle donnée. La discipline d'ingénierie consiste à verrouiller les métriques, faire tourner les scénarios à grande échelle, et faire varier les paramètres jusqu'à convergence. Puis rejouer contre les données enregistrées pour confirmer que le réglage synthétique généralise. Puis livrer.