Concevoir une plateforme SIGINT de zéro signifie prendre des centaines de décisions d'ingénierie qui s'accumulent en engagements architecturaux durables pour des années. Le matériel de collecte RF que vous choisissez contraint votre pipeline de traitement. Votre pipeline de traitement détermine quels produits de renseignement vous pouvez générer. Votre architecture de stockage détermine la rapidité avec laquelle les analystes peuvent récupérer les données historiques. Chaque couche affecte chaque autre couche, et corriger une mauvaise décision à l'interface de collecte coûte aussi cher que reconstruire la plateforme.

Cet article parcourt l'architecture complète d'une plateforme SIGINT — couche de collecte, pipeline de traitement, moteur de classification, couche de stockage, flux de travail des analystes, modèles de scalabilité et gestion de la sécurité — avec suffisamment de détails d'implémentation pour éclairer de vraies décisions de conception. L'objectif est une architecture de référence couvrant les décisions importantes, pas un inventaire de fonctionnalités.

Vue d'ensemble des composants de la plateforme

Une plateforme SIGINT de production comprend cinq couches distinctes, chacune avec des exigences séparées de débit et de latence :

Couche de collecte. Le matériel SDR, les réseaux d'antennes et les numériseurs frontaux convertissent les signaux électromagnétiques en flux d'échantillons IQ. Cette couche produit des données à des débits allant de centaines de mégaoctets à plusieurs gigaoctets par seconde par nœud de collecte. Tout ce qui est en aval est limité par ce que cette couche peut fournir.

Pipeline de traitement du signal. Les échantillons IQ circulent à travers les étapes de canalisation, détection, démodulation et décodage de protocole. Le pipeline doit maintenir le débit de collecte complet en temps réel. La latence de la capture d'échantillon à la sortie de détection est typiquement de 10 à 500 ms selon la profondeur de traitement.

Moteur de classification. Les signaux détectés sont classifiés par type de modulation, protocole et identité d'émetteur. La classification s'exécute sur la sortie intermédiaire du pipeline, pas sur l'IQ brut, ce qui rend possible d'appliquer des calculs plus lourds — réseaux neuronaux, recherches en base de données, corrélation croisée — sans bloquer le pipeline temps réel.

Couche de stockage. Les archives IQ brutes, les enregistrements de détection structurés, les bases de données de géolocalisation et les rapports de renseignement ont chacun des exigences différentes de rétention, de requêtes et de contrôle d'accès et ne devraient pas partager un seul système de stockage.

Couche de flux de travail des analystes. La file d'attente de tâches, l'interface de station de travail, la gestion des listes de surveillance et les modèles de rapports traduisent les produits de renseignement bruts en sorties utilisables pour les consommateurs. Cette couche est l'endroit où la qualité du système SIGINT est la plus visible pour les utilisateurs finaux, et pourtant c'est la couche dans laquelle les équipes d'ingénierie concentrées sur le DSP investissent le moins souvent.

Couche de collecte RF : sélection du matériel SDR et planification des fréquences

Le matériel de collecte définit la couverture fréquentielle, la bande passante instantanée, la plage dynamique et les caractéristiques de cohérence de phase de tout ce que la plateforme peut observer. Ces paramètres ne sont pas améliorables par logiciel.

Sélection du matériel. Le matériel Ettus Research USRP (N310, N320, X410) est le choix le plus courant pour les déploiements de développement et mobiles — il a des pilotes UHD matures, un support communautaire étendu et couvre du DC à 6 GHz avec jusqu'à 400 MHz de bande passante instantanée sur le X410. Les cartes Analog Devices basées sur AD9361 (ADALM-PLUTO, ADRV9361) offrent des facteurs de forme extrêmement compacts au prix d'une plage dynamique et d'une bande passante réduites. Pour la collecte stratégique sur site fixe, les numériseurs spécialement construits de Pentek, Mercury Systems ou Curtiss-Wright dépassent significativement les performances des frontaux SDR commerciaux.

Planification de la couverture fréquentielle. Aucun récepteur unique ne couvre l'ensemble du spectre RF d'intérêt. Les missions SIGINT de défense s'étendent sur HF (3–30 MHz, COMINT longue portée et radar OTH), VHF/UHF (30–3000 MHz, communications tactiques et radar bande L) et SHF (3–30 GHz, liaisons micro-ondes et radars C/X/Ku). La planification de couverture alloue du matériel spécifique aux bandes de fréquences selon la priorité de collecte.

Réseaux d'antennes. La radiogoniométrie nécessite un réseau d'antennes multi-éléments cohérent avec un espacement connu entre les éléments. Un réseau circulaire de 8 à 16 éléments permet une couverture azimutale complète avec une précision AOA de 1 à 3 degrés RMS en conditions de ciel dégagé. L'espacement des éléments doit être calibré avec une précision inférieure à la longueur d'onde ; les données de calibration sont chargées par le logiciel de traitement au démarrage.

Décision clé : La cohérence de phase entre les canaux récepteurs est obligatoire pour la radiogoniométrie et le TDOA. Réalisez cela avec un oscillateur de référence partagé (OCXO 10 MHz discipliné par GPS) distribué à tous les frontaux, pas avec des horloges indépendantes par récepteur. Les architectures cohérentes en phase ne peuvent pas être ajoutées après coup sur du matériel qui n'a pas été conçu pour cela.

Pipeline de traitement du signal : de la capture IQ au décodage de protocole

Le pipeline de traitement transforme un flux continu d'échantillons IQ en enregistrements de détection structurés. Les étapes sont bien définies ; le défi d'ingénierie consiste à maintenir le débit temps réel sur toutes simultanément.

Canalisation. Un banc de filtres polyphasés (PFB) divise le flux IQ large bande en canaux étroite bande. Une entrée large de 100 MHz échantillonnée à 125 Msps produit — après canalisation — environ 1000 canaux de 100 kHz chacun. Chaque canal est surveillé indépendamment par les étapes suivantes. Le PFB est computationnellement intensif à cette échelle ; l'implémentation GPU avec cuFFT réduit le temps de traitement de 10 à 20 fois par rapport au CPU. GNU Radio fournit un bloc de canaliseur polyphasé de qualité production.

Détection d'énergie. Chaque canal est surveillé par un détecteur d'énergie CFAR (taux de fausses alarmes constant) qui compare la puissance instantanée à une estimation localement calculée du plancher de bruit. Lorsqu'un canal franchit le seuil de détection, le détecteur enregistre le temps de début, la fréquence et la bande passante du signal et initie l'extraction d'échantillons. Le taux d'adaptation CFAR est un paramètre de réglage clé — trop rapide et le détecteur s'adapte à un signal persistant et cesse de le détecter ; trop lent et il réagit lentement aux variations du plancher de bruit.

Démodulation. Une fois un signal extrait, le démodulateur est sélectionné en fonction de la sortie de la classification automatique de modulation (AMC). AMC exécute d'abord un extracteur de caractéristiques léger — caractéristiques cyclostationnaires, statistiques instantanées d'amplitude/fréquence/phase — et route vers un démodulateur candidat. Les blocs démodulateurs de GNU Radio couvrent la plupart des formes d'onde courantes ; les décodeurs spécifiques aux protocoles (P25, DMR, TETRA, ADS-B, Mode S) sont disponibles comme modules open source.

Décodage de protocole. Au-dessus du démodulateur, les décodeurs de protocole extraient des informations structurées du flux de bits. Pour les protocoles bien documentés (ADS-B, Mode S, DMR, APRS), des décodeurs open source matures existent. Les signaux non décodés restent précieux — l'analyse de trafic sur les schémas d'interception produit un renseignement significatif sans accès au contenu.

Moteur de classification des signaux : reconnaissance CNN des modulations et identification des émetteurs

La classification s'exécute sur la sortie des étapes de détection et de démodulation, ajoutant une signification sémantique aux paramètres de signal bruts. Il y a trois problèmes de classification distincts dans une plateforme SIGINT.

Classification de modulation. L'AMC basé sur CNN prend un segment IQ de longueur fixe (typiquement 128 à 1024 échantillons) et produit une distribution de probabilité sur les classes de modulation. L'architecture la plus largement utilisée dans la recherche SIGINT de défense est un ResNet 1D ou une architecture convolutive légère entraînée sur le jeu de données RadioML. La latence d'inférence est de 0,5 à 2 ms par segment sur un GPU, permettant la classification en temps réel de tous les signaux détectés.

Empreinte de protocole. Au-delà du type de modulation, la plateforme identifie des formes d'onde spécifiques par leur structure au niveau des bits. Une base de données de signatures de protocoles connues — mots de synchronisation, formats d'en-tête, séquences d'octets caractéristiques — est mise en correspondance avec des flux de bits décodés. L'empreinte identifie qu'un signal n'est pas seulement « 4FSK » mais spécifiquement « P25 Phase 1 CQPSK avec un ID de groupe de conversation spécifique ».

Identification d'émetteur. L'empreinte RF extrait les imperfections matérielles spécifiques au dispositif du signal : signature de bruit de phase, rapport de déséquilibre IQ, décalage de fréquence porteuse et son taux de dérive dans le temps. Ces caractéristiques sont stables entre les interceptions du même émetteur physique et diffèrent entre les émetteurs du même modèle. Ceci est particulièrement précieux pour le suivi des émetteurs mobiles qui changent de fréquences ou d'indicatifs entre les interceptions.

Architecture de stockage : archive IQ, index de métadonnées et base de données de relèvements

Le stockage SIGINT s'étend sur trois niveaux avec des exigences fondamentalement différentes qui ne peuvent pas être regroupées dans un seul système sans pénalités de performances et de sécurité.

Archive IQ brute. Les données IQ brutes doivent être stockées dans un format supportant une récupération efficace par plage de temps et lisible par des outils standard de traitement du signal. SigMF (Signal Metadata Format) est la norme émergente — il associe des fichiers IQ binaires avec des métadonnées JSON et prend en charge les annotations pour les segments marqués. Pour l'analyse en masse, Apache Parquet avec Apache Arrow permet un traitement par lots vectorisé. La rétention est typiquement courte — 6 à 72 heures de tampon roulant — en raison du volume de données extrême.

Index de métadonnées. Les enregistrements de détection, les sorties de démodulation, les résultats de classification et les annotations des analystes forment l'index de renseignement structuré. PostgreSQL avec PostGIS fournit la combinaison de capacités de requêtes relationnelles et d'indexation géospatiale requises pour l'analytique SIGINT : « trouver toutes les détections de ce type d'émetteur dans un rayon de 50 km de ce carré de grille au cours des 48 dernières heures » est une requête standard d'analyste.

Base de données de relèvements. Les mesures de relèvement AOA et les enregistrements de différence de temps TDOA sont stockés séparément des métadonnées de détection car ils sont traités par un moteur de géolocalisation dédié. Un enregistrement de relèvement lie une mesure au site qui l'a générée, à l'enregistrement de détection auquel il se réfère, et à l'horodatage avec une précision à la microseconde. TimescaleDB ou ClickHouse répondent à l'exigence de latence d'écriture inférieure à la milliseconde.

Flux de travail des analystes : tâches, listes de surveillance et rapports

La couche de flux de travail des analystes est l'endroit où les produits de renseignement SIGINT sont créés. Sa bonne ou mauvaise conception détermine si la plateforme est utilisée ou contournée.

File d'attente de tâches. Le tasking de collecte spécifie ce que le système doit rechercher : bandes de fréquences à surveiller en continu, fréquences spécifiques ou types d'émetteurs à prioriser, zones de collecte géographiques et fenêtres de collecte planifiées versus persistantes. Les formats de tasking lisibles par machine (basés sur NATO STANAG 4559 ou des schémas XML internes) permettent de générer du tasking de manière programmatique à partir des exigences de renseignement en aval.

Conception de la station de travail. Une station de travail d'analyste SIGINT doit afficher trois vues simultanément : spectrale (cascade et affichage de persistance montrant l'énergie fréquence-temps), géographique (carte montrant les sites de collecte, les localisations d'émetteurs détectés et les historiques de pistes) et temporelle (chronologie de l'activité des émetteurs, file d'attente d'interception avec notation de priorité). Les applications de bureau basées sur Electron fournissent une intégration native avec l'OS tout en permettant à la même base de code frontend React de s'exécuter dans un navigateur.

Gestion des listes de surveillance. Les listes de surveillance définissent les émetteurs, réseaux ou fréquences prioritaires dont la détection déclenche des alertes immédiates. La correspondance des listes de surveillance s'exécute en tant que processeur de flux contre la sortie de détection, pas en tant que requête par lot, pour minimiser la latence des alertes. Les analystes ont besoin d'une interface en libre-service pour créer, modifier et désactiver les entrées de liste de surveillance sans intervention d'ingénieurs.

Modèles de rapports. Les produits de renseignement SIGINT suivent des formats de rapport standardisés : les rapports ELINT enregistrent les paramètres des émetteurs et l'analyse des modes ; les rapports COMINT enregistrent le contenu des interceptions, l'analyse du trafic et les mappages des réseaux de communication ; les rapports de géolocalisation enregistrent les fixes avec des ellipses d'erreur. Les modèles pré-remplissent les champs à partir de la base de données de détection structurée.

Modèles de scalabilité : streaming Kafka, nœuds de collecte horizontaux, clusters GPU

Une plateforme SIGINT à site unique peut être réalisée comme une application monolithique. Un réseau de collecte multi-sites à haute bande passante nécessite une architecture de scalabilité délibérée.

Kafka pour le streaming IQ. Apache Kafka sert d'épine dorsale de distribution pour les blocs d'échantillons IQ et les événements de détection sur un cluster de traitement distribué. Les nœuds de collecte publient des blocs IQ dans des topics Kafka partitionnés par bande de fréquence ; les consommateurs de traitement s'abonnent aux partitions pertinentes et produisent des enregistrements de détection vers les topics en aval. Ce découplage permet une mise à l'échelle horizontale indépendante de la collecte et du traitement, et fournit un tampon de relecture à court terme pour la récupération après des défaillances de nœuds.

Nœuds de collecte horizontaux. Les nœuds de collecte sont sans état par rapport au traitement — ils publient l'IQ et reçoivent des mises à jour de tasking. Cela rend la mise à l'échelle horizontale simple : ajouter un nouveau nœud de collecte avec un nouveau frontal SDR nécessite seulement d'enregistrer le nœud dans le système de tasking et de démarrer le logiciel de collecte avec la configuration appropriée. L'orchestration de conteneurs (Kubernetes) gère le cycle de vie du logiciel de collecte.

Clusters GPU de traitement. L'analyse spectrale basée sur FFT, la canalisation polyphasée et l'inférence de réseau neuronal pour l'AMC sont toutes accélérables par GPU. Un nœud GPU exécutant la canalisation basée sur cuFFT peut traiter un débit de 40 à 100 Gsps. La contrainte pratique sur l'utilisation de clusters GPU dans les déploiements tactiques est la puissance et le refroidissement : un serveur GPU haute performance consomme 2 à 5 kW.

Sécurité et gestion de la classification

La sécurité dans une plateforme SIGINT n'est pas une fonctionnalité ajoutée à la fin — c'est une contrainte architecturale qui détermine comment les données circulent entre chaque composant.

Étiquettes de classification des données. Chaque objet de données est marqué d'un niveau de classification et de mentions de traitement lors de la création. Les étiquettes de classification sont immuables — elles peuvent être élevées mais jamais abaissées, sauf par un processus de désinfection approuvé. La couche de stockage impose une rétention tenant compte de la classification : les données de classification supérieure ont des fenêtres de rétention par défaut plus courtes.

Contrôle d'accès au besoin d'en connaître. Le RBAC applique quels analystes peuvent accéder à quels programmes de collecte, zones géographiques et types de signaux. Un modèle de permissions typique a trois axes : niveau d'habilitation (de NON CLASSIFIÉ à TS//SCI), compartiment de programme et rôle (analyste, gestionnaire de collecte, administrateur système).

Pistes d'audit. Chaque accès aux données, action analytique et modification de configuration est consigné dans un journal d'audit immuable. Les enregistrements d'audit comprennent : l'identité de l'acteur, le type d'action, l'identifiant de l'objet, l'étiquette de classification, l'horodatage et l'IP source. Les journaux d'audit sont écrits dans un magasin append-only séparé, protégé contre la modification même par les administrateurs système.

Considérations sur l'air gap. Les systèmes SIGINT stratégiques opérant aux niveaux de classification les plus élevés utilisent des segments réseau physiquement isolés. Le transfert de produits de renseignement désinfectés vers des consommateurs de classification inférieure nécessite une solution de domaine croisé (CDS) validée — des diodes de données unidirectionnelles imposées par matériel ou des appareils CDS bidirectionnels de fournisseurs approuvés (Forcepoint, Owl Cyber Defense, Everfox).