La sélection de matériel d'IA en périphérie dans la défense est un problème d'optimisation sous contraintes déguisé en liste de courses. La bonne pièce est celle qui exécute le modèle de production assez vite, dans l'enveloppe de taille, poids, puissance et coût de la plateforme, avec une chaîne d'approvisionnement qui survit au cycle de vie programme, et une pile logicielle que l'équipe peut réellement livrer. La plupart des équipes programme choisissent par défaut « Jetson AGX, on règlera le budget plus tard » et découvrent, six mois après, que la baie de charge utile ne dispose pas de 60 W de refroidissement. Cet article parcourt les compromis entre les pièces qui comptent en 2026.
1. Le problème de sélection IA en périphérie
Chaque décision d'IA en périphérie commence par trois contraintes orthogonales. SWaP-C — taille, poids, puissance, refroidissement, coût — est fixé par la plateforme hôte et est rarement négociable. Un UAS Groupe 1 vous donne peut-être 15 W et 100 g pour toute la pile de calcul. Un gimbal ISR monté véhicule vous donne 50 W et air forcé. Un viseur monté sur fusil vous donne 5 W et conduction passive. Ces chiffres conditionnent tout le reste.
Le modèle détermine le plancher. Un détecteur d'objets YOLOv8-n à 640×640 nécessite environ 8 GFLOPs par inférence ; à 30 FPS cela fait 240 GFLOPs/s — bien dans un Hailo-8 ou un Jetson Orin Nano. Passer à un modèle de perception transformer avec fusion multimodale et le budget bondit d'un ordre de grandeur. L'optimisation de modèle peut récupérer un facteur 2-4x, mais pas 10x — choisir du matériel qui correspond au modèle que vous comptez réellement livrer, pas au modèle souhaité.
La chaîne d'approvisionnement fixe le plafond. Les programmes défense durent 5-10 ans. Le silicium commercial tourne tous les 18-24 mois. Pays d'origine, classification ECCN et disponibilité seconde source ne sont pas de la paperasse — ce sont des entrées d'ingénierie qui façonnent quelles pièces sont même autorisées sur la BOM.
2. Famille NVIDIA Jetson Orin
La famille Jetson Orin est la réponse par défaut pour une raison. Trois SKU couvrent la plupart des enveloppes périphériques défense. Orin Nano (20-40 TOPS INT8, 7-15 W configurable) prend la tranche petits UAS et appareils portatifs. Orin NX (70-100 TOPS, 10-25 W) se positionne idéalement pour charges utiles ISR tactiques, véhicules terrestres et navires de surface sans pilote. Orin AGX (200-275 TOPS, 15-60 W) gère les charges multi-flux multimodales — cas d'usage typiques incluent détection EO/IR simultanée plus tracking plus SLAM embarqué.
L'argument décisif est la pile logicielle. CUDA, cuDNN et TensorRT ont une décennie de couverture modèle et de maturité d'outillage qu'aucun concurrent n'égale. La conversion ONNX-vers-TensorRT fonctionne sur presque tout ; la calibration INT8 est bien comprise ; DeepStream gère le pipeline vidéo ; l'intégration ROS 2 est de première classe. Pour la plupart des équipes, les heures d'ingénierie économisées en restant sur la pile NVIDIA valent plus que tout déficit TOPS/watt.
Les inconvénients sont réels. Jetson Orin chauffe par rapport aux alternatives NPU — 25 W soutenus sur Orin NX signifie un vrai refroidissement par conduction, pas une enceinte radiateur-et-prière. Le coût unitaire est 3-5x un équivalent Hailo. Et les pièces sont sous contrôle d'exportation (ECCN 4A003), ce qui ajoute de la friction pour les partenaires programme non-US. L'engagement de cycle de vie défense de NVIDIA est solide, mais la roadmap Jetson reste liée aux priorités commerciales de NVIDIA, pas aux vôtres.
3. Hailo-8 et Hailo-15
Hailo est le leader TOPS/watt et ce n'est pas serré. Hailo-8 livre 26 TOPS INT8 à environ 2,5 W typique — environ 10 TOPS/W contre 4-7 TOPS/W en pratique pour Jetson Orin NX. Hailo-15, la variante SoC, intègre un quad-core Arm Cortex-A53, un ISP et 20 TOPS de NPU dans une enveloppe sous 3 W — conçu pour les facteurs de forme caméra intelligente. Pour un petit drone filaire, un équipement ISR porté ou un calculateur monté casque, le calcul SWaP est décisif.
Le workflow est là où c'est plus dur. Le Hailo Dataflow Compiler prend un modèle ONNX ou TFLite et émet un binaire Hailo Executable Format (HEF). La quantification INT8 est obligatoire — il n'y a pas de fallback FP16. Le zoo modèles est solide pour la vision (famille YOLO, MobileNet, EfficientDet, backbones de segmentation) mais mince pour les architectures transformer, opérations personnalisées et tout ce qui sort de la liste d'opérateurs supportés. Attendez-vous à un vrai effort de portage pour modèles non standards ; budgétisez deux semaines d'ingénierie minimum pour un premier portage, moins pour variantes suivantes.
Pays d'origine : Israël, généralement acceptable pour programmes OTAN mais à confirmer avec votre équipe contrats. La traction défense de Hailo croît — les pièces équipent des systèmes anti-UAS, drones ISR et une poignée de programmes adjacents OTAN. L'engagement de cycle de vie est plus court que celui de NVIDIA mais s'améliore.
4. Google Coral (Edge TPU)
Le Coral Edge TPU était l'accélérateur périphérique quantification-first original : 4 TOPS INT8 à environ 2 W, disponible en facteurs M.2, Mini PCIe, USB et Dev Board. Pour la vision INT8 légère (détecteurs classe MobileNet, petits classifieurs) sur plateforme contrainte en puissance, Coral livre toujours. L'outillage TFLite est mature, la calibration INT8 est bien documentée et les pièces sont bon marché.
Le problème pour la défense est la question de la chaîne d'approvisionnement. Les pièces Coral sont EAR99 et d'origine US (fab TSMC), ce qui est correct sur le papier. Mais Google n'a communiqué aucune roadmap claire de successeur, le canal commercial est la seule source, et l'engagement de cycle de vie programme défense est effectivement absent. Coral est acceptable pour prototypes, plateformes d'entraînement et rôles non critiques où un échange de pièce en milieu de programme est tolérable. Pour les programmes défense de production avec maintenance de 5+ ans, planifier une alternative Hailo ou Jetson est le choix plus sûr.
La couverture modèle est aussi plus étroite qu'il n'y paraît. Coral gère bien les architectures CNN INT8 d'une liste curatée ; tout ce qui sort de cette liste — transformers, ops personnalisées, formes dynamiques — exige une restructuration significative ou ne compilera tout simplement pas.
5. Qualcomm RB6 / Snapdragon Compute
Le kit de développement Qualcomm RB6 (SoC QRB5165 plus modem 5G) et la ligne Snapdragon Compute plus large ciblent un problème différent : IA intégrée plus connectivité cellulaire sur un seul SoC. Le QRB5165 livre environ 15 TOPS à travers CPU, GPU, DSP et NPU Hexagon à environ 5-7 W, plus un modem X55 5G intégré et la pile ISP Qualcomm complète.
Le cas d'usage est le capteur cellulaire en périphérie : un nœud porté ou monté véhicule qui exécute l'inférence IA locale et streame des métadonnées compressées sur 5G/LTE vers un nœud de commandement. Le modem intégré économise un module cellulaire discret, une couche PCB et 1-2 W de puissance — significatif au bas de l'enveloppe SWaP.
Les inconvénients sont logiciels et licences. Le SDK Qualcomm AI Engine (anciennement SNPE) est moins mature que TensorRT ou la chaîne d'outils Hailo, avec une couverture ONNX plus mince et une courbe d'apprentissage plus raide. Les termes de licence IP autour des modems Qualcomm portent des restrictions que certains clients défense trouvent gênantes. Et les pièces ont un engagement de cycle de vie commercial, pas défense. Pour les programmes où le cellulaire intégré est le facteur décisif, RB6 est la bonne réponse ; pour tout le reste, Jetson ou Hailo gagne sur l'outillage seul.
6. Alternatives FPGA
Pour une classe spécifique de charges défense, GPU et NPU sont la mauvaise réponse entièrement. Xilinx Versal AI Edge (VE2302 à VE2802) combine AI Engines durs, logique programmable et cœurs Arm sur une seule puce — débit IA utilisable dans la plage 50-200 TOPS plus intégration étroite avec front-ends DSP personnalisés. Intel Stratix 10 NX cible le haut de gamme avec blocs tensor intégrés au tissu FPGA.
Les FPGAs gagnent quand trois conditions sont vraies : (1) la charge exige une latence déterministe sous-milliseconde, (2) un pré/post-traitement personnalisé — conditionnement de signal radar, front-end EW, fusion de capteurs personnalisée — doit être sur la même puce que le bloc IA, et (3) le cycle de vie programme est assez long pour amortir le coût de développement. Adéquations typiques : traitement de signal radar, récepteurs de guerre électronique, autodirecteurs de missile et tout système où l'IA est une étape dans un pipeline DSP étroit plutôt que tout le spectacle.
Le coût est réel. Le développement FPGA est 3-5x les heures d'ingénierie d'un GPU équivalent. La chaîne d'outils (Vitis AI, Quartus Prime) a une courbe raide. Les effectifs avec expérience HLS plus IA sont véritablement rares. Pour un programme où le FPGA est justifié, ce coût est récupérable sur le cycle de vie ; pour un programme qui a dérivé en territoire FPGA par accident, c'est un tueur de budget.
7. Chaîne d'approvisionnement et considérations ITAR
Le pays d'origine est le premier filtre BOM. Jetson Orin et Coral sont d'origine US. Hailo est israélien. Les SoCs Qualcomm sont conçus US, fabs mixtes. Versal et Stratix sont d'origine US. Pour les plateformes sous contrôle ITAR le calcul est direct — favoriser pièces US ou alliés de confiance et documenter la détermination. Pour les programmes EAR seulement la porte est plus large, mais la classification d'exportation (EAR99 vs entrées CCL comme 4A003 pour calcul haute performance) dicte toujours licences et restrictions d'usage final.
La planification seconde source est non négociable. La réalité commerciale brutale est que toute famille d'accélérateur unique sera en fin de vie dans le cycle de vie programme. Les atténuations sont en couches : garder le pipeline modèle ONNX-first afin qu'un portage vers une pièce successeur soit un échange runtime plutôt qu'une réécriture ; isoler le code spécifique fournisseur (TensorRT, Hailo Runtime, Qualcomm AI Engine) derrière une fine abstraction ; exécuter des réserves last-time-buy à la notification de fin de vie ; et valider au moins un accélérateur alternatif en parallèle pendant le développement. Les programmes qui sautent cette discipline le paient en année 4.
Les pipelines sans ITAR comptent pour les ventes à l'export. Un système construit entièrement de pièces EAR99 plus modèles open-source peut être vendu sous restrictions bien plus légères qu'un qui tire des accélérateurs CCL ou de l'IP défense d'origine US. Pour les programmes OTAN multinationaux et ventes adjacentes FMS, une configuration sans ITAR comme variante de livrable — pas la seule, mais l'une d'elles — ouvre des marchés qu'une pile verrouillée ITAR ferme. Le paysage de l'IA défense récompense la flexibilité architecturale ici.
8. Durcissement et cycle de vie
Les kits de développement commerciaux ne sont pas du matériel déployable. Le Jetson Orin Nano Dev Kit est super pour le prototypage ; il meurt la première fois que vous le mettez dans un véhicule. Le durcissement de production ajoute une couche d'ingénierie que la plupart des équipes sous-estiment.
La température de fonctionnement est la spec phare — la périphérie militaire exige typiquement -40 à +71 °C en fonctionnement, enceintes refroidies par conduction et performance soutenue validée (pas crête) au haut de la plage. Le Jetson Orin NX a une variante temp industrielle pour cette raison ; le Coral commercial non. Vibration et choc suivent les profils MIL-STD-810 — les connecteurs doivent verrouiller, les joints de soudure ne doivent pas craquer, et tout stockage rotatif est exclu (NVMe avec underfill approprié, pas cartes SD). La certification EMI/EMC (typiquement MIL-STD-461) conditionne l'intégration plateforme.
L'enceinte refroidie par conduction est là où les pièces commerciales rencontrent la réalité défense. Un Jetson Orin AGX à 50 W a besoin d'une vraie masse thermique et d'un vrai chemin de conduction vers une plaque de châssis. Un Hailo-8 à 2,5 W peut être refroidi par un pad thermique vers la paroi de l'enceinte. Le choix d'accélérateur et la conception mécanique sont couplés — les choisir ensemble, pas séquentiellement.
Idée clé : Le cycle de vie est le tueur silencieux des programmes d'IA en périphérie défense. Les familles d'accélérateurs commerciales tournent tous les 18-24 mois ; les programmes défense ont besoin de 5-7 ans d'approvisionnement soutenu. L'atténuation n'est pas « acheter plus de stock » — elle est architecturale : pipelines modèle ONNX-first, couches runtime abstraites du fournisseur, et un accélérateur seconde source validé en réserve. Les benchmarks côte à côte sont des entrées utiles, mais le plan de cycle de vie est ce qui détermine si le programme livre en année 5.
Le résumé est sans romance : il n'y a pas de réponse unique. Jetson Orin gagne sur outillage et largeur ; Hailo gagne sur TOPS/watt et marge thermique ; Coral remplit une niche INT8 étroite ; Qualcomm RB6 gagne quand l'intégration cellulaire compte ; les FPGAs gagnent pour les charges de pipeline signal étroitement couplées et déterministes. Le bon choix est celui qui survit à un programme de cinq ans avec un modèle que vous pouvez réellement livrer — et que l'équipe d'ingénierie a les effectifs et outils pour soutenir.