Edge-AI-hardwareselectie in de defensie is een geconstraineerd optimalisatieprobleem vermomd als een boodschappenlijstje. Het juiste onderdeel is datgene dat het productiemodel snel genoeg uitvoert, binnen de omvang-, gewichts-, vermogens- en kostenenveloppe van het platform, met een bevoorradingsketen die de programmalevencyclus overleeft, en een softwarestack die het team daadwerkelijk kan leveren. De meeste programma-teams kiezen standaard voor "Jetson AGX, we regelen het budget later" en ontdekken zes maanden later dat de payloadruimte geen 60 W koeling biedt. Dit artikel behandelt de afwegingen voor de onderdelen die er in 2026 toe doen.
1. Het edge-AI-selectieprobleem
Elke edge-AI-beslissing begint met drie orthogonale beperkingen. SWaP-C — omvang, gewicht, vermogen, koeling, kosten — wordt bepaald door het hostplatform en is zelden onderhandelbaar. Een Group 1 UAS geeft u misschien 15 W en 100 g voor de volledige compute-stack. Een voertuiggemonteerde ISR-gimbal geeft u 50 W en geforceerde lucht. Een op het geweer gemonteerd vizier geeft u 5 W en passieve geleiding. Deze getallen bepalen al het andere.
Het model bepaalt de ondergrens. Een YOLOv8-n objectdetector op 640×640 heeft ongeveer 8 GFLOPs per inferentie nodig; bij 30 FPS is dat 240 GFLOPs/s — ruim binnen het bereik van een Hailo-8 of een Jetson Orin Nano. Wissel naar een transformergebaseerd perceptiemodel met multi-modale fusie en het budget springt een orde van grootte. Modeloptimalisatie kan een factor 2-4x terugwinnen, maar geen 10x — kies hardware die past bij het model dat u daadwerkelijk wilt leveren, niet het model dat u wenst te hebben.
De bevoorradingsketen stelt het plafond. Defensieprogramma's lopen 5-10 jaar. Commercieel silicium wisselt elke 18-24 maanden. Land van oorsprong, ECCN-classificatie en beschikbaarheid van tweede bronnen zijn geen inkoopformulieren — het zijn technische invoergegevens die bepalen welke onderdelen überhaupt op de stuklijst mogen staan.
2. NVIDIA Jetson Orin-familie
De Jetson Orin-familie is om een goede reden het standaardantwoord. Drie SKU's dekken de meeste defensie-edge-enveloppen. Orin Nano (20-40 TOPS INT8, 7-15 W configureerbaar) bedient het segment voor kleine UAS en draagbare apparaten. Orin NX (70-100 TOPS, 10-25 W) zit in het ideale segment voor tactische ISR-payloads, grondvoertuigen en onbemande oppervlaktevaartuigen. Orin AGX (200-275 TOPS, 15-60 W) verwerkt multi-stream, multi-modale werklasten — typische gebruikssituaties omvatten gelijktijdige EO/IR-detectie plus tracking plus on-board SLAM.
Het beslissende argument is de softwarestack. CUDA, cuDNN en TensorRT hebben een decennium van modelondersteuning en gereedschapsvolwassenheid die geen concurrent evennaart. ONNX-naar-TensorRT-conversie werkt op bijna alles; INT8-kalibratie is goed begrepen; DeepStream verwerkt de videopijplijn; ROS 2-integratie is eersteklas. Voor de meeste teams zijn de bespaarde engineeringuren door bij de NVIDIA-stack te blijven meer waard dan enig TOPS/watt-tekort.
De nadelen zijn reëel. Jetson Orin wordt warm ten opzichte van NPU-alternatieven — aanhoudend 25 W op Orin NX betekent echte geleidingskoeling, geen behuizing met een koellichaam-en-hoop-maar-het-goed-gaat. Kosten per eenheid zijn 3-5x die van een Hailo-equivalent. En de onderdelen zijn exportgecontroleerd (ECCN 4A003), wat wrijving oplevert voor niet-Amerikaanse programmpartners. NVIDIA's defensiekanaal-levenscyclusverbintenis is solide, maar de Jetson-roadmap is nog steeds gekoppeld aan NVIDIA's commerciële prioriteiten, niet aan die van u.
3. Hailo-8 en Hailo-15
Hailo is de TOPS/watt-leider en het is niet eens dicht bij elkaar. Hailo-8 levert 26 TOPS INT8 bij ongeveer 2,5 W typisch — circa 10 TOPS/W tegen Jetson Orin NX's 4-7 TOPS/W in de praktijk. Hailo-15, de SoC-variant, integreert een quad-core Arm Cortex-A53, een ISP en 20 TOPS aan NPU in een sub-3 W-enveloppe — speciaal ontworpen voor smart-camera-formfactoren. Voor een kleine verbonden drone, een op het lichaam gedragen ISR-rig of een op de helm gemonteerde computerbaksteen is de SWaP-berekening beslissend.
De workflow is waar het lastiger wordt. De Hailo Dataflow Compiler neemt een ONNX- of TFLite-model en genereert een Hailo Executable Format (HEF)-binair bestand. Kwantisering naar INT8 is verplicht — er is geen FP16-terugval. De modelzoo is solide voor visie (YOLO-familie, MobileNet, EfficientDet, segmentatie-backbones) maar dun voor transformerarchitecturen, aangepaste operatoren en alles buiten de ondersteunde operatorlijst. Verwacht een echte porteerinspanning voor niet-standaard modellen; budget minimaal twee weken engineeringtijd voor een eerste port, minder voor latere varianten.
Het land van oorsprong is Israël, over het algemeen aanvaardbaar voor NAVO-programma's maar bevestiging bij uw contractenteam is aan te raden. Hailo's defensietractie groeit — de onderdelen worden geleverd in teller-UAS-systemen, ISR-drones en een handvol NAVO-gelieerde programma's. De levenscyclusverbintenis is korter dan die van NVIDIA maar verbetert.
4. Google Coral (Edge TPU)
De Coral Edge TPU was de originele kwantisering-eerst rand-accelerator: 4 TOPS INT8 bij ongeveer 2 W, beschikbaar in M.2-, Mini-PCIe-, USB- en Dev Board-formfactoren. Voor lichte INT8-visie (MobileNet-klasse detectors, kleine classifiers) op een vermogensbeperkend platform levert Coral nog steeds resultaten. De TFLite-tooling is volwassen, INT8-kalibratie is goed gedocumenteerd en de onderdelen zijn goedkoop.
Het probleem voor defensie is de bevoorradingsketenvraag. Coral-onderdelen zijn EAR99 en US-origin (TSMC-fabricage), wat op papier in orde is. Maar Google heeft geen duidelijke opvolgersroadmap gecommuniceerd, het commerciële kanaal is de enige bron en de defensieprogramma-levenscyclusverbintenis is feitelijk afwezig. Coral is aanvaardbaar voor prototypes, trainingsopstellingen en niet-missiekritische rollen waarbij een onderdelenwissel halverwege het programma acceptabel is. Voor productie-defensieprogramma's met 5+ jaar duurzaamheid is het plannen van een Hailo- of Jetson-alternatief de verstandigere keuze.
De modelondersteuning is ook smaller dan het eruitziet. Coral verwerkt INT8-CNN-architecturen uit een samengestelde lijst goed; alles buiten die lijst — transformers, aangepaste operatoren, dynamische vormen — vereist aanzienlijke herstructurering of compileert gewoonweg niet.
5. Qualcomm RB6 / Snapdragon Compute
Het Qualcomm RB6-ontwikkelaarskit (QRB5165-SoC plus 5G-modem) en de bredere Snapdragon Compute-lijn richten zich op een ander probleem: geïntegreerde AI plus cellulaire connectiviteit op een enkel SoC. De QRB5165 levert ongeveer 15 TOPS over CPU, GPU, DSP en Hexagon NPU bij ruwweg 5-7 W, plus een geïntegreerde X55 5G-modem en de volledige Qualcomm ISP-stack.
De gebruikssituatie is de cellulaire-rand-sensor: een op het lichaam gedragen of voertuiggemonteerde node die lokale AI-inferentie uitvoert en gecomprimeerde metadata via 5G/LTE terugstuurt naar een commandonode. De geïntegreerde modem bespaart een afzonderlijke cellulaire module, een PCB-laag en 1-2 W vermogen — betekenisvol aan het ondereinde van de SWaP-enveloppe.
De nadelen zijn software en licenties. De Qualcomm AI Engine SDK (voorheen SNPE) is minder volwassen dan TensorRT of Hailo's toolchain, met dunnere ONNX-ondersteuning en een steilere leercurve. De IP-licentievoorwaarden rond Qualcomm-modems bevatten beperkingen die sommige defensieklanten ongemakkelijk vinden. En de onderdelen hebben een commercieel-grade levenscyclusverbintenis, niet een defensie-grade. Voor programma's waarbij geïntegreerde cellulaire connectiviteit de beslissende factor is, is RB6 het juiste antwoord; voor al het andere wint Jetson of Hailo op tooling alleen.
6. FPGA-alternatieven
Voor een specifieke klasse van defensiewerklasten zijn GPU's en NPU's geheel het verkeerde antwoord. Xilinx Versal AI Edge (VE2302 tot VE2802) combineert harde AI Engines, programmeerbare logica en Arm-cores op een enkele die — bruikbare AI-doorvoer in het bereik van 50-200 TOPS plus nauwe integratie met aangepaste DSP-frontends. Intel Stratix 10 NX richt zich op het hoge segment met tensorblokken geïntegreerd in de FPGA-fabric.
FPGA's winnen wanneer drie dingen waar zijn: (1) de werklast vereist deterministische sub-milliseconde latentie, (2) aangepaste voor-/naverwerking — radarsignaalconditioning, EW-frontend, aangepaste sensorfusie — moet op dezelfde die zitten als het AI-blok, en (3) de programmalevencyclus is lang genoeg om de ontwikkelkosten te amortiseren. Typische toepassingen zijn radarsignaalverwerking, elektronische oorlogsvoering-ontvangers, raketontvangstkoppen en elk systeem waarbij de AI een fase in een strakke DSP-pijplijn is in plaats van het hele verhaal.
De kosten zijn reëel. FPGA-ontwikkeling kost 3-5x de engineeringuren van een GPU-equivalent. De toolchain (Vitis AI, Quartus Prime) heeft een steile curve. Personeel met HLS plus AI-ervaring is schaars. Voor een programma waarbij de FPGA gerechtvaardigd is, zijn deze kosten terug te verdienen over de levenscyclus; voor een programma dat per ongeluk in FPGA-territorium belandde, is het een budgetmoordernaar.
7. Bevoorradingsketen en ITAR-overwegingen
Land van oorsprong is het eerste stuklijstfilter. Jetson Orin en Coral zijn US-origin. Hailo is Israëlisch. Qualcomm-SoC's zijn US-ontworpen, gemengde fabricage. Versal en Stratix zijn US-origin. Voor ITAR-gecontroleerde platforms is de berekening eenvoudig — geef de voorkeur aan Amerikaanse of vertrouwde bondgenootonderdelen en documenteer de bepaling. Voor EAR-only-programma's is de deur breder, maar de exportclassificatie (EAR99 versus CCL-vermeldingen zoals 4A003 voor hoogwaardige compute) bepaalt nog steeds licenties en eindgebruiksbeperkingen.
Tweede-bronplanning is niet onderhandelbaar. De harde commerciële realiteit is dat elke afzonderlijke acceleratorfamilie voor het einde van de programmalevencyclus zijn levensduur heeft bereikt. De beperkingen zijn gelaagd: houd de modelpijplijn ONNX-first zodat een port naar een opvolgend onderdeel een runtime-wissel is in plaats van een herschrijving; isoleer leveranciersspecifieke code (TensorRT, Hailo Runtime, Qualcomm AI Engine) achter een dunne abstractie; voer last-time-buy-reserves uit bij end-of-life-melding; en valideer in parallel tijdens de ontwikkeling ten minste één alternatieve accelerator. Programma's die deze discipline overslaan, betalen daarvoor in jaar 4.
ITAR-vrije pijplijnen zijn van belang voor exportverkoop. Een systeem dat volledig is opgebouwd uit EAR99-onderdelen plus open-source modellen kan worden verkocht onder aanzienlijk lichtere beperkingen dan een systeem dat CCL-acceleratoren of US-origin defensie-IP omvat. Voor multinationale NAVO-programma's en FMS-gelieerde verkopen opent een ITAR-vrije configuratie als te leveren variant — niet de enige variant, maar een ervan — markten die een ITAR-vergrendelde stack sluit. Het defensie-AI-landschap beloont architecturale flexibiliteit hier.
8. Robuustheid en levenscyclus
Commerciële ontwikkelaarssets zijn geen inzetbare hardware. De Jetson Orin Nano Dev Kit is geweldig voor prototyping; hij gaat kapot de eerste keer dat u hem in een voertuig vervoert. Productie-robuustheid voegt een laag engineering toe die de meeste teams onderschatten.
Bedrijfstemperatuur is de kopspec — militaire rand vereist doorgaans -40 tot +71 °C bedrijf, geleidingsgekoelde behuizingen en gevalideerde aanhoudende prestaties (niet piek) aan het hoge uiteinde. De Jetson Orin NX heeft een industriële-temperatuurvariant om deze reden; de commerciële Coral niet. Trillingen en schokken volgen MIL-STD-810-profielen — connectoren moeten vergrendelen, soldeerverbindingen mogen niet scheuren en opslageenheden met bewegende delen zijn uit den boze (NVMe met correcte ondervulling, geen SD-kaarten). EMI/EMC-certificering (doorgaans MIL-STD-461) bepaalt platformintegratie; de acceleratorplaat, de dragerplaat en de behuizing dragen allen bij.
De geleidingsgekoelde behuizing is waar commerciële onderdelen de defensierealiteit ontmoeten. Een Jetson Orin AGX bij 50 W heeft echte thermische massa en een echte geleidingsweg naar een chassisbasisplaat nodig. Een Hailo-8 bij 2,5 W kan worden gekoeld met een thermisch kussentje naar de behuizingswand. De acceleratorkeuze en het mechanisch ontwerp zijn gekoppeld — kies ze samen, niet opeenvolgend.
Belangrijk inzicht: Levenscyclus is de stille moordenaar van edge-AI-defensieprogramma's. Commerciële acceleratorfamilies wisselen elke 18-24 maanden; defensieprogramma's hebben 5-7 jaar aanhoudende levering nodig. De beperking is niet "koop meer voorraad" — het is architecturaal: ONNX-first modelpijplijnen, leveranciersgeabstraheerde runtimelagen en een gevalideerde tweede-bron-accelerator in stand-by. Naast-elkaar-benchmarks zijn nuttige invoergegevens, maar het levenscyclusplan bepaalt of het programma in jaar 5 wordt geleverd.
De samenvatting is nuchter: er is geen enkel goed antwoord. Jetson Orin wint op tooling en breedte; Hailo wint op TOPS/watt en thermische marge; Coral vult een smalle INT8-niche; Qualcomm RB6 wint wanneer cellulaire integratie van belang is; FPGA's winnen voor deterministische, nauw gekoppelde signaalketen-werklasten. De juiste keuze is die welke een vijfjarenprogramma overleeft met een model dat u daadwerkelijk kunt leveren — en het engineeringteam beschikt over het personeel en de tools om te ondersteunen.