Edge-KI-Hardware-Auswahl in der Verteidigung ist ein verkleidetes Optimierungsproblem mit Nebenbedingungen, das wie eine Einkaufsliste aussieht. Das richtige Teil ist das, welches das Produktionsmodell schnell genug ausführt, innerhalb des Größen-, Gewichts-, Leistungs- und Kostenrahmens der Plattform, mit einer Lieferkette, die den Programmlebenszyklus überlebt, und einem Software-Stack, mit dem das Team tatsächlich liefern kann. Die meisten Programm-Teams entscheiden standardmäßig „Jetson AGX, wir kümmern uns später um das Budget" und entdecken nach sechs Monaten, dass der Nutzlastschacht keine 60 W Kühlung hat. Dieser Artikel durchläuft die Trade-offs über die Teile, die 2026 zählen.
1. Das Edge-KI-Auswahlproblem
Jede Edge-KI-Entscheidung beginnt mit drei orthogonalen Beschränkungen. SWaP-C — Größe, Gewicht, Leistung, Kühlung, Kosten — wird von der Host-Plattform gesetzt und ist selten verhandelbar. Ein Group-1-UAS gibt einem vielleicht 15 W und 100 g für den gesamten Compute-Stack. Ein fahrzeugmontiertes ISR-Gimbal gibt 50 W und Zwangsbelüftung. Ein gewehrmontiertes Visier gibt 5 W und passive Konduktion. Diese Zahlen torsperren alles andere.
Das Modell bestimmt den Boden. Ein YOLOv8-n-Objektdetektor bei 640×640 braucht ungefähr 8 GFLOPs pro Inferenz; bei 30 FPS sind das 240 GFLOPs/s — gut innerhalb eines Hailo-8 oder Jetson Orin Nano. Wechselt zu einem transformerbasierten Wahrnehmungsmodell mit multimodaler Fusion, und das Budget springt um eine Größenordnung. Modelloptimierung kann einen Faktor 2-4x zurückgewinnen, aber nicht 10x — wählt Hardware, die zum Modell passt, das ihr tatsächlich ausliefern wollt, nicht zum Modell, das ihr euch wünscht.
Die Lieferkette setzt die Decke. Verteidigungsprogramme laufen 5-10 Jahre. Kommerzielles Silizium dreht sich alle 18-24 Monate. Herkunftsland, ECCN-Klassifizierung und Second-Source-Verfügbarkeit sind keine Beschaffungspapierkram — sie sind Engineering-Eingaben, die formen, welche Teile überhaupt auf der BOM erlaubt sind.
2. NVIDIA-Jetson-Orin-Familie
Die Jetson-Orin-Familie ist aus gutem Grund die Standardantwort. Drei SKUs decken die meisten Verteidigungs-Edge-Rahmen ab. Orin Nano (20-40 TOPS INT8, 7-15 W konfigurierbar) trägt das Klein-UAS- und Handheld-Segment. Orin NX (70-100 TOPS, 10-25 W) sitzt im Sweetspot für taktische ISR-Payloads, Bodenfahrzeuge und unbemannte Überwasserfahrzeuge. Orin AGX (200-275 TOPS, 15-60 W) behandelt Multi-Stream-, multimodale Workloads — typische Use-Cases umfassen simultane EO/IR-Detektion plus Tracking plus On-Board-SLAM.
Das entscheidende Argument ist der Software-Stack. CUDA, cuDNN und TensorRT haben ein Jahrzehnt Modellabdeckung und Tooling-Reife, die kein Konkurrent erreicht. ONNX-zu-TensorRT-Konvertierung funktioniert bei fast allem; INT8-Kalibrierung ist gut verstanden; DeepStream behandelt die Video-Pipeline; ROS-2-Integration ist erstklassig. Für die meisten Teams sind die durch das Festhalten am NVIDIA-Stack gesparten Engineering-Stunden mehr wert als jedes TOPS/Watt-Defizit.
Die Nachteile sind real. Jetson Orin läuft heiß im Vergleich zu NPU-Alternativen — anhaltende 25 W auf Orin NX bedeuten echte Konduktionskühlung, kein Kühlkörper-und-Gebet-Gehäuse. Stückkosten sind 3-5x ein Hailo-Äquivalent. Und die Teile sind exportkontrolliert (ECCN 4A003), was Reibung für nicht-US-Programmpartner hinzufügt. NVIDIAs Defense-Channel-Lebenszyklus-Zusage ist solide, aber die Jetson-Roadmap ist immer noch an NVIDIAs kommerzielle Prioritäten gebunden, nicht an eure.
3. Hailo-8 und Hailo-15
Hailo ist der TOPS/Watt-Führer und das nicht knapp. Hailo-8 liefert 26 TOPS INT8 bei etwa 2,5 W typisch — um die 10 TOPS/W gegenüber Jetson Orin NX' 4-7 TOPS/W in der Praxis. Hailo-15, die SoC-Variante, integriert einen Quad-Core Arm Cortex-A53, eine ISP und 20 TOPS NPU in einem Sub-3-W-Rahmen — zweckgebaut für Smart-Kamera-Formfaktoren. Für eine kleine angebundene Drohne, ein körpergetragenes ISR-Rig oder einen helm-montierten Compute-Block ist die SWaP-Mathematik entscheidend.
Der Workflow ist, wo es härter wird. Der Hailo Dataflow Compiler nimmt ein ONNX- oder TFLite-Modell und emittiert ein Hailo Executable Format (HEF) Binary. Quantisierung auf INT8 ist obligatorisch — es gibt keinen FP16-Fallback. Der Model Zoo ist solide für Vision (YOLO-Familie, MobileNet, EfficientDet, Segmentation-Backbones) aber dünn für Transformer-Architekturen, Custom Ops und alles außerhalb der unterstützten Operator-Liste. Erwartet einen echten Portierungsaufwand für nicht-vanilla-Modelle; budgetiert zwei Wochen Engineering minimum für einen ersten Port, weniger für nachfolgende Varianten.
Herkunftsland ist Israel, generell akzeptabel für NATO-Programme, aber wert mit eurem Vertragsteam zu bestätigen. Hailos Defense-Traktion wächst — die Teile werden in Counter-UAS-Systemen, ISR-Drohnen und einer Handvoll NATO-naher Programme verschifft. Die Lebenszyklus-Zusage ist kürzer als NVIDIAs, aber bessernd.
4. Google Coral (Edge TPU)
Die Coral Edge TPU war der ursprüngliche Quantisierungs-First-Edge-Beschleuniger: 4 TOPS INT8 bei etwa 2 W, verfügbar in M.2, Mini PCIe, USB und Dev-Board-Formfaktoren. Für leichtgewichtige INT8-Vision (MobileNet-Klasse-Detektoren, kleine Klassifikatoren) auf einer leistungsbeschränkten Plattform liefert Coral immer noch. Das TFLite-Tooling ist reif, INT8-Kalibrierung ist gut dokumentiert und die Teile sind günstig.
Das Problem für die Verteidigung ist die Lieferketten-Frage. Coral-Teile sind EAR99 und US-Ursprung (TSMC-Fab), was auf dem Papier in Ordnung ist. Aber Google hat keine klare Nachfolger-Roadmap kommuniziert, der kommerzielle Kanal ist die einzige Quelle und die Defense-Programm-Lebenszyklus-Zusage ist effektiv abwesend. Coral ist akzeptabel für Prototypen, Trainings-Rigs und nicht-missionskritische Rollen, in denen ein Teile-Swap mitten im Programm tolerierbar ist. Für produktive Verteidigungsprogramme mit 5+ Jahre Sustainment ist die Planung einer Hailo- oder Jetson-Alternative der sicherere Anruf.
Die Modellabdeckung ist auch enger, als sie aussieht. Coral behandelt INT8-CNN-Architekturen aus einer kuratierten Liste gut; alles außerhalb dieser Liste — Transformer, Custom Ops, dynamische Shapes — erfordert signifikante Umstrukturierung oder kompiliert einfach nicht.
5. Qualcomm RB6 / Snapdragon Compute
Das Qualcomm-RB6-Dev-Kit (QRB5165 SoC plus 5G-Modem) und die breitere Snapdragon-Compute-Linie zielen auf ein anderes Problem: integrierte KI plus Mobilfunk-Konnektivität auf einem einzelnen SoC. Der QRB5165 liefert etwa 15 TOPS über CPU, GPU, DSP und Hexagon NPU bei ungefähr 5-7 W, plus ein integriertes X55-5G-Modem und den vollen Qualcomm-ISP-Stack.
Der Use-Case ist der Mobilfunk-Edge-Sensor: ein körpergetragener oder fahrzeugmontierter Knoten, der lokale KI-Inferenz ausführt und komprimierte Metadaten über 5G/LTE an einen Befehlsknoten streamt. Das integrierte Modem spart ein diskretes Mobilfunkmodul, eine PCB-Lage und 1-2 W Leistung — bedeutsam am Boden des SWaP-Rahmens.
Die Nachteile sind Software und Lizenzierung. Das Qualcomm AI Engine SDK (ehemals SNPE) ist weniger reif als TensorRT oder Hailos Toolchain, mit dünnerer ONNX-Abdeckung und steilerer Lernkurve. Die IP-Lizenzbedingungen rund um Qualcomm-Modems tragen Einschränkungen, die einige Verteidigungskunden unbequem finden. Und die Teile haben eine kommerzielle Lebenszyklus-Zusage, keine Defense-Grade. Für Programme, bei denen integrierter Mobilfunk der entscheidende Faktor ist, ist RB6 die richtige Antwort; für alles andere gewinnt Jetson oder Hailo allein durch Tooling.
6. FPGA-Alternativen
Für eine bestimmte Klasse von Verteidigungs-Workloads sind GPUs und NPUs vollständig die falsche Antwort. Xilinx Versal AI Edge (VE2302 bis VE2802) kombiniert harte AI Engines, programmierbare Logik und Arm-Kerne auf einem einzelnen Die — nutzbare KI-Durchsatzleistung im Bereich 50-200 TOPS plus enge Integration mit benutzerdefinierten DSP-Front-Ends. Intel Stratix 10 NX zielt auf das obere Ende mit in das FPGA-Fabric integrierten Tensor-Blöcken.
FPGAs gewinnen, wenn drei Dinge zutreffen: (1) die Workload erfordert deterministische Submillisekunden-Latenz, (2) benutzerdefinierte Pre-/Post-Processing — Radar-Signalkonditionierung, EW-Front-End, benutzerdefinierte Sensorfusion — muss auf demselben Die wie der KI-Block sitzen, und (3) der Programm-Lebenszyklus ist lang genug, um die Entwicklungskosten zu amortisieren. Typische Passungen sind Radar-Signalverarbeitung, Empfänger für elektronische Kampfführung, Raketensucher und jedes System, in dem die KI eine Stufe in einer engen DSP-Pipeline ist und nicht die ganze Show.
Die Kosten sind real. FPGA-Entwicklung ist 3-5x die Engineering-Stunden eines GPU-Äquivalents. Die Toolchain (Vitis AI, Quartus Prime) hat eine steile Kurve. Personal mit HLS-plus-KI-Erfahrung ist wirklich knapp. Für ein Programm, in dem der FPGA gerechtfertigt ist, sind diese Kosten über den Lebenszyklus erholbar; für ein Programm, das versehentlich in FPGA-Territorium driftete, ist es ein Budget-Killer.
7. Lieferkette und ITAR-Überlegungen
Herkunftsland ist der erste BOM-Filter. Jetson Orin und Coral sind US-Ursprung. Hailo ist israelisch. Qualcomm-SoCs sind US-designt, gemischt-Fab. Versal und Stratix sind US-Ursprung. Für ITAR-kontrollierte Plattformen ist die Rechnung klar — US- oder vertrauenswürdige Verbündetenteile bevorzugen und die Entscheidung dokumentieren. Für EAR-nur-Programme ist die Tür breiter, aber die Exportklassifizierung (EAR99 vs. CCL-Einträge wie 4A003 für Hochleistungs-Compute) treibt immer noch Lizenzierung und Endnutzungs-Beschränkungen.
Second-Source-Planung ist nicht verhandelbar. Die brutale kommerzielle Realität ist, dass jede einzelne Beschleuniger-Familie innerhalb des Programm-Lebenszyklus End-of-Life sein wird. Die Abmilderungen sind geschichtet: die Modell-Pipeline ONNX-first halten, sodass ein Port zu einem Nachfolger-Teil ein Runtime-Swap statt eine Neuschrift ist; herstellerspezifischen Code (TensorRT, Hailo Runtime, Qualcomm AI Engine) hinter einer dünnen Abstraktion isolieren; Last-Time-Buy-Reserven bei EOL-Benachrichtigung ausführen; und mindestens einen alternativen Beschleuniger parallel während der Entwicklung validieren. Programme, die diese Disziplin überspringen, bezahlen dafür im Jahr 4.
ITAR-freie Pipelines zählen für Exportverkäufe. Ein System, das vollständig aus EAR99-Teilen plus Open-Source-Modellen gebaut ist, kann unter weit leichteren Beschränkungen verkauft werden als eines, das CCL-Beschleuniger oder US-Ursprung-Verteidigungs-IP einbezieht. Für multinationale NATO-Programme und FMS-nahe Verkäufe öffnet eine ITAR-freie Konfiguration als Lieferantenvariante — nicht die einzige Variante, sondern eine davon — Märkte, die ein ITAR-gesperrter Stack schließt. Die Verteidigungs-KI-Landschaft belohnt architektonische Flexibilität hier.
8. Ruggedisierung und Lebenszyklus
Kommerzielle Developer-Kits sind keine einsatztaugliche Hardware. Das Jetson Orin Nano Dev Kit ist großartig für Prototyping; es stirbt beim ersten Mal, wenn ihr es in einem Fahrzeug verschifft. Produktive Ruggedisierung fügt eine Engineering-Schicht hinzu, die die meisten Teams unterschätzen.
Betriebstemperatur ist die Überschrift-Spec — militärischer Edge erfordert typischerweise -40 bis +71 °C Betrieb, konduktionsgekühlte Gehäuse und validierte anhaltende Leistung (nicht Peak) am oberen Ende. Der Jetson Orin NX hat dafür eine Industrial-Temp-Variante; der kommerzielle Coral nicht. Vibration und Schock folgen MIL-STD-810-Profilen — Stecker müssen verriegeln, Lötstellen dürfen nicht reißen und jeder rotierende Speicher ist raus (NVMe mit ordentlichem Underfill, keine SD-Karten). EMI/EMC-Zertifizierung (typischerweise MIL-STD-461) torsperrt Plattform-Integration; das Beschleuniger-Board, das Carrier-Board und das Gehäuse beteiligen sich alle.
Das konduktionsgekühlte Gehäuse ist, wo kommerzielle Teile auf die Realität der Verteidigung treffen. Ein Jetson Orin AGX bei 50 W braucht echte thermische Masse und einen echten Konduktionspfad zu einer Gehäuse-Bodenplatte. Ein Hailo-8 bei 2,5 W kann mit einem Wärmeleitpad zur Gehäusewand gekühlt werden. Die Beschleuniger-Wahl und das mechanische Design sind gekoppelt — wählt sie zusammen, nicht sequenziell.
Kernaussage: Der Lebenszyklus ist der stille Killer von Edge-KI-Verteidigungsprogrammen. Kommerzielle Beschleunigerfamilien drehen sich alle 18-24 Monate; Verteidigungsprogramme brauchen 5-7 Jahre nachhaltige Lieferung. Die Abmilderung ist nicht „mehr Inventar kaufen" — sie ist architektonisch: ONNX-first-Modell-Pipelines, herstellerabstrakte Runtime-Schichten und ein validierter Second-Source-Beschleuniger in Bereitschaft. Side-by-Side-Benchmarks sind nützliche Eingaben, aber der Lebenszyklus-Plan bestimmt, ob das Programm im Jahr 5 liefert.
Die Zusammenfassung ist unromantisch: Es gibt keine einzige richtige Antwort. Jetson Orin gewinnt bei Tooling und Breite; Hailo gewinnt bei TOPS/Watt und thermischem Spielraum; Coral füllt eine enge INT8-Nische; Qualcomm RB6 gewinnt, wenn Mobilfunk-Integration zählt; FPGAs gewinnen für deterministische, eng-gekoppelte Signalketten-Workloads. Der richtige Anruf ist der, der ein fünfjähriges Programm mit einem Modell überlebt, das ihr tatsächlich ausliefern könnt — und das Engineering-Team das Personal und die Werkzeuge hat, es zu unterstützen.