Wybór sprzętu Edge AI w obronności to problem optymalizacji z ograniczeniami przebrany za listę zakupów. Właściwa część to ta, która uruchamia model produkcyjny wystarczająco szybko, w kopercie rozmiaru, wagi, mocy i kosztu platformy, z łańcuchem dostaw przeżywającym cykl życia programu, i stosem oprogramowania, który zespół faktycznie potrafi wdrożyć. Większość zespołów programowych domyślnie wybiera "Jetson AGX, budżet ogarniemy później" i odkrywa po sześciu miesiącach, że ładownia nie ma 60 W chłodzenia. Artykuł omawia kompromisy między częściami, które mają znaczenie w 2026.

1. Problem wyboru Edge AI

Każda decyzja Edge AI zaczyna się od trzech ortogonalnych ograniczeń. SWaP-C — rozmiar, waga, moc, chłodzenie, koszt — jest ustawiony przez platformę-host i rzadko podlega negocjacji. UAS Grupy 1 daje może 15 W i 100 g na cały stos obliczeniowy. Pojazdowa gimbala ISR daje 50 W i wymuszone powietrze. Celownik karabinowy daje 5 W i pasywną konwekcję. Te liczby gardłują wszystko inne.

Model wyznacza podłogę. Detektor obiektów YOLOv8-n przy 640×640 potrzebuje około 8 GFLOPs na inferencję; przy 30 FPS to 240 GFLOPs/s — w pełni w zakresie Hailo-8 lub Jetsona Orin Nano. Przesiądź się na model percepcji oparty na transformerze z fuzją multimodalną i budżet skacze o rząd wielkości. Optymalizacja modelu potrafi odzyskać czynnik 2-4x, ale nie 10x — wybierz sprzęt pasujący do modelu, który faktycznie zamierzasz wdrożyć, nie modelu, który chciałbyś mieć.

Łańcuch dostaw ustawia sufit. Programy obronne trwają 5-10 lat. Komercyjny krzem rotuje co 18-24 miesiące. Kraj pochodzenia, klasyfikacja ECCN i dostępność second-source nie są papierologią zakupową — to wejścia inżynierskie, które kształtują, jakie części w ogóle wolno włączyć w BOM.

2. Rodzina NVIDIA Jetson Orin

Rodzina Jetson Orin to domyślna odpowiedź z powodu. Trzy SKU pokrywają większość obronnych kopert krawędziowych. Orin Nano (20-40 TOPS INT8, 7-15 W konfigurowalne) obsługuje przedział małych UAS i urządzeń ręcznych. Orin NX (70-100 TOPS, 10-25 W) siedzi w słodkim miejscu dla taktycznych payloadów ISR, pojazdów lądowych i bezzałogowych pojazdów nawodnych. Orin AGX (200-275 TOPS, 15-60 W) obsługuje obciążenia wielostrumieniowe, multimodalne — typowe zastosowania obejmują jednoczesną detekcję EO/IR plus tracking plus SLAM pokładowy.

Decydującym argumentem jest stos oprogramowania. CUDA, cuDNN i TensorRT mają dekadę pokrycia modeli i dojrzałości narzędziowej, której żaden konkurent nie dorównuje. Konwersja ONNX-do-TensorRT działa na prawie wszystkim; kalibracja INT8 jest dobrze poznana; DeepStream obsługuje potok wideo; integracja ROS 2 jest pierwszej klasy. Dla większości zespołów godziny inżynierskie oszczędzone trzymaniem się stosu NVIDIA są warte więcej niż jakikolwiek deficyt TOPS/wat.

Wady są realne. Jetson Orin pracuje ciepło wobec alternatyw NPU — trwałe 25 W na Orin NX oznacza realne chłodzenie kondukcyjne, nie obudowę z radiatorem i modlitwą. Koszt jednostkowy to 3-5x odpowiednika Hailo. A części są kontrolowane eksportowo (ECCN 4A003), co dodaje tarcia dla nieamerykańskich partnerów programu. Zobowiązanie cyklu życia NVIDIA przez kanał obronny jest solidne, ale roadmapa Jetsona wciąż jest powiązana z komercyjnymi priorytetami NVIDIA, nie twoimi.

3. Hailo-8 i Hailo-15

Hailo jest liderem TOPS/wat i to nie blisko. Hailo-8 dostarcza 26 TOPS INT8 przy około 2,5 W typowo — około 10 TOPS/W wobec praktycznych 4-7 TOPS/W Jetsona Orin NX. Hailo-15, wariant SoC, integruje czterordzeniowy Arm Cortex-A53, ISP i 20 TOPS NPU w kopercie poniżej 3 W — celowo zbudowany pod formaty smart-camera. Dla małego drona uwięziowego, noszonego rigu ISR czy klocka obliczeniowego na hełmie matematyka SWaP jest decydująca.

Workflow jest trudniejszy. Hailo Dataflow Compiler bierze model ONNX lub TFLite i emituje binarny Hailo Executable Format (HEF). Kwantyzacja do INT8 jest obowiązkowa — nie ma fallbacku FP16. Model zoo jest solidny dla wizji (rodzina YOLO, MobileNet, EfficientDet, backbony segmentacji), ale rzadki dla architektur transformerowych, własnych operatorów i wszystkiego poza wspieraną listą operatorów. Spodziewaj się realnego wysiłku portowania dla modeli innych niż waniliowe; zabudżetuj minimum dwa tygodnie inżynierki na pierwszy port, mniej na kolejne warianty.

Kraj pochodzenia to Izrael, generalnie akceptowalny dla programów NATO, ale wart potwierdzenia z twoim zespołem kontraktowym. Trakcja obronna Hailo rośnie — części wchodzą w systemy counter-UAS, drony ISR i kilka programów sąsiadujących z NATO. Zobowiązanie cyklu życia jest krótsze niż NVIDIA, ale się poprawia.

4. Google Coral (Edge TPU)

Coral Edge TPU był pierwszym akceleratorem krawędziowym typu quantization-first: 4 TOPS INT8 przy około 2 W, dostępny w formatach M.2, Mini PCIe, USB i Dev Board. Dla lekkiej wizji INT8 (detektory klasy MobileNet, małe klasyfikatory) na platformie ograniczonej mocowo Coral wciąż dostarcza. Narzędzia TFLite są dojrzałe, kalibracja INT8 dobrze udokumentowana, a części są tanie.

Problemem dla obronności jest kwestia łańcucha dostaw. Części Coral są EAR99 i pochodzenia USA (fab TSMC), co na papierze jest fine. Ale Google nie zakomunikowało jasnej roadmapy następcy, kanał komercyjny jest jedynym źródłem, a zobowiązanie cyklu życia programu obronnego jest faktycznie nieobecne. Coral jest akceptowalny dla prototypów, rigów treningowych i ról niekrytycznych dla misji, gdzie wymiana części w połowie programu jest tolerowalna. Dla produkcyjnych programów obronnych z 5+ letnim utrzymaniem planowanie alternatywy Hailo lub Jetson to bezpieczniejszy wybór.

Pokrycie modeli jest też węższe, niż wygląda. Coral dobrze obsługuje architektury CNN INT8 z wyselekcjonowanej listy; wszystko poza tą listą — transformery, własne operatory, dynamiczne kształty — wymaga znacznej restrukturyzacji albo po prostu nie skompiluje się.

5. Qualcomm RB6 / Snapdragon Compute

Zestaw deweloperski Qualcomm RB6 (SoC QRB5165 plus modem 5G) i szersza linia Snapdragon Compute celują w inny problem: zintegrowana AI plus łączność komórkowa na pojedynczym SoC. QRB5165 dostarcza około 15 TOPS przez CPU, GPU, DSP i Hexagon NPU przy około 5-7 W, plus zintegrowany modem X55 5G i pełny stos ISP Qualcomm.

Zastosowanie to czujnik krawędzi komórkowej: węzeł noszony lub pojazdowy, który prowadzi lokalną inferencję AI i streamuje skompresowane metadane przez 5G/LTE z powrotem do węzła dowodzenia. Zintegrowany modem oszczędza dyskretny moduł komórkowy, warstwę PCB i 1-2 W mocy — znaczące na dolnym końcu koperty SWaP.

Wady to oprogramowanie i licencjonowanie. Qualcomm AI Engine SDK (dawniej SNPE) jest mniej dojrzały niż TensorRT czy toolchain Hailo, z cieńszym pokryciem ONNX i bardziej stromą krzywą uczenia się. Warunki licencyjne IP wokół modemów Qualcomm niosą restrykcje, które niektórzy klienci obronni uważają za niezręczne. A części mają zobowiązanie cyklu życia klasy komercyjnej, nie obronnej. Dla programów, gdzie zintegrowana komórkówka jest decydująca, RB6 jest właściwą odpowiedzią; dla wszystkiego innego Jetson lub Hailo wygrywa samym tooling.

6. Alternatywy FPGA

Dla konkretnej klasy obciążeń obronnych GPU i NPU są całkowicie złą odpowiedzią. Xilinx Versal AI Edge (VE2302 do VE2802) łączy twarde AI Engines, programowalną logikę i rdzenie Arm na pojedynczej kości — użyteczna przepustowość AI w przedziale 50-200 TOPS plus ścisła integracja z własnymi front-endami DSP. Intel Stratix 10 NX celuje w wyższy koniec z blokami tensorowymi zintegrowanymi w tkance FPGA.

FPGA wygrywają, gdy trzy rzeczy są prawdziwe: (1) obciążenie wymaga deterministycznego opóźnienia poniżej milisekundy, (2) własny pre/post-processing — kondycjonowanie sygnału radarowego, front-end EW, własna fuzja czujników — musi siedzieć na tej samej kości co blok AI, (3) cykl życia programu jest na tyle długi, by zamortyzować koszt rozwoju. Typowe dopasowania to przetwarzanie sygnału radarowego, odbiorniki walki elektronicznej, głowice rakietowe i każdy system, gdzie AI jest etapem w ciasnym potoku DSP, a nie całym przedstawieniem.

Koszt jest realny. Rozwój FPGA to 3-5x godzin inżynierskich odpowiednika GPU. Toolchain (Vitis AI, Quartus Prime) ma stromą krzywą. Kadry z doświadczeniem HLS plus AI są naprawdę rzadkie. Dla programu, gdzie FPGA jest uzasadnione, koszt jest odzyskiwalny w cyklu życia; dla programu, który wpadł na terytorium FPGA przypadkowo, to zabójca budżetu.

7. Łańcuch dostaw i kwestie ITAR

Kraj pochodzenia to pierwszy filtr BOM. Jetson Orin i Coral mają pochodzenie USA. Hailo jest izraelski. SoC Qualcomm są projektowane w USA, fab mieszany. Versal i Stratix mają pochodzenie USA. Dla platform kontrolowanych ITAR kalkulacja jest prosta — preferuj części USA lub zaufanych sojuszników i udokumentuj decyzję. Dla programów tylko EAR drzwi są szersze, ale klasyfikacja eksportowa (EAR99 vs wpisy CCL jak 4A003 dla wysokowydajnych obliczeń) wciąż steruje licencjonowaniem i restrykcjami końcowego użycia.

Planowanie second-source nie podlega negocjacji. Brutalna realność komercyjna jest taka, że każda pojedyncza rodzina akceleratorów osiągnie EOL wewnątrz cyklu życia programu. Mitygacje są warstwowe: trzymaj potok modelu ONNX-first, by port do następcy był wymianą runtime, a nie przepisywaniem; izoluj kod specyficzny dla producenta (TensorRT, Hailo Runtime, Qualcomm AI Engine) za cienką abstrakcją; wykonaj rezerwy last-time-buy przy powiadomieniu EOL; i waliduj co najmniej jeden alternatywny akcelerator równolegle podczas rozwoju. Programy pomijające tę dyscyplinę płacą za to w roku 4.

Potoki wolne od ITAR mają znaczenie dla sprzedaży eksportowej. System zbudowany całkowicie z części EAR99 plus modeli open-source można sprzedawać pod znacznie lżejszymi restrykcjami niż taki, który wciąga akceleratory CCL lub obronne IP pochodzenia USA. Dla wielonarodowych programów NATO i sprzedaży sąsiadującej z FMS konfiguracja wolna od ITAR jako wariant dostarczany — nie jedyny wariant, ale jeden z nich — otwiera rynki, które stos zablokowany ITAR zamyka. Krajobraz obronnej AI nagradza tu elastyczność architektoniczną.

8. Utwardzanie i cykl życia

Komercyjne zestawy deweloperskie nie są wdrażalnym sprzętem. Jetson Orin Nano Dev Kit jest świetny do prototypowania; umiera przy pierwszej wysyłce w pojeździe. Produkcyjne utwardzanie dodaje warstwę inżynierii, którą większość zespołów niedoszacowuje.

Temperatura pracy to nagłówek — wojskowa krawędź zwykle wymaga -40 do +71°C pracy, obudów chłodzonych kondukcyjnie i zwalidowanej wydajności trwałej (nie szczytowej) na górnym końcu. Jetson Orin NX ma wariant przemysłowy temp z tego powodu; komercyjny Coral — nie. Drgania i wstrząsy idą za profilami MIL-STD-810 — złącza muszą się blokować, lutowane styki nie pękać, a obrotowe pamięci są poza grą (NVMe z prawidłowym underfillem, nie karty SD). Certyfikacja EMI/EMC (zwykle MIL-STD-461) gardłuje integrację platformy; płyta akceleratora, płyta nośna i obudowa wszystkie biorą udział.

Obudowa chłodzona kondukcyjnie to miejsce, gdzie komercyjne części spotykają realia obronne. Jetson Orin AGX przy 50 W potrzebuje realnej masy termicznej i realnej ścieżki kondukcyjnej do podstawy obudowy. Hailo-8 przy 2,5 W można chłodzić podkładką termiczną do ściany obudowy. Wybór akceleratora i projekt mechaniczny są sprzężone — wybieraj je razem, nie sekwencyjnie.

Kluczowy wniosek: Cykl życia to cichy zabójca obronnych programów Edge AI. Komercyjne rodziny akceleratorów rotują co 18-24 miesiące; programy obronne potrzebują 5-7 lat ciągłej dostawy. Mitygacją nie jest "kup więcej zapasów" — jest architektoniczna: potoki modeli ONNX-first, warstwy runtime z abstrakcją producenta i zwalidowany akcelerator second-source w pogotowiu. Benchmarki side-by-side są użytecznymi wejściami, ale plan cyklu życia decyduje, czy program wdroży się w roku 5.

Podsumowanie jest nieromantyczne: nie ma jednej dobrej odpowiedzi. Jetson Orin wygrywa narzędziami i szerokością; Hailo wygrywa TOPS/wat i marginesem termicznym; Coral wypełnia wąską niszę INT8; Qualcomm RB6 wygrywa, gdy zintegrowana komórkówka ma znaczenie; FPGA wygrywają dla deterministycznych, ściśle sprzężonych obciążeń signal-chain. Właściwa decyzja to ta, która przeżyje pięcioletni program z modelem, który faktycznie da się wdrożyć — i którą zespół inżynierski ma kadry i narzędzia, by wspierać.