Вибір крайового AI-обладнання в обороні — це задача обмеженої оптимізації, замаскована під список покупок. Правильна деталь — та, що запускає виробничу модель достатньо швидко, всередині обмежень розміру, ваги, потужності та вартості платформи, з ланцюгом постачання, що переживає життєвий цикл програми, та програмним стеком, який команда дійсно може запустити в продакшн. Більшість команд за замовчуванням обирають "Jetson AGX, розберемося з бюджетом пізніше" і виявляють через шість місяців, що відсік для корисного навантаження не має 60 Вт охолодження. Ця стаття проходить компроміси по деталях, що важать у 2026.
1. Проблема вибору крайового AI
Кожне рішення щодо крайового AI починається з трьох ортогональних обмежень. SWaP-C — розмір, вага, потужність, охолодження, вартість — встановлюється платформою-носієм і рідко обговорюється. UAS Group 1 дає вам, можливо, 15 Вт і 100 г для всього обчислювального стеку. Машинно-встановлений ISR-карданний підвіс дає 50 Вт і примусове повітря. Прицільний пристрій на гвинтівці дає 5 Вт і пасивну провідну тепловіддачу. Ці числа обмежують усе інше.
Модель визначає підлогу. Детектор об'єктів YOLOv8-n при 640×640 потребує приблизно 8 ГFLOPs на інференс; при 30 FPS це 240 ГFLOPs/с — добре всередині Hailo-8 або Jetson Orin Nano. Перемкніть на transformer-based perception з мультимодальним злиттям, і бюджет стрибає на порядок. Оптимізація моделі може повернути коефіцієнт 2–4x, але не 10x — обирайте обладнання під модель, яку реально плануєте випустити, не під ту, яку хотіли б мати.
Ланцюг постачання встановлює стелю. Оборонні програми працюють 5–10 років. Комерційний кремній обертається кожні 18–24 місяці. Країна походження, класифікація ECCN та доступність другого джерела — не паперова робота закупівлі; це інженерні входи, що формують, які деталі взагалі дозволені в BOM.
2. Сімейство NVIDIA Jetson Orin
Сімейство Jetson Orin — відповідь за замовчуванням з причини. Три SKU охоплюють більшість оборонних крайових бюджетів. Orin Nano (20–40 TOPS INT8, 7–15 Вт конфігурованих) несе малі UAS та ручний бракет. Orin NX (70–100 TOPS, 10–25 Вт) сидить у sweet spot для тактичних ISR-навантажень, наземної техніки та безекіпажних надводних кораблів. Orin AGX (200–275 TOPS, 15–60 Вт) обробляє багатопотокові, мультимодальні навантаження — типові випадки включають одночасну детекцію EO/IR плюс трекінг плюс on-board SLAM.
Вирішальний аргумент — програмний стек. CUDA, cuDNN та TensorRT мають десятиліття покриття моделей та зрілості інструментарію, з якими жоден конкурент не може зрівнятися. Конверсія ONNX-у-TensorRT працює майже на всьому; INT8-калібрування добре зрозуміле; DeepStream обробляє відео-пайплайн; інтеграція ROS 2 — першого класу. Для більшості команд інженерні години, заощаджені за рахунок дотримання NVIDIA-стеку, варті більше за будь-який дефіцит TOPS/Вт.
Недоліки реальні. Jetson Orin працює гаряче відносно NPU-альтернатив — стійкі 25 Вт на Orin NX означають реальне provid conduction-охолодження, не корпус "радіатор-і-молитва". Вартість на одиницю — 3–5x Hailo-еквіваленту. Деталі експортно-контрольовані (ECCN 4A003), що додає тертя для не-US-партнерів програми. Зобов'язання NVIDIA щодо оборонного каналу життєвого циклу солідне, але дорожня карта Jetson досі прив'язана до комерційних пріоритетів NVIDIA, не ваших.
3. Hailo-8 і Hailo-15
Hailo — лідер TOPS/Вт і це не близько. Hailo-8 видає 26 TOPS INT8 при приблизно 2.5 Вт типово — близько 10 TOPS/Вт проти 4–7 TOPS/Вт у Jetson Orin NX на практиці. Hailo-15, SoC-варіант, інтегрує quad-core Arm Cortex-A53, ISP та 20 TOPS NPU в межах менше ніж 3 Вт — спеціально побудований для форм-факторів smart-camera. Для малого тросового дрона, носимого ISR-комплекту або шоломного обчислювального блоку SWaP-математика вирішальна.
Workflow — там, де стає важче. Hailo Dataflow Compiler бере модель ONNX або TFLite та емітує бінарник Hailo Executable Format (HEF). Квантизація до INT8 — обов'язкова; немає FP16-fallback. Model zoo солідний для vision (сімейство YOLO, MobileNet, EfficientDet, segmentation backbones), але тонкий для transformer-архітектур, кастомних операцій та всього поза підтримуваним списком операторів. Очікуйте реальне зусилля портування для не-ванільних моделей; закладайте мінімум два тижні інженерної роботи на перший порт, менше на наступні варіанти.
Країна походження — Ізраїль, загалом прийнятна для NATO-програм, але варто підтвердити з вашою контрактною командою. Тяга Hailo в обороні зростає — деталі поставляються в контр-UAS системах, ISR-дронах та кількох NATO-суміжних програмах. Зобов'язання щодо життєвого циклу коротше за NVIDIA, але покращується.
4. Google Coral (Edge TPU)
Coral Edge TPU був оригінальним quantization-first крайовим прискорювачем: 4 TOPS INT8 при приблизно 2 Вт, доступний у форм-факторах M.2, Mini PCIe, USB та Dev Board. Для легкого INT8 vision (детектори класу MobileNet, малі класифікатори) на платформі з обмеженою потужністю Coral досі видає. TFLite-інструментарій зрілий, INT8-калібрування добре задокументоване, а деталі дешеві.
Проблема для оборони — питання ланцюга постачання. Деталі Coral — EAR99 та US-origin (фабрика TSMC), що на папері добре. Але Google не комунікувала чіткої дорожньої карти наступника, комерційний канал — єдине джерело, і зобов'язання щодо життєвого циклу оборонної програми по суті відсутнє. Coral прийнятний для прототипів, тренувальних стендів та немісійно-критичних ролей, де заміна деталі в середині програми терпима. Для виробничих оборонних програм з 5+ річною підтримкою планування альтернативи Hailo або Jetson — безпечніший вибір.
Покриття моделей також вужче, ніж здається. Coral добре обробляє INT8 CNN-архітектури з курованого списку; будь-що поза цим списком — трансформери, кастомні операції, dynamic shapes — потребує значного реструктурування або просто не компілюється.
5. Qualcomm RB6 / Snapdragon Compute
Dev kit Qualcomm RB6 (QRB5165 SoC плюс 5G-модем) та ширша лінія Snapdragon Compute націлені на іншу проблему: інтегрований AI плюс стільниковий зв'язок на одному SoC. QRB5165 видає близько 15 TOPS через CPU, GPU, DSP та Hexagon NPU при приблизно 5–7 Вт, плюс інтегрований X55 5G-модем та повний Qualcomm ISP-стек.
Випадок використання — стільниково-крайовий сенсор: носимий або машинно-встановлений вузол, що запускає локальний AI-інференс і стрімить стиснені метадані через 5G/LTE назад до командного вузла. Інтегрований модем економить дискретний стільниковий модуль, шар плати та 1–2 Вт потужності — суттєво на дні SWaP-конверту.
Недоліки — програмне забезпечення та ліцензування. Qualcomm AI Engine SDK (раніше SNPE) менш зрілий, ніж TensorRT або інструментарій Hailo, з тоншим покриттям ONNX та крутішою кривою навчання. Умови IP-ліцензування навколо модемів Qualcomm несуть обмеження, які деякі оборонні замовники вважають незручними. Деталі мають commercial-grade зобов'язання щодо життєвого циклу, не defense-grade. Для програм, де інтегрований стільниковий — вирішальний фактор, RB6 — правильна відповідь; для всього іншого Jetson або Hailo виграє на інструментарії одному.
6. FPGA-альтернативи
Для конкретного класу оборонних навантажень GPU та NPU — повністю неправильна відповідь. Xilinx Versal AI Edge (VE2302 через VE2802) поєднує hard AI Engines, програмовану логіку та Arm-ядра на одному кристалі — корисна AI-пропускна здатність у діапазоні 50–200 TOPS плюс щільна інтеграція з кастомними DSP-фронтендами. Intel Stratix 10 NX націлюється на верхній край з tensor-блоками, інтегрованими в FPGA-фабрику.
FPGA виграють, коли істинні три речі: (1) навантаження вимагає детермінованої sub-millisecond латентності, (2) кастомне pre/post-processing — кондиціонування радарного сигналу, EW front-end, кастомне sensor fusion — має сидіти на тому ж кристалі, що й AI-блок, та (3) життєвий цикл програми достатньо довгий, щоб амортизувати вартість розробки. Типові підходи — обробка радарних сигналів, приймачі радіоелектронної боротьби, шукачі ракет та будь-яка система, де AI — стадія в щільному DSP-пайплайні, а не вся програма.
Вартість реальна. Розробка FPGA — 3–5x інженерних годин GPU-еквівалента. Інструментарій (Vitis AI, Quartus Prime) має круту криву. Кадри з досвідом HLS плюс AI справді рідкісні. Для програми, де FPGA виправдане, ця вартість відновлюється протягом життєвого циклу; для програми, що випадково дрейфувала в територію FPGA, це бюджетний вбивця.
7. Міркування ланцюга постачання та ITAR
Країна походження — перший фільтр BOM. Jetson Orin і Coral — US-origin. Hailo — ізраїльський. SoC Qualcomm — US-проєктовані, mixed-fab. Versal і Stratix — US-origin. Для ITAR-контрольованих платформ розрахунок простий — віддавайте перевагу US або деталям довірених союзників і документуйте визначення. Для EAR-only програм двері ширше, але експортна класифікація (EAR99 vs CCL-записи на кшталт 4A003 для high-performance compute) досі веде ліцензування та обмеження кінцевого використання.
Планування другого джерела не обговорюється. Брутальна комерційна реальність — будь-яке окреме сімейство прискорювачів закінчить життя всередині життєвого циклу програми. Мітигації шарові: тримайте пайплайн моделі ONNX-first, щоб порт до наступника був runtime-замінною, а не переписуванням; ізолюйте vendor-specific код (TensorRT, Hailo Runtime, Qualcomm AI Engine) за тонкою абстракцією; виконуйте резерви last-time-buy при сповіщенні про закінчення життя; та валідуйте принаймні один альтернативний прискорювач паралельно під час розробки. Програми, що пропускають цю дисципліну, платять за це на 4-й рік.
ITAR-free пайплайни важать для експортних продажів. Система, побудована повністю з EAR99-деталей плюс open-source моделей, може продаватися під значно легшими обмеженнями, ніж та, що втягує CCL-прискорювачі або US-origin defense IP. Для багатонаціональних NATO-програм та FMS-суміжних продажів ITAR-free конфігурація як deliverable варіант — не єдиний варіант, але один з них — відкриває ринки, які ITAR-locked стек закриває. Ландшафт оборонного AI винагороджує архітектурну гнучкість тут.
8. Ругдизація та життєвий цикл
Комерційні developer kits — не розгортуване обладнання. Jetson Orin Nano Dev Kit чудовий для прототипування; він помирає першого разу, коли ви його доставляєте в машині. Виробнича ругдизація додає шар інженерії, який більшість команд недооцінюють.
Робоча температура — заголовкова специфікація: військовий край зазвичай потребує -40 до +71 °C робочих, conduction-cooled корпусів та валідованої стійкої продуктивності (не пікової) на верхньому краю. Jetson Orin NX має industrial-temp варіант з цієї причини; комерційний Coral — ні. Вібрація та удар слідують профілям MIL-STD-810 — конектори мають фіксуватися, паяні з'єднання не повинні тріскатися, а будь-яке rotating storage виключене (NVMe з належним underfill, не SD-картки). EMI/EMC сертифікація (зазвичай MIL-STD-461) обмежує інтеграцію платформи; плата прискорювача, carrier board та корпус — усі беруть участь.
Conduction-cooled корпус — де комерційні деталі зустрічаються з оборонною реальністю. Jetson Orin AGX при 50 Вт потребує реальної термальної маси та реального conduction-шляху до chassis baseplate. Hailo-8 при 2.5 Вт можна охолодити термальною подушкою до стінки корпусу. Вибір прискорювача та механічний дизайн пов'язані — обирайте їх разом, не послідовно.
Ключовий висновок: Життєвий цикл — тихий вбивця оборонних програм крайового AI. Комерційні сімейства прискорювачів обертаються кожні 18–24 місяці; оборонні програми потребують 5–7 років стійкого постачання. Мітигація — не "купити більше інвентарю" — вона архітектурна: ONNX-first пайплайни моделей, vendor-абстраговані runtime-шари та валідований другий прискорювач напоготові. Бенчмарки пліч-о-пліч — корисні входи, але план життєвого циклу — те, що визначає, чи програма випуститься на 5-й рік.
Резюме нерекламне: єдиної правильної відповіді немає. Jetson Orin виграє на інструментарії та широті; Hailo виграє на TOPS/Вт та термальному запасі; Coral заповнює вузьку INT8-нішу; Qualcomm RB6 виграє, коли важать стільниковий зв'язок; FPGA виграють для детермінованих, щільно пов'язаних навантажень signal-chain. Правильний виклик — той, що переживає п'ятирічну програму з моделлю, яку ви реально можете випустити в продакшн — і інженерна команда має кадри й інструменти для підтримки.