Сучасна система SIGINT — це програмний конвеєр, що споживає комплексні baseband-семпли — IQ-дані — і виробляє розвідку. Антени та аналогові front-end існують, щоб доставити ці семпли чисто; усе, що перетворює ці семпли на трек, транскрипт, класифікацію чи геолокацію, відбувається в ПЗ. Ця стаття проходить конвеєр з кінця в кінець: апаратура, захоплення, каналізація, демодуляція, пеленгування, прискорення, інтеграція з оперативною картиною та зберігання. Аудиторія — інженери та програм-менеджери, що будують або оцінюють SDR-стек для оборонного використання.
Суміжне читання: наш огляд компонентів SIGINT-платформи покриває системну декомпозицію; ця стаття занурюється в обчислювальне ядро, що сидить між антеною та аналітиком.
1. Стек SDR-конвеєра
Конвеєр має три шари. Апаратний front-end покриває антену, малошумовий підсилювач, фільтрацію, перетворення вниз і аналого-цифрове перетворення. В оборонних і дослідницьких розгортаннях лінійка Ettus USRP (X310, X410, N320) з RFNoC — це робочий кінь: велика миттєва смуга, GPS-синхронізована синхронізація і FPGA-фабрика, що дозволяє пхати DSP у саме радіо. ADALM-Pluto обслуговує навчання та малобюджетну COTS-роботу. Для тактичного вбудованого використання варіанти Microsemi/Microchip RFSoC та інтегровані частини AMD/Xilinx Zynq UltraScale+ RFSoC згортають front-end, ADC і FPGA в один чіп — привабливо для SWaP-обмежених вузлів на дронах або man-pack-колекторах.
Шар драйверів і транспорту виставляє радіо у user-space ПЗ. UHD — це USRP-нативне API і канонічна референція. SoapySDR — вендор-нейтральна абстракція, що дозволяє тому самому конвеєру цілитися в USRP, LimeSDR, BladeRF, HackRF або Pluto зі зміною runtime-конфігурації — безцінне, коли польові колектори гетерогенні. VITA 49 (VRT) — стандартний дротовий формат для streamed IQ у більших архітектурах; якщо ви плануєте ділитися IQ між підсистемами або через мережу, плануйте VITA 49 з першого дня, а не дороблювати потім.
Фреймворк обробки — це місце, де живе DSP-граф. GNU Radio — спільнотний стандарт, Python/C++ flowgraph-середовище з багатою бібліотекою блоків — швидкий для прототипування і дедалі здатний до продакшну. REDHAWK, спочатку проєкт US Naval Research Laboratory, — фреймворк, до якого за замовчуванням звертаються урядові SIGINT-програми: CORBA-компонентна модель, нативна інтеграція з FPGA і модель розгортання, узгоджена з оборонним ІТ. Кастомні конвеєри (чистий C++/CUDA або Rust, де команди інвестували) з'являються, коли бюджети затримки чи детермінізму перевищують можливості flowgraph-рантаймів.
2. Захоплення та зберігання IQ
Перша важка проблема — обсяг. Математика сховища невблаганна: байт за секунду дорівнює sample rate × 2 (I та Q) × байт на семпл. Захоплення 100 MS/s при 16-бітному IQ — це 400 МБ/с, 1,44 ТБ/год, 34 ТБ/добу на приймач. Подвойте для 32-бітних float-проміжних стадій. Чотирьохканальний когерентний колектор на 200 MS/s насичує 10 GbE-лінію до того, як починається будь-яка обробка.
Три важелі зменшують рахунок. Перший: захоплюйте на нативній ширині семпла радіо (12 або 14 біт упаковано), а не підвищуйте до 16 чи 32 біт на дроті. Другий: каналізуйте рано — записуйте лише субсмуги інтересу, а не весь passband. Третій: використовуйте SigMF (Signal Metadata Format) як файлову конвенцію. SigMF зберігає IQ у бінарному файлі .sigmf-data поруч з JSON-файлом .sigmf-meta, що містить sample rate, центральну частоту, тип даних, синхронізацію, геолокацію та довільні анотації. Це найближче, що спільнота має до портативного стандарту IQ, і, на відміну від вендор-пропрієтарних форматів, він переживає конвеєр аналітика.
Для довготривалого зберігання — lossless-стиснення (FLAC, адаптований під IQ, або доменно-специфічні кодеки на кшталт Zstandard на упакованому цілочисловому IQ) — дає 1,3–1,8× зменшення з повною реконструйованістю. Lossy-стиснення (квантизація, децимація, спектральне обрізання) прийнятне лише якщо downstream-використання обмежене; коли ви викинули біти, ви не можете перезапустити демод-ланцюг на іншій гіпотезі.
3. Каналізація
Широкосмугові SIGINT-приймачі захоплюють десятки чи сотні МГц одразу. Конвеєр обробки майже ніколи не оперує повним passband безпосередньо — він розщеплює широкосмуговий потік на вузькі канали для пер-сигнального аналізу. Це каналізація, і алгоритм вибору — каналізатор з полифазним фільтр-банком (PFB).
PFB-каналізатор поєднує прототипний фільтр нижніх частот, полифазну декомпозицію та FFT, щоб виробити N рівно розташованих вузькосмугових вихідних потоків з одного широкосмугового входу — за частку вартості запуску N незалежних down-конвертерів. Компроміс — жорсткість: відстань між каналами фіксована розміром FFT і вхідною швидкістю, тож 1024-точковий PFB на 100 MS/s-потоці дає 1024 канали по ~97,6 кГц кожен, незалежно від того, чи цільові сигнали вкладаються в цю сітку.
Для нерегулярних канальних планів (Tetra-кластер з відстанню 25 кГц поряд з LTE 1,4 МГц) стандартним є двостадійний підхід: грубий PFB для широкосмугового розщеплення, потім пер-канальні довільні tuner-и і ресемплери. FFT-based каналізатори (overlap-save з frequency-domain windowing) — альтернатива, коли канали розріджені й нерегулярні: ви платите більше за канал, але уникаєте зусиль на проєктування прототипного фільтра. Правильний вибір залежить від канальної зайнятості: щільні рівномірні сітки сприяють PFB, розріджені вибіркові канали сприяють FFT-shift-extract.
4. Демодуляція і декодування
Щойно сигнал ізольований у своєму вузькому каналі, конвеєр класифікує та демодулює його. Хвильові форми, з якими ви будете повторно стикатися в оборонній роботі, включають вузькосмугові FM і SSB (legacy voice, любительське, морське), DMR і dPMR (цифрове land-mobile радіо, широко використовуване у Східній Європі та деякими воєнізованими формуваннями), TETRA (public-safety і військове trunked-радіо), P25 (NATO/US public-safety) і LTE/5G NR (комерційний cellular, що дедалі частіше кооптується для тактичного зв'язку). Кожна має відомий demod-ланцюг — symbol timing recovery, carrier sync, еквалізація, slot framing, корекція помилок — і опубліковану специфікацію.
Складна частина — знати, який demod-ланцюг запустити. Автоматична класифікація модуляції (AMC) сидить перед демодуляцією: за невідомим сигналом — вивести модуляційну родину (PSK, FSK, QAM, OFDM, GMSK, …) і порядок, потім диспетчеризувати до відповідного демодулятора. Класична AMC використовує кумулянти високого порядку і циклостаціонарні ознаки; сучасна AMC домінована CNN і transformer-моделями, тренованими на синтетичних і over-the-air IQ-датасетах. Наша стаття класифікація сигналів з ML покриває модельну сторону вглиб; точка інтеграції з SDR-конвеєром — блок класифікатора, що споживає IQ-тензор фіксованого вікна і випускає мітку модуляції плюс довіру в потік метаданих.
5. Пеленгування
Локалізація випромінювача — окремий підконвеєр. Три техніки домінують. Time Difference of Arrival (TDOA) використовує два або більше просторово розділених приймачів і експлуатує пікосекундну різницю в часі прибуття сигналу, щоб гіперболічно локалізувати випромінювач — точно на довгих базах, потребує щільної часової синхронізації. Angle of Arrival (AOA) використовує антенну решітку на одному сайті і алгоритми пеленгування (MUSIC, ESPRIT, Watson-Watt) для оцінки пеленга — дешевше розгортати ніж TDOA, але точність деградує з multipath. Frequency Difference of Arrival (FDOA) експлуатує Doppler-різниці між рухомими приймачами, корисно для повітряного або супутникового збору.
Усі три потребують синхронізованих приймачів. GPS-disciplined oscillators (GPSDO) дають ~10 нс RMS-синхронізації через ad-hoc мережу; для вищої точності — OCXO або рубідієві референції з PTP-over-fiber-транспортом — наступний крок. White Rabbit штовхає sub-наносекундну синхронізацію там, де геометрія може нести оптоволокно. Стаття архітектура мережі пеленгування деталізує стек синхронізації.
Часто ігнорована реальність — геометричне розрідження точності (GDOP): навіть з ідеальною синхронізацією і SNR геометрія ваших приймачів відносно цілі визначає еліпс помилки позиції. Лінійна база дає вам довгий, тонкий еліпс перпендикулярно лінії — точно cross-track, марно along-track. Планування геометрії збору — це SIGINT-інженерна задача, а не лише антенна.
6. GPU- і FPGA-прискорення
На широкосмугових швидкостях CPU вичерпує запас. Два шляхи прискорення домінують, і кожен має домен, де перемагає.
GPU (CUDA) перемагає там, де навантаження data-parallel і толерантне до затримки. Великі FFT, PFB-каналізація, batched matched-filter кореляція, ML-інференс і wideband-пошук — підручникові GPU-навантаження. cuFFT і GPU-прискорені GNU Radio-блоки NVIDIA роблять це доступним; одна A100 або L40 каналізує та попередньо класифікує кілька сотень МГц спектра у реальному часі. Ціна — затримка: PCIe-передача плюс kernel launch overhead кладуть вас у мілісекундний діапазон, що нормально для аналізу, але не для closed-loop РЕБ.
FPGA перемагає там, де затримка sub-мілісекундна або де конвеєр фіксований, а обсяг занадто високий, щоб виносити з радіо. Початкова каналізація на RFNoC, low-latency demod для protected-data links, deinterleaving пульсних радарних випромінювачів і будь-яка decision-loop, що має бити одну радіорамку, належать на FPGA. Ціна — час розробки: FPGA-резидентний алгоритм — 3–10× інженерних зусиль еквівалентного GPU-ядра, і інтеграція в toolchain (HLS, симуляція, timing closure) вимагає спеціалізованих навичок. Наша стаття оптимізація моделей для edge-інференсу покриває суміжне питання впихання ML-моделей в edge-клас обладнання.
Практичний патерн — гібрид: FPGA для front-end каналізатора і будь-якого hard-real-time циклу, GPU для основної post-channelization аналітики, CPU для керування і оркестрації. Уникайте дебатів CPU-vs-GPU-vs-FPGA в абстракті — обирайте per-stage, за бюджетом затримки і unit-економікою.
7. Інтеграція з оперативною картиною
SIGINT-конвеєр, що виробляє самостійні детекції, побудований наполовину. Виходи — emitter-треки, мітки модуляції, еліпси геолокації, декодовані payloads — мають перетікати в ширшу common operational picture, де вони злиті з EO/IR, радаром та іншими джерелами. Ставтеся до кожної SIGINT-детекції як до треку з тими ж полями, що несе радарний трек: ідентифікатор, позиція з невизначеністю, час, класифікація та атрибуція джерела. Це контракт, якого очікують fusion engines (Link 16, NATO STANAG, кастомні track managers); гайд з оборонної фьюжн-обробки даних покриває приймальну сторону.
Обробка класифікації важлива оперативно. Сирий IQ часто класифікований; похідні продукти (пеленг, мітка модуляції, network-id) часто менш класифіковані, ніж вихідний IQ. Конвеєр має нести метадані класифікації на продукт і забезпечувати правила релізу на межі fusion — якщо ви дозволите сирому IQ просочитися в некласифікований track stream, програма закінчиться. Перша стадія fusion-конвеєра (джерела та схеми) — це місце, де мітки класифікації стають придатними для enforcement полями схеми.
Cross-cueing — high-value патерн: SIGINT-детекція тригерить EO/IR-сенсор повернутися і підтвердити, або радарний трек тригерить директивний SIGINT-приймач прослухати на пеленгу. Це вимагає, щоб конвеєр публікував детекції достатньо швидко — у межах секунд після першої детекції — щоб приймальний сенсор діяв до того, як випромінювач переміститься або припинить передачу.
8. Зберігання, отримання та відтворення
SIGINT-системи зберігають три рівні даних. Hot-рівень тримає недавній IQ (години-доби), зазвичай на NVMe-масивах, розмірених для повної швидкості ingest; тут відбувається forensic replay і повторна демодуляція. Warm-рівень тримає зменшені продукти — каналізовані вузькосмугові захоплення, метадані детекцій, класифіковані як цікаві кліпи — на об'єктному сховищі з годинами latency отримання. Cold-рівень тримає довготривалі архіви на стрічках або глибокому об'єктному сховищі, зазвичай лише індекс метаданих плюс вибірково збережені IQ-сніпети.
Query-движки для шару метаданих розщеплюються по знайомій осі. kdb+ залишається вибором для tick-style time-series з sub-мілісекундною query-затримкою через величезні вікна — фінансові корені, але природний фіт для emitter pulse trains і щільних потоків детекцій. ClickHouse — open-source heavy-hitter: column-store, страшенно швидкий на агрегаціях і нині широко розгорнутий в оборонній SIGINT-аналітиці, де ліцензійні бюджети мають значення. Кастомні time-series движки (purpose-built поверх Parquet плюс track-index) з'являються, коли схема занадто нерегулярна для будь-якої off-the-shelf опції.
Патерн replay — операційна винагорода. Аналітик позначає детекцію о 14:32; конвеєр отримує відповідне IQ-вікно з hot-рівня, перезапускає demod з гіпотезою аналітика (інша модуляція, інший framing, інший еквалайзер) і презентує результат поруч з оригінальною детекцією. Той самий replay-шлях підтримує навчання: синтетичні детекції, інжектовані в архівований IQ, стають регресійним набором для класифікатора. Будуйте replay з першого дня — припасовувати його пізніше означає перебудовувати шар сховища.
Від IQ до розвідки, чесно
Конвеєр вище не екзотичний. Кожна зріла SIGINT-програма запускає якусь його версію, і інженерна планка добре зрозуміла. Що відрізняє компетентний SDR-конвеєр від крихкого — дисципліна на межах: SigMF замість bespoke бінарних блобів, VITA 49 замість ad-hoc UDP, classified-aware схеми замість plaintext-метаданих, replay як first-class фіча замість запізнілої думки. Ці рішення дешеві на день один і дорогі на день 800.