Як противники протидіють когнітивній РЕБ і як система реагує?

Противники протидіють когнітивній РЕБ кількома методами: швидка частотна гнучкість (стрибки швидше, ніж когнітивна система здатна відстежувати), сигнали з розширеним спектром (зниження спектральної щільності потужності нижче порогу виявлення засобу глушіння), розробка сигналів LPI/LPD (низька ймовірність перехоплення/виявлення завдяки псевдовипадковому розширенню) та навмисне впровадження оманливих сигналів для введення в оману класифікатора. Когнітивна система РЕБ реагує оновленням своєї політики RL на основі спостережуваної неефективності глушіння, розширенням швидкості сканування частот та розгортанням набору паралельних гіпотез глушіння на кількох частотах-кандидатах. Проти ворожого обману моделі виявлення аномалій позначають сигнали, що мають статистичні властивості, несумісні з історичною бібліотекою випромінювань противника.

SIGINT та RF-аналітика

Когнітивна радіоелектронна боротьба: ШІ-кероване адаптивне глушіння та зондування спектра

Q: Як навчання з підкріпленням застосовується до глушіння в радіоелектронній боротьбі?

Навчання з підкріпленням (RL) розглядає систему РЕБ як агента, що діє в електромагнітному середовищі. Агент спостерігає стан спектра (наявні типи сигналів, їх частоти, модуляцію та рівні потужності), вибирає дію (сигнал глушіння, частотний зсув і налаштування потужності) та отримує сигнал винагороди, який відображає ефективність глушіння -- наприклад, зменшення відношення сигнал-до-завади-плюс-шум у приймачі противника або виміряне порушення його каналу зв'язку. Протягом багатьох взаємодій політика RL вивчає, які вибори сигналу найефективніші проти кожного класу сигналів. Оскільки винагорода виводиться зі спостережуваних ефектів у спектрі, а не з розмічених навчальних даних, RL може виявляти стратегії глушіння, які не були явно запрограмовані.

Q: Яке апаратне забезпечення потрібне для когнітивної РЕБ у реальному часі?

Платформа когнітивної РЕБ у реальному часі потребує трьох тісно інтегрованих апаратних підсистем: RF-фронтенду, здатного до широкосмугового аналого-цифрового перетворення (швидкість ADC 1--10 GSps для миттєвої смуги пропускання в кілька ГГц), рівня цифрової обробки сигналів (зазвичай FPGA) для канализації, виділення ознак та генерації сигналів у реальному часі, а також прискорювача інференсу (GPU, ASIC або матриця FPGA) для запуску ML-класифікатора та політичної мережі RL з низькою затримкою. Програмно-визначені радіостанції (SDR), такі як Analog Devices AD9371 або AD9082, забезпечують RF-фронтенд; родина Xilinx RFSoC інтегрує ADC, FPGA та ARM-обробку на одному кристалі, роблячи її домінуючою платформою для компактних авіаційних та наземних систем когнітивної РЕБ.

Автор: Інженерна команда Corvus Intelligence · Про команду →

19 червня 2026 9 хв читання

Звичайний засіб глушіння працює за фіксованими правилами: виявити випромінювач загрози на відомій частоті, передати попередньо запрограмований сигнал проти нього і повторити. Проти противника зі статичною, добре охарактеризованою бібліотекою сигналів такий підхід працює. Проти сучасного противника, оснащеного радіостанціями з переналаштуванням частоти, адаптивними протоколами ECCM та здатністю переналаштовуватися швидше, ніж може відреагувати людина-оператор, він зазнає невдачі вже за кілька секунд після першого зіткнення. Когнітивна радіоелектронна боротьба (РЕБ) усуває цю прогалину, автономно замикаючи цикл зондування-рішення-дії. Рівень управління спектром радіоелектронної боротьби, який колись потребував спеціальних операторів, тепер стає конвеєром машинного інференсу, що проходить цикли вибору сигналу та оновлення політики швидше, ніж дозволяє будь-який час реакції людини. Ця стаття охоплює основні технічні компоненти: широкосмугове зондування спектра, класифікацію сигналів, логіку вибору сигналу глушіння, навчання з підкріпленням для оптимізації політики, обмеження часу циклу, контрзаходи противника та апаратний стек, що робить когнітивну РЕБ у реальному часі здійсненною.

Що робить радіоелектронну боротьбу когнітивною і чому це важливо проти адаптивних противників

Термін «когнітивна» в РЕБ має точне технічне значення, що походить зі спільноти досліджень когнітивного радіо: система є когнітивною, якщо вона сприймає своє середовище, вчиться зі своїх взаємодій із цим середовищем та адаптує свою поведінку для покращення своєї мети. Стосовно РЕБ середовищем є електромагнітний спектр, а метою є або порушення зв'язку та сенсорів противника, або захист дружніх випромінювань від порушення. Когнітивна система РЕБ відрізняється від адаптивної системи РЕБ за ступенем: адаптивні системи слідують попередньо написаним деревам рішень, прив'язаним до відомих параметрів загроз; когнітивні системи вивчають політики з досвіду, які узагальнюються на типи сигналів та поведінку противника, що не були явно передбачені під час проєктування.

Операційним рушієм когнітивної РЕБ є прискорення циклу адаптації противника. Сучасні військові радіостанції зі здатностями електронної протидії протидії (ECCM) можуть переналаштовувати частоту тисячі разів на секунду, розповсюджувати енергію по десятках мегагерц смуги пропускання або перемикати схеми модуляції у відповідь на виявлене глушіння. Людина-оператор, навіть із відмінною підготовкою та інструментами відображення спектра в реальному часі, не може зрівнятися з цим темпом. Когнітивна система РЕБ замінює людину на внутрішньому контурі -- рішенні щодо вибору сигналу на масштабі мілісекунд -- зберігаючи при цьому повноваження людини над правилами застосування сили та цілями кампанії вищого порядку. Результатом є засіб глушіння, який деградує плавно проти нових загроз, а не стає негайно неефективним.

Військова цінність виходить за межі глушіння. Архітектури когнітивної РЕБ однаково застосовні до електронного захисту (виявлення та класифікація глушіння, спрямованого на дружні системи) та радіоелектронної підтримки (пасивне характеризування електромагнітного порядку бою). Єдина платформа когнітивної РЕБ із широкосмуговим приймальним трактом та навченим класифікатором сигналів одночасно робить внесок у всі три складові тріади РЕБ, причому той самий конвеєр машинного навчання обслуговує як наступальні ролі глушіння, так і оборонні ролі моніторингу спектра.

Зондування спектра для когнітивної РЕБ: широкосмугова дискретизація та класифікація сигналів на швидкості

Ефективна когнітивна РЕБ починається з точного, низьколатентного знання про електромагнітне середовище. Підсистема зондування спектра повинна безперервно відповідати на три питання: які сигнали присутні, на яких частотах та смугах пропускання, і які їхні технічні характеристики. Для наземної системи, що працює в оспорюваному електромагнітному середовищі, відповідний діапазон частот може охоплювати від 20 МГц до 6 ГГц -- майже дев'ять октав -- зі смугами пропускання сигналів від кількох кілогерц для вузькосмугових голосових каналів до десятків мегагерц для широкосмугових ліній OFDM. Жодна окрема архітектура приймача не покриває цей діапазон одночасно з достатньою чутливістю та динамічним діапазоном, тому практичні системи використовують комбінацію широкосмугового панорамного приймача для виявлення сигналів та вужчосмугових канализованих приймачів для детального характеризування сигналів.

Конвеєр класифікації сигналів отримує канализований вихід і присвоює кожному виявленому сигналу мітку типу. Класифікація сигналів за допомогою машинного навчання з використанням згорткових нейронних мереж на ознаках спектрограми досягає точності 90--97% на репрезентативних бібліотеках військових сигналів при відношеннях сигнал-шум вище 5 дБ. Нижче 5 дБ SNR точність швидко погіршується для вузькосмугових сигналів, тоді як сигнали з розширеним спектром виявляються (їхню енергію можна побачити в PSD), але тип їхньої модуляції часто неоднозначний, доки не буде спостережено достатньо бітів. Тому конвеєр зондування повинен працювати з градуйованою моделлю довіри: класифікації з високою довірою запускають негайний вибір сигналу, тоді як виявлення з низькою довірою запускають продовження спостереження перед виділенням ресурсів на глушіння.

Швидкість оновлення картини спектра -- наскільки часто конвеєр зондування оновлює свій огляд кожної смуги частот -- визначає мінімальну швидкість адаптації противника, яку система здатна відстежувати. Конвеєр зондування, що видає повне оновлення спектра кожні 10 мс, може відстежувати системи з переналаштуванням частоти зі швидкістю стрибків до 100 стрибків на секунду. Швидше переналаштування вимагає або спеціального вузькосмугового приймача, прив'язаного до послідовності стрибків противника (що потребує попереднього знання послідовності або здатності її прогнозувати), або широкосмугового шумового засобу глушіння, що одночасно покриває весь набір стрибків із нижчою ефективністю на кожну частоту. Когнітивні системи РЕБ зазвичай поєднують рівень широкосмугової відмови з рівнем вузькосмугової точності, розподіляючи ресурси між ними на основі картини спектра в реальному часі.

Вибір сигналу глушіння: узгодження типу випромінювання з характеристиками сигналу противника

Не кожен сигнал глушіння однаково ефективний проти кожного типу сигналу. Загороджувальний шумовий засіб глушіння, що покриває 100 МГц смуги пропускання проти вузькосмугового голосового каналу 25 кГц, марнує 99,975% своєї потужності передачі на частоти, які противник не використовує. Однотональний засіб глушіння, точно центрований на вузькосмуговому каналі, досягає того самого відношення глушіння-до-сигналу з часткою потужності передачі -- але негайно долається, якщо противник переналаштовується на нову частоту. Логіка вибору сигналу повинна узгоджувати геометрію випромінювання зі спектральною зайнятістю сигналу противника, типом модуляції та прогнозованою стратегією адаптації.

Для вузькосмугових випромінювачів безперервної хвилі тон-плюс-шумовий засіб глушіння, що розміщує високопотужну несучу на центральній частоті противника та додає сформований шум по смузі пропускання каналу, досягає найкращої ефективності глушіння. Для псевдовипадкового переналаштування частоти з розширеним спектром ефективним підходом є слідкуючий засіб глушіння, що виявляє поточну частоту стрибка, вибирає відповідний тон або вузькосмуговий шумовий сплеск і передає в межах часу утримання стрибка -- або, якщо швидкість стрибків перевищує затримку слідкування, частково-смуговий шумовий засіб глушіння, що покриває найчастіше використовувану частину набору стрибків. Для сигналів OFDM (основи більшості сучасних тактичних ліній даних) субнесуче-вибіркове глушіння, що атакує пілотні та керуючі субнесучі, порушує синхронізацію ефективніше, ніж широкосмуговий шум, оскільки приймач OFDM покладається на когерентність пілотів для оцінки каналу та демодуляції.

Рішення про вибір сигналу -- це місце, де компонент машинного навчання надає найпрямішу цінність. Таблиця пошуку, прив'язана до типу сигналу, може кодувати наведені вище сигнали, але вона не може врахувати взаємодію між одночасними завданнями глушіння, виснаження доступного бюджету потужності передачі по кількох цілях або динамічну переприоритизацію цілей у міру розвитку тактичної ситуації. Вивчена політика, навчена на змодельованому електромагнітному середовищі з репрезентативними моделями поведінки противника, узагальнюється по цих вимірах і вивчає компроміси, які набір правил, написаний вручну, не зміг би охопити без широкої ітерації з експертами предметної області.

Навчання з підкріпленням для політики глушіння: вивчення ефективних реакцій без розмічених даних

Навчання з підкріпленням (RL) -- це парадигма машинного навчання, найкраще придатна для оптимізації політики когнітивної РЕБ, оскільки воно не вимагає розмічених навчальних даних. Не існує еталонної мітки для «оптимальної дії глушіння за даного стану спектра» -- оптимальна дія залежить від поведінки противника, яка невідома та адаптивна. RL обходить це, навчаючись на взаємодії: система виконує дію, спостерігає результуючий стан спектра, отримує сигнал винагороди, що відображає ефективність глушіння, та оновлює свою політику, щоб надавати перевагу діям, які давали кращі винагороди в минулому. Протягом тисяч взаємодій у симуляції політика RL сходиться до стратегії, що перевершує написані вручну правила проти змодельованого розподілу противника.

Розробка функції винагороди -- це найвагоміший інженерний вибір у конвеєрі RL. Винагорода, заснована суто на виміряному зниженні потужності сигналу противника, заохочує агресивне широкосмугове глушіння, що максимізує заваду незалежно від вартості для дружнього використання спектра. Реалістичніша функція винагороди одночасно включає кілька конкуруючих цілей: деградація сигналу противника (позитивна винагорода, пропорційна оціненому зниженню SINR противника), захист дружнього спектра (негативна винагорода за дії глушіння, що потрапляють у смуги частотного розподілу дружніх сил), ефективність потужності передачі (негативна винагорода, пропорційна спожитій енергії передачі на одиницю порушення противника) та затримка (негативна винагорода за повільне завершення циклу). Багатоцільове формулювання винагороди дає політику, що робить тонкі компроміси між цими конкуруючими цілями, а не оптимізує єдиний вимір за рахунок інших.

Практичною проблемою когнітивної РЕБ на основі RL є розрив сим-до-реальності: політика, навчена на змодельованому електромагнітному середовищі, зіткнеться в розгортанні з характеристиками сигналів, що відрізняються від навчального розподілу. Сучасні програми когнітивної РЕБ вирішують це через рандомізацію домену під час навчання (варіювання умов поширення, рівнів шуму, моделей поведінки противника та параметрів сигналів у широких діапазонах, щоб зробити політику стійкою до спостережень поза розподілом) та через онлайн-донавчання (продовження оновлення політики з операційного досвіду з малою швидкістю навчання, за умови обмежень безпеки, що запобігають деградації політики під час живих операцій). Компонент онлайн-донавчання особливо важливий: він дозволяє системі адаптуватися до тактики ECCM конкретного противника протягом операційної місії, будуючи специфічний для місії рівень політики поверх загального попередньо навченого базису.

Обмеження часу циклу: як швидко когнітивна система РЕБ повинна зондувати та реагувати

Час циклу зондування-рішення-дії визначає швидкості адаптації противника, які когнітивна система РЕБ здатна зрівняти. Три бюджети часу застосовуються на різних рівнях архітектури. Час перемикання сигналу -- наскільки швидко тракт передачі може завантажити нові параметри та почати випромінювати -- визначається RF-апаратурою і зазвичай становить 1--100 мікросекунд для генераторів сигналів на основі FPGA. Затримка класифікації сигналу -- скільки часу потрібно конвеєру інференсу, щоб видати впевнену мітку типу сигналу з нещодавно отриманих відліків -- залежить від складності моделі, апаратури інференсу та мінімальної тривалості спостереження, необхідної для впевненої класифікації; на практиці це коливається від 1 мс для простих вузькосмугових сигналів із високим SNR до 50 мс для складних сигналів при низькому SNR. Затримка оновлення політики -- скільки часу політичній мережі RL потрібно, щоб засвоїти поточний вектор спостереження та видати нову дію -- зазвичай становить 1--10 мс на спільно розміщеному GPU, або менше 1 мс, якщо політика скомпільована в логіку FPGA.

Ці три затримки сумуються, щоб визначити наскрізний час реакції проти конкретної події адаптації противника. Проти радіостанції з переналаштуванням частоти, що стрибає зі швидкістю 100 стрибків на секунду (10 мс утримання на стрибок), система має приблизно 5--7 мс часу утримання стрибка, щоб виявити нову частоту стрибка, класифікувати сигнал, вибрати сигнал та почати передачу -- залишаючи 2--3 мс часу утримання, протягом яких глушіння активне. Це маргінальне покриття означає, що проти дуже швидких систем переналаштування частково-смугове шумове глушіння, що покриває ймовірний набір стрибків, надійніше, ніж точне слідкуюче глушіння, навіть попри те, що воно менш спектрально ефективне. Когнітивні системи РЕБ, які досягають субмілісекундного наскрізного часу циклу, можуть зсунути баланс у бік точного глушіння навіть при високих швидкостях стрибків.

Ключове обмеження: Бюджет часу циклу для когнітивної РЕБ -- це не єдине число, а стек затримок: вікно захоплення ADC + канализація + виділення ознак + ML-інференс + завантаження сигналу + час встановлення RF. Оптимізація лише етапу ML-інференсу при ігноруванні тривалості вікна захоплення ADC (яке повинно бути достатньо довгим, щоб спостерегти достатньо сигналу для впевненої класифікації) дає систему, що швидка в бенчмарку інференсу, але повільна в польових умовах. Вікно захоплення ADC для надійної класифікації сигналу з переналаштуванням частоти зазвичай у 2--5 разів перевищує час утримання стрибка, що означає, що конвеєр зондування повинен буферизувати та обробити кілька стрибків, перш ніж видати мітку з високою довірою. Архітектори систем повинні розмірувати бюджет часу циклу одночасно по всіх рівнях.

Контрзаходи противника: як противники адаптуються і як когнітивні системи реагують

Витончений противник, усвідомлюючи, що система РЕБ загрози є когнітивною, намагатиметься експлуатувати механізм навчання, а не просто ухилятися від поточного сигналу глушіння. Ворожий обман проти когнітивної РЕБ набуває кількох форм. Противник може впроваджувати синтетичні сигнали, що імітують випромінювачі високої цінності, змушуючи когнітивну систему марнувати ресурси глушіння на приманки, тоді як реальний зв'язок триває на немоніторованих частотах. Противник може швидко циклити по великому набору переналаштування частоти, виснажуючи здатність когнітивної системи одночасно відстежувати всі активні випромінювачі та змушуючи її розставляти пріоритети, залишаючи деякі випромінювачі неглушеними. Противник також може експлуатувати навчальний розподіл RL, використовуючи характеристики сигналів, що виходять за межі навчального набору класифікатора, спричиняючи помилкову класифікацію та запуск неефективних виборів сигналу.

Когнітивні системи РЕБ протидіють ворожому обману через кілька архітектурних реакцій. Моделі виявлення аномалій, що працюють паралельно з основним класифікатором сигналів, позначають сигнали, чиї статистичні властивості несумісні з історично спостережуваною бібліотекою випромінювань противника -- сигнали-приманки, згенеровані автоматизованими системами, зазвичай показують регулярності в часі, частоті або потужності, яких реальний тактичний трафік не виявляє. Методи RF-фінгерпринтингу, що ідентифікують конкретну апаратуру за її ненавмисними характеристиками випромінювання, можуть відрізнити фізичні передавачі від програмно-згенерованих приманок, оскільки апаратні недосконалості (зсув несучої, фазовий шум, дисбаланс IQ) реальної радіостанції важко точно відтворити в генераторі сигналів. Поєднання поведінкового виявлення аномалій та апаратного фінгерпринтингу значно знижує ефективність операцій обману проти зрілої когнітивної системи РЕБ.

На рівні політики добре спроєктована функція винагороди RL неявно перешкоджає надмірному виділенню ресурсів на будь-яку єдину ціль, караючи нехтування іншими активними випромінювачами в просторі спостереження. Противники, які намагаються відтягнути всю увагу глушіння на приманку, виявлять, що політика, навчена на різноманітному електромагнітному середовищі з кількома одночасними випромінювачами, розподіляє ресурси по картині загроз, а не зосереджується виключно на сигналі найвищої потужності. Це пряма перевага багатоцільового формулювання винагороди: воно вбудовує стійкість до маніпуляцій, якої не мала б одноцільова політика, зосереджена суто на максимізації порушення сигналу.

Апаратні вимоги: компроміси FPGA, GPU та SDR для когнітивної РЕБ у реальному часі

Когнітивна РЕБ у реальному часі потребує трьох апаратних підсистем, тісно інтегрованих на спільній фабриці даних: RF-фронтенд для аналого-цифрового перетворення та генерації сигналів, рівень цифрової обробки сигналів для канализації та виділення ознак, а також прискорювач інференсу для запуску ML-класифікатора та політики RL. Домінуючим архітектурним вибором для перших двох рівнів є родина Xilinx RFSoC (тепер AMD), яка інтегрує мультигігасемпльні ADC та DAC, велику програмовану логічну фабрику та обчислювальні ядра ARM Cortex-A на одному кристалі. Ця інтеграція усуває вузьке місце високошвидкісного інтерфейсу між ADC та FPGA, що впливає на багаточіпові конструкції, зменшує площу плати та споживання потужності та спрощує синхронізацію між приймальним і передавальним трактами. Платформи когнітивної РЕБ на основі RFSoC в межах загальної потужності 20 Вт можуть досягати миттєвих смуг пропускання 1--4 ГГц, чого достатньо для більшості наземно-транспортних та авіаційних застосувань РЕБ нижче 6 ГГц.

Вибір прискорювача інференсу включає справжній компроміс між затримкою, потужністю та гнучкістю. GPU (клас NVIDIA Jetson) забезпечує найвищу пропускну здатність для інференсу великих моделей і підтримує швидку ітерацію політики під час розробки -- нові політики RL, навчені в симуляції, можна перенести на платформу простим кроком експорту моделі. Однак затримка інференсу GPU для малих моделей обмежена накладними витратами на передачу даних (копіювання з пам'яті CPU в пам'ять GPU плюс запуск ядра), що зазвичай додає 0,5--2 мс на виклик інференсу незалежно від розміру моделі. Для часу циклу когнітивної РЕБ менше 5 мс ці накладні витрати становлять значну частку загального бюджету. Інференс на основі FPGA, досягнутий компіляцією політичної мережі у фіксовано-точкову логіку FPGA за допомогою інструментів, таких як HLS4ML або Vitis AI, усуває накладні витрати на передачу та досягає детермінованої субмікросекундної затримки інференсу, але вимагає повторного синтезу для кожного оновлення політики -- процесу, що займає від 30 хвилин до кількох годин, роблячи онлайн-донавчання RL непрактичним у режимі чистого інференсу FPGA. Практична архітектура для розгорнутих систем поєднує обидва: логіку FPGA для критичного до затримки внутрішнього контуру (вибір сигналу з попередньо скомпільованої політики) та GPU для фонового вдосконалення політики та виявлення аномалій, з періодичними скомпільованими оновленнями політики, що передаються до фабрики FPGA під час операційних пауз.

Обмеження потужності та розміру-ваги-і-потужності (SWAP) спричиняють значні відмінності між класами платформ. Когнітивна система РЕБ, встановлена на транспортному засобі, може вмістити корисне навантаження 200--500 Вт, що дозволяє повне апаратне забезпечення класу RFSoC плюс Jetson AGX з адекватним охолодженням. Носима людиною або встановлена на малому UAV система обмежена до менше 30 Вт, що змушує вибирати між варіантом RFSoC меншої ємності (наприклад, ZU28DR замість ZU67DR) та агресивнішою стратегією стиснення політики -- квантовані та обрізані політичні мережі з менш ніж 500 тис. параметрів, що вміщуються у фабрику інференсу FPGA без переливу на окремий GPU. Вартість продуктивності цього стиснення вимірна (зниження ефективності глушіння на 3--8% проти нових сигналів у симуляційних бенчмарках), але операційно прийнятна з огляду на обмеження SWAP спішених та встановлених на UAV операцій РЕБ.

Інтегруйте виходи когнітивної РЕБ у вашу картину збору SIGINT

Corvus SENSE інтегрує виходи сенсорів когнітивної РЕБ із картиною збору SIGINT, корелюючи події адаптивного глушіння з треками випромінювачів та розвідданими про загрози для скоординованих операцій в електромагнітному спектрі.

Дізнатися про Corvus SENSE → Замовити брифінг

Цей аналіз підготували інженери Corvus Intelligence, які створюють критично важливі застосунки ISR та SIGINT для оборонних та урядових організацій. Дізнатися про нашу команду →

Часті запитання

Що робить систему радіоелектронної боротьби когнітивною?

Когнітивна система РЕБ автономно замикає цикл зондування-рішення-дії за допомогою машинного навчання. Вона безперервно дискретизує електромагнітний спектр, класифікує сигнали за типом і пріоритетом загрози, вибирає сигнал глушіння з бібліотеки політик, вимірює вплив на випромінювач противника та оновлює свою політику на основі спостережуваних результатів. Визначальною характеристикою є адаптація в замкненому контурі: система змінює свою поведінку у відповідь на реакції противника без втручання людини на кожному циклі. Це відрізняє когнітивну РЕБ від звичайних попередньо запрограмованих засобів глушіння, які виконують фіксовані сигнали незалежно від того, чи адаптувався противник для їх подолання.

Як навчання з підкріпленням застосовується до глушіння в радіоелектронній боротьбі?

Навчання з підкріпленням розглядає систему РЕБ як агента, що діє в електромагнітному середовищі. Агент спостерігає стан спектра, вибирає дію (сигнал глушіння, частотний зсув і налаштування потужності) та отримує сигнал винагороди, що відображає ефективність глушіння -- наприклад, виміряне порушення каналу зв'язку противника. Протягом багатьох взаємодій політика RL вивчає, які вибори сигналу найефективніші проти кожного класу сигналів. Оскільки винагорода виводиться зі спостережуваних ефектів у спектрі, а не з розмічених навчальних даних, RL може виявляти стратегії глушіння, які не були явно запрограмовані.

Який час циклу потрібен когнітивній системі РЕБ, щоб бути ефективною?

Необхідний час циклу зондування-рішення-дії залежить від того, наскільки швидко противник може переналаштуватися або перейти на резервну частоту. Проти систем із переналаштуванням частоти, що стрибають кожні 10--100 мс, когнітивна система РЕБ повинна завершити свій цикл у межах інтервалу стрибка -- зазвичай це вимагає повного циклу менше 5 мс. Проти повільніших противників час циклу 50--200 мс є достатнім. Платформи когнітивної РЕБ на основі FPGA досягають часу перемикання сигналу 1--10 мікросекунд; вузьким місцем зазвичай є етап ML-інференсу, який на спільно розміщеному GPU додає 1--10 мс.

Яке апаратне забезпечення потрібне для когнітивної РЕБ у реальному часі?

Платформа когнітивної РЕБ у реальному часі потребує RF-фронтенду з широкосмуговим ADC/DAC (1--10 GSps), FPGA для канализації та генерації сигналів, а також прискорювача інференсу (GPU або матриця FPGA) для ML-класифікатора та політичної мережі RL. Родина AMD/Xilinx RFSoC інтегрує ADC, FPGA та ARM-обробку на одному кристалі, роблячи її домінуючою платформою для компактних авіаційних та встановлених на транспорті систем. GPU (клас Jetson) додає гнучкості для ітерації політики під час розробки та підтримує більшу ємність моделей для складних сигнальних середовищ.

Як противники протидіють когнітивним системам РЕБ?

Противники протидіють когнітивній РЕБ через швидку частотну гнучкість (стрибки швидше, ніж когнітивна система здатна відстежувати), сигнали з розширеним спектром, розробку сигналів LPI/LPD та навмисне впровадження синтетичних сигналів-приманок для введення в оману класифікатора. Когнітивна система РЕБ реагує оновленням своєї політики RL на основі спостережуваної неефективності глушіння, розширенням швидкості сканування частот та розгортанням моделей виявлення аномалій, що позначають сигнали зі статистичними властивостями, несумісними з історичною бібліотекою випромінювань противника. RF-фінгерпринтинг може додатково відрізнити реальні апаратні передавачі від програмно-згенерованих приманок.