Сучасний збір SIGINT виробляє значно більше сигналів, ніж людські аналітики можуть переглянути. Широкосмуговий приймач, що охоплює 100 МГц спектра в щільному електромагнітному середовищі, може виявляти тисячі окремих подій сигналів на годину. Перш ніж з цих сигналів можна буде отримати будь-яку розвідувальну інформацію, їх необхідно класифікувати — відсортувати за категоріями, які визначають, як кожен сигнал оброблятиметься та пріоритизуватиметься. Ручна класифікація в такому масштабі неможлива. Автоматична класифікація сигналів, що все більше базується на машинному навчанні (МН), є тим, що робить великомасштабний збір SIGINT оперативно здійсненним.
Завдання класифікації: тип модуляції, форма сигналу та протокол
Автоматична класифікація модуляції (АКМ) є найбільш вивченою проблемою класифікації сигналів в літературі з телекомунікаційної інженерії. За заданим сегментом отриманих зразків IQ АКМ визначає схему модуляції: чи є сигнал амплітудно-модульованим (AM, DSB, USB), частотно-модульованим (FM, FSK) або фазово/амплітудно-модульованим (BPSK, QPSK, QAM-16, QAM-64 тощо). Ця класифікація є основоположною — сигнал BPSK і сигнал QAM-64 вимагають зовсім різних ланцюгів демодуляції, і помилкова класифікація означає, що сигнал не може бути декодований.
Окрім типу модуляції, ідентифікація форми сигналу намагається розпізнати конкретні стандарти зв'язку або типи радіостанцій за характеристиками сигналу. Класифікація релевантності розвідувальної інформації є завданням найвищого рівня: для класифікованого сигналу присвоюється пріоритетна оцінка, що визначає, як швидко він буде переглянутий і з якими ресурсами.
Інженерія ознак: спектрограми, зразки IQ та діаграми ока
Необроблені зразки IQ. Найбільш пряме представлення — сегмент необроблених зразків IQ — комплексних значень часових рядів безпосередньо від приймача. Згорткові нейронні мережі (ЗНМ) можуть навчатися класифікаційно-релевантним ознакам безпосередньо з необроблених даних IQ без ручної інженерії ознак.
Спектрограми. Спектрограма представляє сигнал як 2D зображення з часом на одній осі та частотою на іншій, де інтенсивність пікселів кодує потужність сигналу. Різні типи модуляції виробляють візуально відмінні шаблони спектрограм: сигнал FSK показує дискретні кроки частоти, сигнал з псевдовипадковою перестройкою частоти показує характерний розкиданий вигляд зайнятості набору частот перескоку.
Діаграми ока та сузір'я. Ці представлення вимагають демодуляції як кроку попередньої обробки. Вони найбільш корисні як ознаки другого рівня для класифікації всередині класу — розрізнення QAM-16 від QAM-64 після того, як клас QAM вже ідентифіковано.
Навчальні підходи: ЗНМ для класифікації модуляції
Навчальне машинне навчання для класифікації сигналів вимагає розміченого навчального набору даних — колекції прикладів сигналів, де відомий правильний мітка класу. Згорткові нейронні мережі стали домінуючою архітектурою для АКМ. Інтуїція пряма: ЗНМ, застосована до зображення спектрограми, навчається виявляти візуальні ознаки (спектральні шаблони, тимчасові структури), діагностичні для конкретних типів модуляції.
Навчальні дані для оборонних моделей АКМ є значною проблемою. Стандартний підхід використовує симуляцію сигналів: симуляція зв'язку генерує чисті сигнали з цільовими параметрами модуляції, а симуляція каналу додає реалістичні ефекти каналу (AWGN, завмирання Релея, зміщення несучої частоти, помилка годинника) при змінних значеннях ВСШ.
Ненавчальні підходи: кластеризація невідомих сигналів
Навчальна класифікація добре обробляє відомі типи сигналів. Але основна проблема SIGINT стосується сигналів, яких немає в навчальному наборі — нових форм сигналів противника, модифікованих протоколів зв'язку, саморобних систем. Ненавчальні підходи кластеризації вирішують цю проблему шляхом групування сигналів на основі подібності ознак без посилання на заздалегідь визначені мітки класів.
Оперативне спостереження: Найціннішим виходом ненавчальної кластеризації в оперативному контексті SIGINT часто є не самі присвоєння кластерів, а центроїди кластерів — репрезентативні вектори ознак, що характеризують кожну ідентифіковану групу. Ці центроїди слугують насінням для нового позначеного класу, коли аналітики підтверджують природу невідомого сигналу, дозволяючи швидко оновлювати навчальні моделі для обробки нового типу.
Напівнавчальні підходи поєднують обидві парадигми: модель навчається з навчальною втратою на позначених прикладах та ненавчальною втратою (кластеризація або реконструкція) на непозначених прикладах. Це добре підходить для домену SIGINT, де позначені дані є рідкісними та дорогими для отримання, але непозначені оперативні перехоплення є в достатку.
Практичне розгортання класифікації сигналів МН в оперативних системах SIGINT вимагає уваги до циклів оновлення моделей, апаратних обмежень на вузлі обробки та інтерфейсу людина-машина для взаємодії аналітика з виходами класифікатора. Інтеграція оцінок достовірності класифікації в конвеєр пріоритизації сповіщень є ключовим викликом проєктування інтеграції.