Moderni SIGINT-keruu tuottaa huomattavasti enemmän signaaleja kuin inhimilliset analyytikot pystyvät käymään läpi. Laajakaistainen vastaanotin, joka kattaa 100 MHz:n spektrin tiheässä sähkömagneettisessa ympäristössä, voi havaita tuhansia yksittäisiä signaalitapahtumia tunnissa. Ennen kuin näistä signaaleista voidaan poimia tiedustelutietoa, ne on luokiteltava — lajiteltava kategorioihin, jotka määrittävät, miten kutakin käsitellään ja priorisoidaan. Manuaalinen luokittelu tässä mittakaavassa on mahdotonta. Automaattinen signaalin luokittelu, jota yhä enenevässä määrin ohjaa koneoppiminen, on se, mikä tekee laajamittaisesta SIGINT-keruusta operatiivisesti hallittavaa.
Signaalin luokittelu SIGINT-kontekstissa kattaa useita erillisiä mutta toisiinsa liittyviä tehtäviä: signaalin modulaatiotyypin määrittäminen (AM, FM, PSK, QAM jne.), aaltomuodon tai viestintäprotokollan tunnistaminen (sotilaallinen taktinen radio, LTE, Bluetooth, tietty vastustajan radiotyyppi) sekä tiedustelumerkityksen luokittelu (sotilaallisesti kiinnostava, kaupallinen, tuntematon). ML-lähestymistavat ovat osoittautuneet tehokkaiksi kaikilla kolmella tasolla, vaikka tekniset vaatimukset ja sopivat algoritmit poikkeavat merkittävästi toisistaan.
Luokittelutehtävä: modulaatiotyyppi, aaltomuoto ja protokolla
Automaattinen modulaatioluokittelu (AMC) on viestintätekniikan kirjallisuudessa eniten tutkittu signaalin luokitteluongelma, ja sillä on pisin käytännön soveltamisen historia. AMC määrittää käytetyn modulaatiokaavan annetulle vastaanotetulle IQ-näytesegmentille: onko signaali amplitudimoduloitu (AM, DSB, USB), taajuusmoduloitu (FM, FSK) vai vaihe/amplitudimoduloitu (BPSK, QPSK, QAM-16, QAM-64 ja niin edelleen). Tämä luokittelu on perustavanlaatuinen — BPSK-signaali ja QAM-64-signaali vaativat täysin erilaiset demodulointiketjut, ja väärä luokittelu tarkoittaa, että signaalia ei voida purkaa.
Modulaatiotyypin lisäksi aaltomuodon tunnistus pyrkii tunnistamaan tietyt viestintästandardit tai radiotyypit niiden signaalin ominaisuuksista. TETRA-signaalilla on eri spektraaliset ja ajalliset ominaisuudet kuin sotilaallisella Link 16 -aaltomuodolla, vaikka molemmat ovat digitaalisia. Tietyllä vastustajan taktisella radiolla voi olla erottuva pulssien muotoilu, suojavälit tai synkronointijaksot, jotka erottavat sen muista saman modulaatioluokan signaaleista. Protokollatunnistus — sen määrittäminen, mitä viestintäprotokollaa käytetään — vaatii joko demoduloinnin ja bittivirtauksen tarkastelun tai protokollakohtaisten kuvioiden tunnistamisen fyysisen kerroksen signaalirakenteessa.
Tiedustelumerkityksen luokittelu on korkein taso: luokitellulle signaalille annetaan prioriteettipistemäärä, joka määrittää, kuinka nopeasti se tarkistetaan ja millä resursseilla. Tämä edellyttää teknisen luokittelutuloksen yhdistämistä kontekstuaaliseen tietoon — taajuusalueeseen, toiminta-alueeseen, vuorokaudenaikaan ja saman lähettimen havaintohistoriaan — jotta saadaan pistemäärä, joka kuvastaa todennäköisyyttä, että tämä signaali sisältää toimintakelpoista tiedustelutietoa.
Piirteiden suunnittelu: spektrogramit, IQ-näytteet ja silmädiagrammit
Koneoppimismallit vaativat numeerisia piirreesityksiä luokiteltavista signaaleista. Piirreesityksen valinnalla on huomattava vaikutus mallin suorituskykyyn ja sopivaan ML-arkkitehtuuriin.
Raakoja IQ-näytteitä. Suorin esitystapa on segmentti raakoja IQ-näytteitä — kompleksiarvoista aikasarjadataa suoraan vastaanottimelta. Konvoluutiohermoverkkoja voidaan kouluttaa oppimaan luokittelun kannalta merkityksellisiä piirteitä suoraan raakoista IQ-tiedoista ilman käsintehtyjä piirteitä. DeepSig RadioML -datasetti, josta on tullut tutkimusyhteisön vertailustandardi, osoittaa, että raakoilla IQ-tiedoilla koulutetut CNN:t päihittävät monet klassiset AMC-algoritmit, jotka perustuvat käsinlaadittuihin piirteisiin. Raakoja IQ-näytteitä kuitenkin herkistyvät kanavan vaikutuksille — kantotaajuuden siirtymä, kanavan kohina ja monitie — jotka on käsiteltävä mallissa tai esikäsittelyputkistossa.
Spektrogramit. Spektrogrami esittää signaalin 2D-kuvana, jossa toisella akselilla on aika ja toisella taajuus, ja pikselien intensiteetti koodaa signaalin tehon. Lyhytaikainen Fourier-muunnos (STFT) on tavanomainen menetelmä spektrogramien laskemiseen. Spektrogramit ovat intuitiivisia — kokenut analyytikko pystyy usein tunnistamaan signaalityypin visuaalisesti sen vesiputousnäytöstä — ja ne sopivat hyvin konvoluutiohermoverkkojen luokittelijoille, jotka on optimoitu 2D-kuvanluokitteluun. Eri modulaatiotyypit tuottavat visuaalisesti erottuvia spektrogramikuvioita: FSK-signaali näyttää erillisiä taajuusportaita, taajuushyppivä signaali näyttää tyypillisen hajanaisen hyppypaikan mukaisen ulkonäön ja QAM-signaali näyttää tiheältä täytetyltä kaistalalta.
Silmädiagrammit ja konstellaatiodiagrammit. Silmädiagrammi rakennetaan päällekkäin asettamalla demoduloidun signaalin peräkkäiset symbolijaksot. Puhtaan signaalin päällekkäin asetetut jäljet muodostavat "silmä"-kuvion, jonka leveys ja korkeus heijastavat signaalin laatua. Konstellaatiodiagrammit näyttävät demoduloidun signaalin kompleksiset symboliarvot pisteinä I/Q-tasossa — QPSK-signaali tuottaa neljä erillistä klusteria, QAM-16-signaali tuottaa 4×4-ruudukon, jossa on 16 klusteria. Nämä esitykset vaativat demodulointia esikäsittelyvaiheena, mikä luo riippuvuuden oikeasta alkuperäisestä modulaatioarviosta. Ne ovat hyödyllisimpiä toisen vaiheen piirteinä luokan sisäisessä luokittelussa — erottamaan QAM-16 QAM-64:stä sen jälkeen, kun QAM-luokka on tunnistettu.
Valvotut lähestymistavat: CNN modulaatioluokitteluun
Valvottu koneoppiminen signaalin luokitteluun vaatii merkityn koulutusdatasetin — kokoelman signaalinäytteitä, joissa oikea luokkatunnus on tiedossa. Malli oppii kuvaamaan signaaliesityksestä luokkatunnuksiin minimoimalla häviöfunktion koulutusdatan yli.
Konvoluutiohermoverkoista (CNN) on tullut hallitseva arkkitehtuuri AMC:lle. Intuitio on suora: spektrogramikuvaan sovellettu CNN oppii havaitsemaan visuaalisia piirteitä (spektraaliset kuviot, ajalliset rakenteet), jotka ovat diagnostisia tietyille modulaatiotyypeille, samaan tapaan kuin kuvanluokitteluun tarkoitettu CNN oppii havaitsemaan reunoja, tekstuureja ja muotoja. Raakoihin IQ-tietoihin sovellettuna 1D-CNN oppii ajallisia kuvioita kompleksiarvoisissa aikasarjoissa.
Tyypillinen AMC CNN -arkkitehtuuri koostuu useista 1D- tai 2D-konvoluutiokerroksista (riippuen syöttöesityksestä), max-pooling-kerroksista spatiaaliseen/ajalliseen alinäytteistämiseen, eräanormalisointikerroksista koulutuksen vakauden parantamiseksi sekä täysin yhdistettyjä kerroksia luokan todennäköisyysvektoriin kuvaamista varten. ResNet-inspiroidut arkkitehtuurit jäännösyhteyksillä ovat osoittaneet parempaa suorituskykyä yksinkertaisiin CNN-pinoihin verrattuna AMC-tehtävissä.
Koulutusdatan hankinta puolustuksen AMC-malleille on merkittävä haaste. Standardilähestymistapa käyttää signaalisimulaatiota: viestintäsimulaatio tuottaa puhtaita signaaleja kohdemodulaatioparametreilla, ja kanavasimulaatio lisää realistiset kanavavaikutukset (AWGN, Rayleigh-häipyminen, taajuussiirtymä, kellohäiriö) vaihtuvilla SNR-tasoilla. Simuloidulla datalla koulutettuja malleja arvioidaan sitten tosielämässä kaapatuilla signaaleilla, ja simulaation realistisuus on ensisijainen tekijä simulaatio-todellisuus-suorituskykykuilussa. Korkean tarkkuuden hardware-in-the-loop-simulaatio — jossa ohjelmistolla tuotetut signaalit lähetetään todellisen RF-laitteiston läpi ja vastaanotetaan kontrolloiduissa olosuhteissa — parantaa merkittävästi koulutusdatan laatua.
RadioML 2018 -datasetin suorituskykyvertailut, joka on laajimmin käytetty julkinen vertailustandardi, osoittavat, että hyvin viritetyt CNN-mallit saavuttavat yli 90 %:n luokittelutarkkuuden 24 modulaatioluokan yli SNR-arvoilla yli 10 dB. Suorituskyky heikkenee merkittävästi matalilla SNR-arvoilla (alle 0 dB), mikä on operatiivinen toiminta-alue monille SIGINT-skenaarioille, joissa on etäisiä tai pienpohjaisia lähetteitä. Tämä matalan SNR:n suorituskykykuilu laboratoriovertailun ja operatiivisen todellisuuden välillä on aktiivinen tutkimusalue.
Valvomattomat lähestymistavat: tuntemattomien signaalien klusterointi
Valvottu luokittelu käsittelee tunnettuja signaalityyppejä hyvin. SIGINT:n ydinhaaste liittyy kuitenkin signaaleihin, joita ei ole koulutusdatasetissä — uudet vastustajan aaltomuodot, muutetut viestintäprotokollat, improvisoituja järjestelmiä. Valvotut mallit, jotka kohtaavat tuntemattoman signaalityypin, luokittelevat sen virheellisesti lähimpään tunnettuun luokkaan, mahdollisesti suurella luottamuksella. Malli ei voi tietää, mitä se ei tiedä.
Valvomaton klusterointilähestymistapa ratkaisee tämän ongelman ryhmittelemällä signaaleja piirteen samankaltaisuuden perusteella ilman viittausta ennalta määriteltyihin luokkatunnuksiin. Klusterointialgoritmi, jota sovelletaan kokoelmaan siepattuja signaaleja, tunnistaa signaaliryhmiä, joilla on samankaltaiset ominaisuudet, vaikka nämä ominaisuudet eivät vastaa mitään tunnettua signaalityyppiä. Uudet klusterit, joita ei voida sovittaa tunnettuihin signaalityyppeihin, merkitään tuntemattomiksi analyytikon tarkistettavaksi.
Operatiivinen havainto: Arvokkain tulos valvomattomasta klusteroinnista operatiivisessa SIGINT-kontekstissa on usein ei klusterin osoitukset itse, vaan klusterin keskipisteet — kunkin tunnistetun ryhmän kuvaavat piirrevektorit. Nämä keskipisteet toimivat uuden merkityn luokan siemenenä, kun analyytikot vahvistavat tuntemattoman signaalin luonteen, jolloin valvottuja malleja voidaan päivittää nopeasti uuden tyypin käsittelemiseksi.
Yleisiä SIGINT:iin sovellettuja klusterointialgoritmeja ovat k-means (laskennallisesti tehokas, vaatii k:n määrittämisen etukäteen), DBSCAN (tiheyspohjainen, käsittelee epäsäännöllisiä klusterimuotoja ja tunnistaa automaattisesti kohina pisteet) ja Gaussian Mixture Models (probabilistinen, antaa luottamusmäärät per osoitus). Korkeadimensioisissa piirretiloissa dimensionaalisuuden vähentämistä — käyttäen t-SNE:tä tai UMAP:ia piirteiden projisointiin 2D:hen visualisointia varten tai autokoodereita tiivistelmäesitysten oppimiseksi — sovelletaan tyypillisesti ennen klusterointia.
Puolivalvotut lähestymistavat yhdistävät molemmat paradigmat: mallia koulutetaan valvotulla häviöllä merkityissä esimerkeissä ja valvomattomalla häviöllä (klusterointi tai rekonstruktio) merkitsemättömissä esimerkeissä. Tämä sopii hyvin SIGINT-toimialaan, jossa merkitty data on niukkaa ja kallista tuottaa, mutta merkitsemättömiä operatiivisia sieppauksia on runsaasti. Merkitsemätön data auttaa mallia oppimaan paremman piirreesityksen, vaikka merkintöjä ei olisi saatavilla.
ML-signaalin luokittelun käytännön käyttöönotto operatiivisissa SIGINT-järjestelmissä edellyttää huomiota mallin päivityssykleihin, käsittelynoden laitteistorajoituksiin (jonka on ehkä ajettava päättelyä robustilla sulautetulla alustalla rajoitetuilla GPU-resursseilla) sekä ihmis-konekäyttöliittymään analyytikon vuorovaikutuksessa luokittelijan tuotosten kanssa. Luokittelijaa, joka tuottaa oikeita tuloksia mutta esittää ne tavalla, joka häiritsee analyytikon työnkulkua, ei käytetä. Luokittelun luottamuspisteytyksen integroiminen hälytysprioriteettijärjestykseen — korkean luottamuksen luokittelut automaattiseen käsittelyyn, matalan luottamuksen tai tuntemattoman luokan signaalit analyytikon tarkistettavaksi — on keskeinen integraatiosuunnittelun haaste.