Tekoälyn etiikka sotilassysteemeissä

Kun NATO:n puolustusministerit hyväksyivät muodollisesti tekoälyn vastuullisen käytön periaatteet puolustuksessa vuoden 2021 Bryssel-huippukokouksessa, he eivät julkaisseet poliittista toivomusta – he asettivat lähtötason, jonka hankintaviranomaiset, ohjelmistotoimittajat ja ohjelmajohtajat eri puolilla liittoumaa ovat nyt odotettuja operationalisoimaan. Haaste ei ole ymmärtää, mitä vastuullinen tekoäly tarkoittaa abstraktisti; se on kääntää kuusi korkean tason periaatetta konkreettisiksi suunnitteluvaatimuksiksi, tarkastusmekanismeiksi ja hankintakriteereiksi, jotka kestävät oikeudellisen tutkinnan ja operatiivisen stressin.

Tässä artikkelissa kartoitetaan NATO:n kehys suunnittelupäätöksiin, jotka tekevät vaatimustenmukaisuudesta todellista eikä nimellisistä. Se kattaa ihmisen hallinnan spektrin täysin manuaalisesta autonomiseen toimintaan, tekniset valvontatoimet, joita kukin periaate edellyttää, eettisten vaatimusten kirjoittamisen hankintadokumentaatioon sekä dokumentaatioartefaktit, jotka osoittavat aidon vaatimustenmukaisuuden. Organisaatioiden, jotka arvioivat tekoälyä puolustuskäyttöön – joko ostajina tai kehittäjinä – tulisi kohdella tätä ei filosofisena keskusteluna vaan vaatimusmäärittelynä.

NATO:n kuusi tekoälyperiaatetta ja mitä ne käytännössä edellyttävät

NATO:n vastuullisen tekoälyn käytön periaatteet puolustuksessa luettelevat kuusi ominaisuutta, jotka jäsenmaat sitoutuivat noudattamaan kehittäessään ja ottaessaan käyttöön tekoälyä puolustuskonteksteissa. Jokainen periaate kuulostaa suoraviivaiselta. Jokainen edellyttää erityisiä suunnitteluvalvontatoimia, jotka käytännössä usein puuttuvat.

Laillinen. Tekoälyjärjestelmien on noudatettava sovellettavaa kansallista ja kansainvälistä lainsäädäntöä, mukaan lukien kansainvälinen humanitaarinen oikeus. Suunnittelullisesti tämä tarkoittaa, että järjestelmän aiottu käyttö on tarkistettu IHL-asiantuntemuksen omaavan oikeudellisen neuvonantajan toimesta, että käyttötapaus on kyseisen tarkistuksen soveltamisalan sisällä ja että järjestelmän ominaisuuksien päivitys käynnistää uusitun oikeudellisen tarkistuksen. Laillisuus ei ole valintaruutu hankinnassa – se on jatkuva velvollisuus koko järjestelmän elinkaaren ajan.

Vastuullinen. Ihmisen vastuullisuus on säilytettävä kaikissa tilanteissa. Tämä periaate käsittelee vastuullisuuskuilua, joka syntyy, kun tekoäly toimii monimutkaisissa sosioteknologisissa järjestelmissä: kun vahingollinen tulos tapahtuu, on oltava tunnistettavia ihmisiä, jotka kantavat vastuun. Vastuullinen tekoäly edellyttää, että päätösketju on dokumentoitu ennen käyttöönottoa, että roolit ja valtuudet on määritelty jokaista päätöskohtaa varten ja että järjestelmää ei oteta käyttöön tavoin, jotka rakenteellisesti estävät vastuullisuuden – esimerkiksi toimimalla sellaisella nopeudella tai mittakaavalla, että merkityksellinen ihmisten tarkistaminen on mahdotonta.

Jäljitettävä. Tekoälyjärjestelmät, niiden data ja kehitysprosessit on dokumentoitava tarkastettavuuden mahdollistamiseksi. Jäljitettävyys on suunnitteluartefakti, ei politiikkalausunto. Se edellyttää, että järjestelmä kirjaa jokaisen luomansa päätelmän tai suosituksen, että nämä lokit ovat muuttumattomia ja säilytettyjä, että koulutusdata ja malliversiot on dokumentoitu ja että jälkikäteinen tapahtumatutkinta voi rekonstruoida, mitä järjestelmä teki, miksi ja kuka toimi sen mukaan.

Luotettava. Tekoälyjärjestelmät on testattava ja validoitava koko aiotussa käyttöalueessa, mukaan lukien adversariaalisissa olosuhteissa. Luotettavuusdokumentaation on täsmennettävä olosuhteet, joissa järjestelmän suorituskykyväittämät pitävät paikkansa, tunnistetut vikamoodit ja mitä järjestelmä tekee, kun se kohtaa koulutusjakauman ulkopuolisia syötteitä. Turvallisuuskriittisten komponenttien muodollinen verifiointi – todiste siitä, että tietyt ominaisuudet pitävät kaikilla syötteillä määritellyn avaruuden sisällä – on luotettavuuden kultainen standardi korkean panoksen sovelluksissa.

Hallittava. Tekoälyjärjestelmät on suunniteltava siten, että ihmisoperaattorit voivat säätää, korjata, uudelleenkouluttaa tai sulkea käyttöön otettuja järjestelmiä. Hallittavuus edellyttää testattua sammutusmenettelyn, ohitusmekanismin, joka ei ole riippuvainen toimittajan infrastruktuurista, ja turvallisen toimintatilan (oletusarvo ihmisen hallintaan, ei jatkuvaan autonomiseen toimintaan), kun yhteys tai ohjelmiston eheys menetetään. Järjestelmä, jonka sammutus edellyttää toimittajapalvelupuhelua, ei ole hallittava NATO:n mielessä.

Vinoutumisvähennelty. Ponnisteluja on tehtävä tekoälyn tuloksissa olevien tahattomien vinoutumien välttämiseksi, erityisesti vinoutumien, jotka voisivat johtaa syrjiviin lopputuloksiin. Vinoutumien lieventäminen ei ole tietoaineiston monimuotoisuuslausunto – se on testausmenetelmä. Se edellyttää suorituskykyerojen mittaamista asiaankuuluvissa alaryhmissä, testaamista adversariaalisilla syötteillä, jotka on suunniteltu tutkimaan päätösrajoja, ja suorituskyvyn arviointia operatiivisista ympäristöistä peräisin olevalla datalla, joka poikkeaa koulutusjakaumasta. Hyväksyttävän vinoutuman kynnysarvo on määriteltävä ennen käyttöönottoa, ei löydettävä tapahtuman jälkeen.

Keskeinen oivallus: Kaikki kuusi periaatetta ovat verifiointavissa suunnittelun tasolla. Toimittajat, jotka voivat ilmaista eettiset sitoumuksensa markkinointikielellä mutta eivät pysty osoittamaan vastaavia teknisiä valvontatoimia, ovat toteuttaneet etiikkahuuhauksen, ei eettistä vaatimustenmukaisuutta. Hankintatiimien tulisi kysyä: missä koodikannassa tämä periaate on valvottu? Mitä tarkastusloki kirjaa? Miten tämä testattiin? Vastaukset paljastavat, onko etiikka rakenteellista vai kosmeettista.

Ihmisen hallinnan spektri

Merkittävin suunnittelupäätös missä tahansa sotilastekoälyjärjestelmässä on sen sijainti autonomiaspektrillä. Tämä ei ole binaarinen valinta "ihmisen hallitseman" ja "autonomisen" välillä – se on jatkumo, jolla on erilliset suunnittelu-, oikeudelliset ja eettiset implikaatiot jokaisessa pisteessä.

Täysin manuaalinen. Järjestelmä ei suorita autonomista käsittelyä; jokainen toiminta on suoraan ihmisoperaattorin komentama. Täysin manuaalinen hallinta on lähtötaso mutta usein epäkäytännöllinen nykyaikaisten tietotoimien tai tiedustelun analysoinnin vauhdissa ja volyymissa. Täysin manuaalinen on asianmukainen valinta vain silloin, kun ihmisen päätöksenteon nopeus on yhteensopiva operatiivisen tempon kanssa tai kun autonomisen toiminnan oikeudelliset ja eettiset panokset ovat liian korkeat minkään automaatioasteen hyväksymiseksi.

Human-in-the-loop (HITL). Järjestelmä tuottaa suosituksia tai ehdotettuja toimintoja, jotka ihmisen on nimenomaisesti valtuutettava ennen toteutusta. Human-in-the-loop on asianmukainen malli korkean seurauksen päätöksille, joissa selitettävyys ja valtuutus on dokumentoitava. Se edellyttää, että järjestelmä esittää suosituksensa riittävällä selityksellä ihmisen tietoisen päätöksen tekemiseksi – ei pelkästään luottamuspisteytyksellä, vaan tekijöillä, jotka ohjasivat tulosta ja olosuhteilla, joissa tulos tiedetään epäluotettavaksi.

Human-on-the-loop (HOTL). Järjestelmä toteuttaa toimintoja autonomisesti, mutta ihmisvalvojalla on valtuudet ja kyky puuttua tai lopettaa milloin tahansa. HOTL on sopiva suuren volyymin, matalamman panoksen tehtäville, joissa yksittäiset valtuutukset ovat epäkäytännöllisiä, mutta joissa mallien ja tulosten ihmisvalvonta säilyy. Se edellyttää, että seurantakäyttöliittymä tuo anomaliat tehokkaasti esiin, että ihmisvalvoja on koulutettu tunnistamaan väliintuloa vaativat tilanteet ja että väliintulomekanismi on riittävän nopea ollakseen merkityksellinen.

Neuvoa-antava. HITL:n erityisvariantti, jossa järjestelmä tarjoaa analyysiä tai päätöksentukea ilman suoraa toimintapolkua – ihmisen on toteutettava erillinen toiminto minkä tahansa suosituksen toteuttamiseksi. Neuvoa-antava on autonomiaspektrin matalin riskiasema, mutta siihen liittyy erityinen eettinen vaara: jos neuvoa-antavia tuloksia hyväksytään rutiininomaisesti ilman kriittistä tarkastelua, järjestelmä on käytännöllisesti katsoen autonominen tarjoten samalla ihmisten valvonnan vaikutelman. Neuvoa-antavat järjestelmät edellyttävät käyttömonitorointia kumileimasin käyttäytymisen havaitsemiseksi.

Autonominen. Järjestelmä toteuttaa toimintoja ilman ihmisen valtuutusta päätössilmukassa. Aito autonomia puolustuskonteksteissa on tiukimpien vaatimusten alainen kaikkien tärkeimpien eettisten kehysten mukaan ja kohtaa merkittäviä oikeudellisia rajoituksia kansainvälisen humanitaarisen oikeuden nojalla. Autonomiset järjestelmät edellyttävät turvallisuusominaisuuksien muodollista verifiointia, kovaluonteisia pysäytysmekanismeja ja dokumentoituja vikamoodeja testatuilla lieventämistoimenpiteillä kullekin.

Keskeinen oivallus: Järjestelmän nimellinen autonomialuokitus ja sen tosiasiallinen autonomia käyttöönotossa voivat poiketa merkittävästi. 'Neuvoa-antava' järjestelmä, joka tuottaa tuhansia suosituksia tunnissa työnkululla, joka reitittää ne yksittäiselle analyytikollä, jolla on kaksi sekuntia per kohde, on käytännöllisesti katsoen autonominen nimikkeestä riippumatta. Etiikkatarkastelu on arvioitava tosiasiallinen autonomia – todellinen päätöksenteon taakka, joka asetetaan ihmisille operatiivisessa työnkulussa – ei nimellinen luokitus.

Suunnitteluvaatimukset kullekin periaatteelle

NATO:n periaatteiden kääntäminen suunnittelumäärittelyiksi tuottaa konkreettisen joukon toteutusvaatimuksia. Nämä eivät ole teoreettisia – ne ovat valvontatoimia, joiden kooditarkastuksen, tietoturvatarkastuksen tai kolmannen osapuolen etiikka-arvioinnin tulisi varmistaa olevan olemassa.

Jäljitettävyys: päätöslokit. Jokainen päätelmä, suositus tai automatisoitu toiminto on kirjattava: aikaleima, syötetietojen tiiviste, malliversio ja konfiguraatio, tulos sekä luottamus- tai epävarmuusarvio. Lokien on oltava kertakirjoituksisia ja peukaloinninkestäviä. Ne on säilytettävä ajan jakson ajan, joka vastaa käyttöönottavan organisaation vastuullisuusvelvoitteita – tyypillisesti vuosia puolustusjärjestelmien osalta. Lokimuodon on oltava koneluettava automatisoitua tarkastusanalyysiä varten. Kirjaaminen ei saa olla ehdollista lopputuloksen vakavuudesta: rutiinikorrektit päätökset on kirjattava samalla tarkkuudella kuin poikkeavat tai haitalliset, koska tarkastustietueen arvo tulee täydellisyydestä.

Luotettavuus: muodollinen verifiointi ja mallikortit. Turvallisuuskriittiset komponentit – ne, joiden vika voisi aiheuttaa fyysistä haittaa, laittomia lopputuloksia tai komentovallan menetystä – on muodollisesti verifioitava, kun tilaavaruus sen sallii. Siellä missä täysi muodollinen verifiointi ei ole toteutettavissa, ominaisuuspohjainen testaus ja adversariaalinen red-team-harjoitukset tarjoavat seuraavan tason varmuuden. Kaikilla tekoälykomponenteilla on oltava mallikortit: jäsennellyt asiakirjat, jotka täsmentävät koulutustietolähteet, suorituskykymetriikat pidettyjen testijoukkojen osalta (mukaan lukien adversariaaliset testijoukot), tunnetut vikamoodit ja olosuhteet, joissa suorituskykyväittämät eivät pidä. Mallikortit on päivitettävä jokaisen versiojulkaisun yhteydessä ja asetettava hankintaviranomaisten saataville.

Hallittavuus: etäsammutus- ja ohitusarkkitehtuuri. Sammutusmenettely on dokumentoitava järjestelmäarkkitehtuurimäärittelyssä, ei ainoastaan käyttöohjeessa. Toteutus on testattava realistisissa operatiivisissa olosuhteissa – mukaan lukien simuloitu yhteyskatko, ohjelmistovian injektio ja operaattorin stressiskenaariot. Järjestelmällä on oltava hyvin määritelty turvallinen tila, johon se siirtyy sammutussignaalin vastaanottamisen yhteydessä: suositusjärjestelmälle tämä tarkoittaa manuaaliseen työnkulkuun palauttamista ilman automatisoitua tulostetta; valvontajärjestelmälle tämä tarkoittaa toimintatulostusten lopettamista säilyttäen samalla datan keräyksen ihmisten tarkastelua varten. Turvallinen tila ei saa olla riippuvainen mistään ulkoisesta palvelusta, jota käyttöönottava organisaatio ei hallitse.

Vinoutuma: adversariaalinen testausmenetelmä. Vinoutumien lieventäminen edellyttää kolmea erillistä testausvaihetta. Ensinnäkin koulutustietojen tarkastus: mittaa demografisesti ja operatiivisesti merkityksellisten attribuuttien jakautuminen koulutustiedoissa ja dokumentoi tunnetut puutteet. Toiseksi eroavuustestaus: mittaa järjestelmän suorituskyky alaryhmien välillä ja määritä hyväksyttävät eroavuuskynnykset ennen testin suorittamista – ei tulosten näkemisen jälkeen. Kolmanneksi adversariaalinen testaus: rakenna syötteitä erityisesti päätösrajan tutkimiseen, mukaan lukien syötteet, jotka edustavat reunatapauksia operatiivisissa ympäristöissä, joita koulutusdata ei edusta hyvin. Kaikki kolme vaihetta on dokumentoitava kvantifioiduilla tuloksilla, ei kvalitatiivisilla yhteenvedoilla. Kohdentamis- tai resurssijakopäätöksiin vaikuttaville järjestelmille riippumattoman kolmannen osapuolen vinoutumistarkastus ennen käyttöönottoa on asianmukainen standardi.

Etiikan kääntäminen hankintavaatimuksiksi

NATO:n periaatteet muuttuvat toiminnallisiksi hankinnoissa, kun ne ilmaistaan erityisinä, verifioitavissa olevina vaatimuksina työmääräimessä ja arviointikriteereissä. Epämääräiset vaatimukset ("järjestelmän on noudatettava NATO:n tekoälyperiaatteita") eivät ole arvioitavissa eivätkä luo velvoitteita tai vastuullisuutta. Erityiset vaatimukset luovat molemmat.

Jäljitettävyyden hankintavaatimus voisi kuulua: "Järjestelmän on luotava muuttumaton tarkastusloki jokaiselle tekoälypäätelmälle, tallentaen syötetietojen tiivisteen, malliversiontunnisteen, tuloksen, luottamuspisteytyksen ja aikaleiman millisekunnin tarkkuudella. Lokit on vietävissä [määritetyssä muodossa] ja säilytettävä vähintään [määritetyn ajanjakson] ajan. Toimittajien on osoitettava lokien eheysmekanismit käyttäen testiaineistoa hyväksymistestauksen aikana." Tämä muotoilu on arvioitavissa: joko järjestelmä tekee tämän tai ei.

Hallittavuuden osalta: "Järjestelmän on toteutettava sammutuskomento, jonka valtuutettu operaattori voi suorittaa ilman toimittajan järjestelmäyhteyttä. Vasteajan sammutuskomennosta turvalliseen tilaan siirtymiseen ei saa ylittää [määritettyä aikaväliä]. Turvallinen tilarakenne on dokumentoitava ja sammutusmenettely on testattava osana hyväksymistestausta simuloitujen yhteyskatko-olosuhteiden alla."

Vinoutumien osalta: "Toimittajien on toimitettava vinoutumien testausraportti, joka kattaa suorituskyvyn standardilla arviointijoukolla, suorituskyvyn hankintaorganisaation toimittamilla adversariaalisilla testisyötteillä ja eroavuusmetriikat [määriteltyjen demografisten ja operatiivisten alaryhmien] osalta. Eroavuuskynnykset on dokumentoitava tekoälyn vaikutusarviointiin. Dokumentoitujen kynnysarvojen ylittävät eroavuudet käsitellään vikoina, jotka vaativat korjaamista ennen hyväksyntää."

Malli on johdonmukainen: jokainen eettinen periaate voidaan ilmaista joukkona havaittavia, testattavissa olevia järjestelmäkäyttäytymisiä ja dokumentaatioartefakteja. Hankintatiimin tehtävä on määritellä, miltä vaatimustenmukaisuuden havaittava todiste näyttää, ennen tarjouspyynnön julkaisua.

Dokumentaatiovaatimukset: AIIA, mallikortit ja selitettävyysraportit

Kolme dokumentaatioartefaktia ovat minimimäärä tekoälyjärjestelmälle, joka on otettu käyttöön puolustuskontekstissa ja väittää noudattavansa NATO:n periaatteita.

Tekoälyn vaikutusarviointi (AIIA). AIIA on ensisijainen vastuullisuusasiakirja. Se kuvaa järjestelmän aiotun käytön, päätökset, joihin se vaikuttaa tai joita se tekee, vaikutuksen kohteena olevat populaatiot ja intressit, tunnistetut haittaskenaariot ja niiden todennäköisyyden, toteutetut lieventämistoimenpiteet ja niiden tehokkuuden, jäännösriskin ja sen hyväksymiseen vaadittavan auktoriteettitason sekä valvontamekanismin käyttöön otetulle järjestelmälle. AIIA on laadittava ennen ensimmäistä käyttöönottoa ja päivitettävä jokaisen merkittävän versiojulkaisun tai merkittävän operatiivisen muutoksen yhteydessä. Sen on hyväksyttävä viranomainen, jolla on organisatorinen vastuullisuus järjestelmän toiminnasta – ei pelkästään suunnittelutiimi.

Mallikortti. Mallikortti on tekoälykomponentin tekninen vastuullisuusasiakirja erityisesti. Se dokumentoi malliarkkitehtuurin, koulutustiedot ja tunnetut puutteet, koulutusmenettelyn ja hyperparametrit, suorituskykymetriikat standardi- ja adversariaalisilla testijoukkoilla, tunnetut vikamoodit sekä operatiiviset olosuhteet, joissa suorituskykyväittämät pitävät. Mallikortit ovat vakioartefakti vastuullisessa tekoälykäytännössä ja EU:n tekoälylaki edellyttää niitä korkean riskin tekoälyjärjestelmille. Puolustustekoälyjärjestelmien tulisi kohdella mallikorttia pakollisena toimitettavana, joka päivitetään jokaisen malliversioinnin yhteydessä.

Selitettävyysraportti. HITL- tai neuvoa-antaviksi luokitelluille järjestelmille selitettävyysraportti dokumentoi, miten järjestelmä kommunikoi päättelynsä ihmisoperaattoreille, minkä selitystason se tarjoaa kullekin tulostustyypille ja mitä testausta tehtiin selitysten tarkkuuden varmistamiseksi (ts. että ne heijastavat todellisia mallin tulosteen ohjaavia tekijöitä, eivät jälkikäteisiä rationalisointeja). Selityksen tarkkuus – se, missä määrin selitys tarkasti edustaa mallin päätösprosessia – on tekninen ominaisuus, joka on mitattava ja dokumentoitava, ei oletettava.

Keskeinen oivallus: Dokumentaatiovaatimukset eivät ole hallinnollinen taakka – ne ovat vastuullisuuden substraatti. Järjestelmää, jolle ei ole laadittu AIIA:ta, ei voida tarkastaa, se ei pysty osoittamaan noudattavansa vastuullisuusperiaatetta ja se asettaa käyttöönottavan organisaation puolustuskyvyttömään asemaan tapauksen sattuessa. Kohtele kolmea dokumentaatioartefaktia pakollisina suunnittelutoimitettavina, joilla on sama asema kuin järjestelmäarkkitehtuurimäärittelyllä.

Yleiset sudenkuopat: etiikkahuuhaus ja vastuullisuuskuilut

Etiikkahuuhaus on yleisin vikamoodi puolustustekoälyn hankinnoissa. Se tapahtuu, kun toimittajat ilmaisevat eettiset sitoumukset markkinoinnissa ja tarjousasiakirjoissa toteuttamatta vastaavia valvontatoimia varsinaisessa järjestelmässä. Yleisiä tunnusmerkkejä ovat: johtotiivistelmissä luetellut eettiset periaatteet ilman jäljitettävyyttä arkkitehtuuripäätöksiin; "ihmisen valvonta", joka on kuvattu politiikkatekstissä mutta jota ohjelmiston valtuutusportit eivät valvo; selitettävyysväittämät, jotka kuvaavat visualisointipaneelia ilman todisteita siitä, että visualisoinnit tarkasti heijastavat mallin päätösprosessia; sekä vinoutumien lieventämisväittämät, jotka mainitsevat tietoaineiston koon ilman eroavuusmetriikoita. Hankintatiimin puolustus on vaatia valvontatoimien osoittamista arkkitehtuuritasolla – ei hyväksyä politiikkadokumentaatiota nimellisarvoon.

Vastuullisuuskuilut ovat päätösketjun rakenteellisia vikoja, jotka tekevät mahdottomaksi kohdistaa vastuun vahingolliseen lopputulokseen. Ne luodaan tyypillisesti neljällä mekanismilla: autonomian hiipimisenä (neuvoa-antavaksi kuvattu järjestelmä käytetään tavoin, jotka tekevät ihmisen tarkistamisesta nimellisestä), rooliepäselvyytenä (useilla osapuolilla on päällekkäiset valtuudet ilman selkeää ensisijaista vastuullista osapuolta), versioajautumisena (käyttöön otettu järjestelmä poikkeaa dokumentoidusta järjestelmästä ilman uusittua vastuullisuuden tarkastelua) ja toimittajariippuvuutena (käyttöönottavalta organisaatiolta puuttuu tekninen kyky tarkastaa tai muokata järjestelmää ilman toimittajan osallistumista). Vastuullisuuskuilut on tunnistettava ja suljettava ennen käyttöönottoa, koska niitä ei voida korjata jälkikäteen tapauksen jälkeen.

Narrative Shield NATO-yhteensopivana tekoälynä

Narrative Shield on suunniteltu alusta alkaen täyttämään NATO:n periaatteet tietotoimialueen kontekstissa, johon se on rakennettu. Jäljitettävyys on toteutettu muuttumattomilla päätöslokeilla, jotka tallentavat jokaisen analyytikon toimenpiteen, jokaisen tekoälysuosituksen ja jokaisen valtuutustapahtuman täydellä kontekstilla. Hallittavuus on valvottu arkkitehtuurilla, joka ei vaadi ulkoista toimittajayhteyttä sammutusta tai konfigurointia varten, testatun turvallisen tilan menettelyn kanssa. Ihmisen hallinta on rakenteellista, ei nimellisestä: minkään suosituksen mukaan ei toimita ilman analyytikon nimenomaista valtuutusta määritellyllä roolisolla. Vinoutumien lieventäminen kattaa sekä koulutustietojen dokumentoinnin että jatkuvan adversariaalisen testauksen tietotoimialueen hyökkäysmalleja vastaan. AIIA ja mallikortti ylläpidetään elävinä asiakirjoina, joita päivitetään jokaisen julkaisun yhteydessä.

Organisaatioille, jotka arvioivat narratiivitiedustelun alustoja StratCom- tai informaatiovaikuttamisen tukeen, NATO:n periaatekehys tarjoaa suoran arviointirubriikin. Edellytä, että toimittajat kartoittavat jokainen periaate erityisiin arkkitehtuuripäätöksiin ja testattaviin valvontatoimiin. Informaatiovaikuttamisen tarkastusketju -artikkeli kertoo yksityiskohtaisesti, kuinka lokiarkkitehtuuri tukee jäljitettävyys- ja vastuullisuusvaatimuksia, joita eettinen vaatimustenmukaisuus edellyttää.

Usein kysytyt kysymykset

Onko olemassa NATO:n tekoälysertifiointia puolustusohjelmistoille?

Yhtä NATO:n tekoälysertifiointia, joka vastaisi tuoteturvallisuusmerkintää, ei ole olemassa. NATO:n vastuullisen tekoälyn käytön periaatteet puolustuksessa, jotka hyväksyttiin vuoden 2021 Bryssel-huippukokouksessa, luovat normatiivisen kehyksen mutta eivät ole sertifiointijärjestelmä. Yksittäiset hankintaprosessit NATO:n jäsenmaissa voivat viitata näihin periaatteisiin vaatimuksina – Yhdistyneen kuningaskunnan puolustusministeriön tekoälyn eettiset periaatteet, Yhdysvaltain puolustusministeriön tekoälyn eettiset periaatteet ja EU:n tekoälylaki (joka luokittelee tietyt puolustukseen liittyvät sovellukset korkean riskin sovelluksiksi) asettavat kukin velvoitteita, jotka toimivat de facto vaatimustenmukaisuusvaatimuksina. Toimittajien, jotka haluavat toimittaa tekoälyjärjestelmiä NATO:n liittolaisille, tulisi pitää kaikkien kolmen kehyksen noudattamista lähtötasona, ei valinnaisena erottautumistekijänä.

Mitkä ovat oikeudelliset seuraukset, jos tekoälyjärjestelmä aiheuttaa vahingollisen tapahtuman sotilaskontekstissa?

Oikeudellinen vastuullisuus tekoälyn aiheuttamista tapahtumista sotilaskonteksteissa riippuu lainkäyttöalueesta, järjestelmän luonteesta ja ihmisen valvonnan asteesta päätösketjussa. Kansainvälisen humanitaarisen oikeuden nojalla erottelun periaate – joka edellyttää, että hyökkäykset erottavat taistelijat ja siviilihenkilöt – soveltuu riippumatta siitä, onko päättävä tekijä ihminen vai automatisoitu. Komentaja, joka ottaa käyttöön tekoälyjärjestelmän, joka aiheuttaa laitonta haittaa, voi kantaa komentovastuun, jos hän on laiminlyönyt asianmukaisen valvonnan. Kansallisen lainsäädännön nojalla hankintaviranomaiset, kehittäjät ja operaattorit voivat joutua vastuuseen lainkäyttöalueella sovellettavan huolimattomuusstandardin mukaan. Kriittinen suunnittelullinen implikaatio on, että järjestelmien on kirjattava riittävästi päätösketjutietoja jälkikäteisen vastuullisuustarkastelun tueksi – ei oikeudellisena muodollisuutena, vaan siksi, että tarkastuslokien puuttuminen voi itsessään muodostaa todisteen huolimattomuudesta.

Miten tekoälyn eettiset vaatimukset eroavat neuvoa-antavien ja autonomisten järjestelmien välillä?

Neuvoa-antavat järjestelmät – ne, jotka esittävät suosituksia ihmispäätöksentekijöille, joilla säilyy lopullinen päätösvalta – kohtaavat löyhemmät eettiset vaatimukset kuin autonomiset järjestelmät, koska ihminen pysyy vastuussa lopputuloksesta. Neuvoa-antavat järjestelmät edellyttävät kuitenkin edelleen selitettävyyttä (ihmisen on ymmärrettävä, miksi suositus tehtiin), vinoutumien lieventämistä (vääristynyt suositus, jota ihminen noudattaa johdonmukaisesti, tuottaa saman lopputuloksen kuin autonominen vääristynyt päätös) ja luotettavuusdokumentaatiota (ihmisen on tiedettävä, missä olosuhteissa neuvoa-antava tulos on epäluotettava). Autonomiset järjestelmät edellyttävät lisäksi kovaluonteisia pysäytysmekanismeja, turvallisuusominaisuuksien muodollista verifiointia ja dokumentoituja vikamoodeja testatuilla lieventämistoimenpiteillä. Kirjo ei ole binaarinen: järjestelmä, jota kuvataan "neuvoa-antavaksi" mutta joka tuottaa tuloksia sellaisella nopeudella tai volyymilla, että ihmisten tarkistaminen on muodollisuus, on eettisestä näkökulmasta käytännöllisesti katsoen autonominen.

Mikä on tekoälyn vaikutusarviointi ja milloin se vaaditaan?

Tekoälyn vaikutusarviointi (AIIA) on jäsennelty ennen käyttöönottoa tehtävä katsaus, joka dokumentoi, mitä järjestelmä tekee, mihin päätöksiin se vaikuttaa, ketkä ovat vaikutuksen kohteena, mitkä ovat vikamoodit ja mitä valvonta- ja lieventämistoimenpiteitä on käytössä. Se on tekoälyn vastine tietosuojavaikutusarvioinnille tai tietoturvariskiarvioinnille. Muodolliset vaatimukset vaihtelevat: EU:n tekoälylaki edellyttää vaatimustenmukaisuusarviointeja korkean riskin tekoälyjärjestelmille; Yhdistyneen kuningaskunnan puolustusministeriön ohjeet velvoittavat AIIA:n kaikkia tekoälyn käyttöönottoja varten; NATO:n vastuullisen käytön periaatteet viittaavat AIIA:ta vastaavaan dokumentaatioon osana vastuullisuusperiaatetta. Paras käytäntö puolustushankinnoissa on edellyttää toimittajilta AIIA:ta osana tarjousasiakirjoja ja päivittää se jokaisen merkittävän versiojulkaisun yhteydessä. Järjestelmää, jolta puuttuu AIIA, ei voida tarkastaa, siihen ei voida soveltaa asianmukaista valvontaa eikä se voi osoittaa noudattavansa mitään NATO:n periaatteista.

Mitä on etiikkahuuhaus ja kuinka hankintatiimit voivat tunnistaa sen?

Etiikkahuuhaus on käytäntö, jossa tekoälyn eettisiä sitoumuksia ilmaistaan markkinoinnissa ja dokumentaatiossa ilman, että niitä toteutetaan varsinaisessa järjestelmäarkkitehtuurissa. Yleisiä tunnusmerkkejä ovat: eettiset periaatteet, jotka on lueteltu myyntimateriaaleissa ilman vastaavia teknisiä valvontatoimia; "ihmisen valvonta", joka on kuvattu politiikkadokumenteissa mutta jota ohjelmisto ei valvo (ei valtuutusportteja, ei tarkastuslokeja, ei operaattorin vahvistusvaatimuksia); selitettävyysväittämät, jotka viittaavat jälkikäteiseen rationalisointiin eivätkä aitoon päätöstransparenssiin; sekä vinoutumien lieventämisväittämät, jotka viittaavat tietoaineiston monimuotoisuuteen ilman todisteita adversariaalisesta testauksesta. Hankintatiimien tulisi edellyttää, että toimittajat osoittavat eettisen vaatimustenmukaisuuden järjestelmäarkkitehtuurin tasolla – ei pelkästään politiikkadokumentaation perusteella. Erityisiä kysymyksiä: Missä koodikannassa ihmisen valtuutus on valvottu? Mitä tarkastusloki kirjaa? Miten mallia testattiin jakelusiirtymän ja adversariaalisten syötteiden osalta? Toimittajat, jotka eivät pysty vastaamaan tällä tarkkuustasolla, eivät todennäköisesti ole toteuttaneet eettisiä valvontatoimia käytännössä.

Aiheeseen liittyvää luettavaa: Informaatiovaikuttamisen tarkastusketju -artikkeli kattaa lokiarkiston ja vastuullisuusarkkitehtuurin, jota jäljitettävyys- ja vastuullisen käytön periaatteet käytännössä vaativat. Laajemman hallintokontekstin osalta ISO 27001 puolustusohjelmistokehityksessä tarkastelee, miten tietoturvallisuuden hallintakehykset leikkaavat eettisen vaatimustenmukaisuuden kanssa. Organisaatioiden, jotka määrittelevät tekoälyn hankintakriteereitä, tulisi myös tarkastella kuinka valita puolustusohjelmistotoimittaja täyttä arviointirubriikin saamiseksi tekoälyletiikan ulkopuolelle ulottuvissa asioissa.

Tekoälyn etiikka sotilassysteemeissä: ihmisen hallinta, vastuullisuus ja NATO:n periaatteet

NATO:n kuusi tekoälyperiaatetta ja mitä ne käytännössä edellyttävät

Ihmisen hallinnan spektri

Suunnitteluvaatimukset kullekin periaatteelle

Etiikan kääntäminen hankintavaatimuksiksi

Dokumentaatiovaatimukset: AIIA, mallikortit ja selitettävyysraportit

Yleiset sudenkuopat: etiikkahuuhaus ja vastuullisuuskuilut

Narrative Shield NATO-yhteensopivana tekoälynä

Usein kysytyt kysymykset

NATO-yhteensopiva tekoäly informaatiovaikuttamiseen

Tekoälyn etiikka sotilassysteemeissä: ihmisen hallinta, vastuullisuus ja NATO:n periaatteet

NATO:n kuusi tekoälyperiaatetta ja mitä ne käytännössä edellyttävät

Ihmisen hallinnan spektri

Suunnitteluvaatimukset kullekin periaatteelle

Etiikan kääntäminen hankintavaatimuksiksi

Dokumentaatiovaatimukset: AIIA, mallikortit ja selitettävyysraportit

Yleiset sudenkuopat: etiikkahuuhaus ja vastuullisuuskuilut

Narrative Shield NATO-yhteensopivana tekoälynä

Usein kysytyt kysymykset

NATO-yhteensopiva tekoäly informaatiovaikuttamiseen

Aiheeseen liittyvät artikkelit