Operatorzy taktyczni tracą od 30 do 40 procent czasu zarządzania COP na nawigację po menu. Nie jest to wada projektowa żadnej konkretnej aplikacji — jest to strukturalna konsekwencja próby zmapowania całej operacyjnej przestrzeni informacyjnej na interfejs dotykowy zaprojektowany dla palców, nie rękawiczek, i zaprojektowany dla spokojnych warunków, nie kontaktu bojowego. ATAK, WinTAK i ich przeglądarkowe odpowiedniki, takie jak CloudTAK, są potężnymi narzędziami. Są również głęboko oparte na menu, a każda warstwa tego drzewa menu to obciążenie poznawcze pojawiające się dokładnie w momencie, gdy operator ma najmniejszą dostępną przepustowość uwagi.

Hipoteza za TAKpilot jest prosta: najszybszy interfejs do złożonego systemu to ten, który operator już umie obsługiwać — język. Jeśli dowódca sekcji może powiedzieć „umieść znacznik na siatce 37U DP 12345 67890 z kryptonimem ALPHA-3" radiotelegrafiście i pojawi się on na mapie w dziesięć sekund, to system przyjmujący tę samą frazę jako wiadomość czatową i robiący to samo w dwie sekundy stanowi istotną poprawę możliwości. TAKpilot jest właśnie takim systemem: AI copilot dla CloudTAK, który tłumaczy język naturalny na operacje TAK API przy użyciu wywoływania funkcji LLM.

Problem nawigacji po menu w oprogramowaniu taktycznym

Rozważmy typowy przepływ pracy przy umieszczaniu znacznika kontaktu wroga w ATAK: otwórz menu długiego naciśnięcia mapy, wybierz „Nowy punkt", przejdź do selektora typu CoT, wybierz typ wrogiej jednostki z hierarchicznego drzewa MIL-STD-2525, wprowadź współrzędne siatki w oknie dialogowym wprowadzania współrzędnych (przełączając się między MGRS, stopniami dziesiętnymi i DMS w zależności od tego, co operator zapamiętał), dodaj kryptonim i uwagi, naciśnij potwierdź. Jeśli palce operatora są zmrożone, jeśli jest pod ogniem, jeśli jedzie pojazdem po polnej drodze, każde dotknięcie niesie ze sobą realny wskaźnik błędu. Przesuń kontakt o jeden kwadrat siatki, a misja ogniowa idzie źle.

Badania czasu i ruchu z ćwiczeń szkoleniowych konsekwentnie pokazują, że doświadczeni operatorzy ATAK spędzają 35–40% czasu zarządzania mapą na nawigacji po interfejsie, a nie na podejmowaniu decyzji. Pozostałe 60–65% dzieli się między odczytywanie obrazu, komunikację radiową i aktualizację własnych danych pozycji. Narzut nawigacyjny nie jest małym błędem zaokrąglenia — to ponad jedna trzecia budżetu poznawczego, który zamiast tego mógłby być przeznaczony na świadomość sytuacyjną.

Język naturalny nie eliminuje potrzeby precyzji — „siatka 37U DP 12345 67890" nadal wymaga od operatora znajomości siatki — ale całkowicie eliminuje narzut nawigacyjny. Operator wypowiada (lub wpisuje) działanie; system je wykonuje. Poznawcza ścieżka od „muszę umieścić ten kontakt" do „kontakt jest na mapie" to jeden krok zamiast siedmiu.

Architektura natywna dla czatu: wywoływanie funkcji LLM jako warstwa TAK API

Podstawowa architektura TAKpilot opiera się na wywoływaniu funkcji LLM — zdolności nowoczesnych dużych modeli językowych do nie tylko generowania tekstu, ale także wybierania i parametryzowania ustrukturyzowanych wywołań funkcji z zdefiniowanej biblioteki narzędzi. Każda operacja TAK API udostępniana przez CloudTAK jest opakowana w definicję narzędzia: schemat JSON określający nazwę funkcji, opis i typowane parametry z ograniczeniami walidacji.

Reprezentatywna definicja narzędzia do umieszczania znacznika wygląda następująco:

{
  "name": "place_marker",
  "description": "Place a point-of-interest marker on the CloudTAK map at a specified grid coordinate.",
  "parameters": {
    "type": "object",
    "properties": {
      "mgrs": { "type": "string", "description": "MGRS grid reference, e.g. '37U DP 12345 67890'" },
      "callsign": { "type": "string", "description": "Callsign or label for the marker" },
      "cot_type": { "type": "string", "description": "MIL-STD-2525C CoT type string" },
      "remarks": { "type": "string" }
    },
    "required": ["mgrs", "callsign", "cot_type"]
  }
}

Gdy operator wysyła „umieść wrogi kontakt piechoty na 37U DP 12345 67890, kryptonim CONTACT-7", model otrzymuje wiadomość wraz z pełną biblioteką narzędzi i wybiera place_marker z odpowiednimi parametrami. TAKpilot wykonuje wywołanie funkcji, znacznik pojawia się na mapie, a operator widzi zwijaną kartę wywołania narzędzia w czacie z nazwą funkcji, parametrami wejściowymi, czasem wykonania w milisekundach i statusem odpowiedzi HTTP z CloudTAK.

Pełna biblioteka narzędzi TAKpilot obejmuje główne operacyjne czasowniki CloudTAK: umieszczanie i aktualizowanie znaczników, tworzenie i zamykanie misji, listowanie aktywnych śladów z opcjonalnym filtrem sektora, subskrybowanie i anulowanie subskrypcji kanałów danych, tworzenie pakietów danych oraz zapytania o status jednostki. Złożone operacje wieloetapowe są obsługiwane przez model łączący wywołania narzędzi w sekwencji, przy czym każdy wynik pośredni jest widoczny w czacie jako osobna karta wywołania narzędzia.

Potok wizji: od szkicu SITREP do umieszczenia na mapie

Znaczna część informacji taktycznych nadal dociera jako obrazy: ręcznie rysowane szkice sfotografowane telefonem, skanowane raporty sytuacyjne, nakładki PDF przekazywane pocztą e-mail lub komunikatorami. Potok wizji TAKpilot przetwarza te dane wejściowe i konwertuje je na ustrukturyzowane obiekty mapy poprzez trzyetapowy łańcuch.

Etap 1 — Ekstrakcja jednostek. Obraz (PNG, JPG lub PDF skonwertowany do PNG o wysokiej rozdzielczości) jest przekazywany do modelu obsługującego wizję ze strukturalnym promptem ekstrakcji. Model identyfikuje każdą jednostkę istotną dla mapy na obrazie: odniesienia do siatki, kryptonimy, symbole typów jednostek, linie namiarów, linie fazowe i adnotacje w formie wolnego tekstu. Wynikiem jest tablica JSON jednostek z typem, wyodrębnionym tekstem i wynikiem ufności.

Etap 2 — Potwierdzenie łańcuchem myśli. TAKpilot generuje wiadomość potwierdzającą prezentującą każdą wyodrębnioną jednostkę operatorowi z proponowaną ikoną symboliki NATO i dokładną siatką. Operator przegląda listę i albo potwierdza wszystko, wybiera poszczególne elementy, albo koryguje błędnie odczytane siatki przed dotknięciem mapy.

Etap 3 — Umieszczanie na mapie. Po potwierdzeniu przez operatora, TAKpilot wydaje odpowiednie wywołania narzędzi dla każdej potwierdzonej jednostki, wsadowo i równolegle dla szybkości. SITREP z dziesięcioma jednostkami, którego ręczne wprowadzenie w ATAK zajęłoby od czterech do sześciu minut, jest przetwarzany i umieszczany w mniej niż trzydzieści sekund.

Kluczowy wniosek: Brama zatwierdzania przed umieszczeniem na mapie nie jest kosmetyczną funkcją UX — to twarde wymaganie bezpieczeństwa. Model wizji, który błędnie odczyta siatkę o jeden znak, umieszcza przyjazną jednostkę ponad 1 km od rzeczywistej lokalizacji. W scenariuszu CAS taki błąd jest krytyczny dla misji. Krok potwierdzenia zamienia potencjalne fałszywe umieszczenie w wykryte i poprawione.

Brama zatwierdzania dla operacji destrukcyjnych

TAKpilot rozróżnia operacje addytywne (umieść znacznik, utwórz misję, subskrybuj kanał) i destrukcyjne (usuń misję, usuń ślad, wyczyść pakiet danych). Operacje addytywne wykonują się natychmiast. Operacje destrukcyjne są chronione przez jawny krok potwierdzenia — operator widzi wyrenderowaną listę z ikonami symboliki NATO, nazwami misji, przypisanymi kryptonimami i znacznikami czasu ostatniej modyfikacji, i musi jawnie potwierdzić przed wykonaniem.

Wybór modelu w różnych środowiskach operacyjnych

Węzły dowódcze i tyłowe z dostępem do Internetu używają Claude Sonnet przez API Anthropic dla najlepszego balansu jakości rozumowania i dokładności wywołań funkcji. Claude Opus jest dostępny do złożonego przetwarzania wizji SITREP. Węzły przedniego rzutu używają modeli hostowanych lokalnie: Llama 3 8B skwantyzowany, Qwen 2.5 7B lub Mistral 7B Instruct na NVIDIA Jetson AGX Orin lub laptopach taktycznych — zero zależności od chmury. Claude Haiku służy węzłom z ograniczoną, ale niezawodną łącznością.

Model bezpieczeństwa: izolacja sesji i atrybucja tożsamości

Każda sesja TAKpilot jest powiązana z tokenem uwierzytelniania CloudTAK operatora. Agent LLM nigdy nie ma bezpośredniego dostępu do bazy danych — generuje wywołania funkcji wykonywane w zakresie RBAC operatora. Wszystkie działania są atrybuowane w dziennikach audytu jako „użytkownik: operator przez TAKpilot". Przesłane pliki są usuwane natychmiast po przetwarzaniu wizji i nigdy nie są przechowywane poza bieżącą sesją.

Integracja z istniejącą infrastrukturą TAK

TAKpilot działa jako usługa Node.js obok istniejącego wdrożenia CloudTAK bez żadnych zmian konfiguracji TAK Server. Federacja TAK Server, dystrybucja pakietów danych i zarządzanie subskrypcjami kanałów działają przejrzyście przez TAKpilot, ponieważ działa on na warstwie API CloudTAK.

Scenariusze demonstracyjne

Przetwarzanie SITREP. Operator dołącza zdjęcie ręcznie napisanego SITREPu, wpisuje „przetwórz ten SITREP". TAKpilot ekstrahuje sześć jednostek, renderuje kartę potwierdzenia z symbolami NATO i siatkami, operator koryguje jedną siatkę i potwierdza resztę. Wszystkie sześć elementów na mapie w mniej niż dziewięćdziesiąt sekund łącznie.

Wieloślady koordynacji CAS. Koordynator ognia zarządza trzema jednoczesnym zaangażowaniami przez komendy konwersacyjne — „ustaw status BRAVO-7 na zaangażowany", „pokaż wszystkie aktywne ślady w sektorze CHARLIE" — trzymając oczy na mapie, a nie na drzewie menu.

Wniosek logistyczny przez czat. Zastępca dowódcy kompanii dyktuje wniosek o uzupełnienie zapasów w jednej wiadomości. TAKpilot tworzy misję z właściwą kategorią, priorytetem, kryptonimem i znacznikiem lokalizacji w jednym łańcuchu wywołań narzędzi. Na żywo na mapie w pięć sekund.

Dostępność: TAKpilot jest open source na licencji AGPL-3.0, dostępny na GitHub pod adresem UA-WCV/takpilot i wymieniony na rynku obronnym Brave1. Komercyjne wsparcie dostępne pod adresem corvusintell.com/takpilot.