Ein Virtual-Reality-Trainer für militärische Operatoren ist kein Videospiel mit anderem Art-Pack. Es ist ein gekoppeltes System aus Geodaten, herstellerneutraler Runtime, Instruktor-Steuerungen und Lernanalytik — alles gebaut auf einen Beschaffungszyklus, der drei Generationen Consumer-VR-Hardware überdauert. Dieser Artikel durchläuft den Engineering-Stack: Cesium für die Welt, OpenXR für das Headset, Unity oder Unreal für die Engine, eine Instruktor-Station, die das Szenario tatsächlich steuert, und die Pädagogik, die Simulatorstunden in einsatzfähige Fertigkeiten umwandelt.

Warum jetzt Simulatoren

Die Einsatztempo-Verdichtung in der NATO hat die für Live-Training verfügbare Zeit reduziert. Live-Munition, Treibstoff, Truppenübungsplatz-Slots und Instruktor-Verfügbarkeit sind begrenzte Ressourcen; Auftragsanforderungen nicht. Ein Zug, der sechzig Engagement-Entscheidungen pro Woche braucht, um Aktualität zu wahren, kann sie nicht alle auf einem Live-Truppenübungsplatz bekommen. Die Mathematik erzwingt den Schritt zum synthetischen Training — nicht als Ersatz für das Feld, sondern als Multiplikator, der die Feldübung bedeutungsvoll hält, wenn sie stattfindet.

Das vertretbare Argument für Simulatoren ist nicht „billiger als live" — dieses Argument bricht unter ehrlicher Kalkulation von Headset-Refresh, Content-Erstellung und Instruktor-Personal zusammen. Das vertretbare Argument ist Transfer of Training: gut gestaltete Simulatorstunden erzeugen messbare Verbesserung der Feldleistung, und sie tun das für Aufgaben, die nicht sicher live geübt werden können (Massen-Triage, urbane Bresche unter Beschuss, Konvoi mit degradierter Kommunikation). Eine Simulatorstunde, die auf der falschen Aufgabe verbracht wird — oder auf der richtigen Aufgabe mit dem falschen Szenario-Design — erzeugt überhaupt keinen Transfer. Engineering und Pädagogik tragen gleiches Gewicht.

Hier koppeln Simulatoren auch an C2-Systeme: derselbe Operator, der sich durch eine synthetische Mission kämpft, sollte dieselbe Karten-Symbologie, denselben Chat-Workflow und dasselbe Alarmverhalten sehen, das er im einsatzbereiten System sehen wird. Trainings-UI-Parität mit operativer UI ist eine harte Anforderung, kein Politur-Punkt.

Geospatial-Grundlagen

Cesium ist die De-facto-Wahl für 3D im Globusmaßstab in der militärischen Simulation. CesiumJS für browserbasierte Trainer, Cesium for Unity und Cesium for Unreal für engine-eingebettete und Cesium ion als optionale Content-Pipeline. Der Gewinn ist die 3D-Tiles-Spezifikation: ein streamfähiges, Level-of-Detail-bewusstes Format für Terrain, Photogrammetrie und CAD-Modelle, das von einem einzelnen Gebäude bis zum gesamten Planeten bei konsistenten Draw-Budgets skaliert.

Terrain in einem Verteidigungs-Trainer ist selten „Cesium World Terrain ab Stange". Nationale Geodaten-Agenturen — NGA in den USA, DGIWG-orientierte Dienste in der NATO, der ukrainische Staatsdienst für Geodäsie — produzieren höher auflösende DTED- und Orthophoto-Datensätze, häufig klassifizierungsgekennzeichnet. Eine produktive Sim nimmt diese als private 3D-Tiles-Tilesets auf, die je nach Auszubildenden-Freigabe und Übungsklassifizierung im selben Szenengraphen ein- und ausgetauscht werden. Das nicht-klassifizierte Szenario erhält Bing-Bildmaterial; der Secret-seitige Rerun desselben Szenarios lädt das kontrollierte Tileset von einem separaten Endpunkt.

Realismus der synthetischen Umgebung ist mehr ein Content-Problem als ein Code-Problem. Gebäude, Fahrzeuge, Vegetation und Wetter müssen alle erstellt werden, und das Erstellungs-Budget begrenzt, wie viele trainierbare Szenarien eine Einheit tatsächlich hat. Synthetische Daten-Pipelines, die Umgebungen prozedural aus GIS-Layern füllen, reduzieren die Erstellungszeit um eine Größenordnung — und speisen als Nebeneffekt das KI-Training.

VR-Runtimes — OpenXR

OpenXR ist die herstellerneutrale Khronos-Runtime-API. Baut den Trainer gegen OpenXR, und dasselbe Binary steuert Meta Quest Pro und Quest 3, HTC XR Elite, Pimax Crystal, Varjo XR-3 und Valve Index ohne herstellerspezifische Code-Zweige. Baut gegen das Oculus SDK oder OpenVR, und ihr habt die gesamte I/O-Schicht neu konstruiert, sobald der nächste Hersteller den Markt verlässt — was er tut, in Zyklen kürzer als die Beschaffung.

Verteidigungsspezifische Runtime-Überlegungen, geschichtet auf OpenXR:

Zeroizable Storage. Headsets, die Szenendaten, Audio-Aufzeichnungen oder Auszubildenden-Biometrie auf internem Flash zwischenspeichern, werden zu kontrollierten Gütern, sobald klassifizierter Inhalt sie berührt. Die einsatzbereite Architektur hält entweder keinen persistenten Zustand auf dem Headset (alles vom Host-PC gestreamt) oder verwendet Headsets mit dokumentierten Zeroize-Prozeduren und akzeptiert sie als rechenschaftspflichtige Assets.

EMI-Emissionen. Consumer-Headsets sind FCC Part 15 — Emissionen, die für zivile Nutzung akzeptabel, aber nicht für SCIF- oder Schiffsumgebungen charakterisiert sind. Für Installationen in elektromagnetisch kontrollierten Räumen ist mit einem TEMPEST- oder Shielded-Room-Gespräch mit dem Facility Security Officer zu rechnen, bevor Headsets durch die Tür gehen.

Eye-Tracking und biometrische Daten. Varjo XR-3 und Quest Pro stellen beide Eye-Tracking bereit. Die Daten sind wertvoll für AAR — Blickplots zeigen, wohin der Operator schaute, und verpasste Hinweise werden sichtbar — aber es sind auch biometrische Daten mit Datenschutz- und Datenhandhabungspflichten nach nationalem Recht. Per Ausnahme erfassen, per Richtlinie aufbewahren, niemals standardmäßig aktiviert.

Game Engines — Unity vs. Unreal vs. Custom

Die Engine-Wahl fällt fast immer auf Unity oder Unreal. Eigene Engines existieren in Legacy-Einsatzsystemen und einigen klassifizierten Trainern, sind aber nicht mehr der Standard.

Unity lässt sich schneller mit Personal besetzen (der C#-Entwicklermarkt ist tief), hat reife XR-Plugin-Unterstützung und integriert sich sauber mit Cesium for Unity. Es ist die richtige Wahl für Mittel-Fidelity-Trainer, mobile/standalone Quest-Deployments und Projekte, bei denen Iterationsgeschwindigkeit Schluss-Fidelity schlägt.

Unreal rendert besser out of the box, liefert Nanite und Lumen und hat stärkere native Geospatial-Funktionen über Cesium for Unreal und Microsoft Flight Simulator-artige World-Streaming-Muster. Es ist die richtige Wahl für High-Fidelity-Fahrzeug- und Waffen-Trainer, großmaßstäbliche kollektive Übungen und alles, wo der Kunde Photoreal erwartet.

O3DE (Open 3D Engine, der Apache-2.0-Nachfolger von Lumberyard) ist die glaubwürdige custom-nahe Option, wenn Lizenzbedingungen zählen — seine Apache-Lizenzierung ist freundlicher zu ITAR-kontrollierten und regierungsverteilten Builds als Unreals EULA oder Unitys Runtime-Fee-Historie.

ITAR-bewusste Asset-Pipelines sind für US-exportkontrollierten Inhalt nicht verhandelbar. Das Modell einer befreundeten Plattform kann nicht-klassifiziert sein; das Modell einer gegnerischen Plattform, aus klassifizierter Bildgebung gebaut, ist es nicht. Asset-Bundles tragen Klassifizierungs-Metadaten, Build-Pipelines weigern sich, gemischte Klassifizierungen in ein einzelnes Lieferpaket zu packen, und der klassifizierte Build läuft auf einer isolierten Build-Farm. Das ist Klempnerarbeit, kein Glanz, und ohne sie werden Programme gestoppt.

Instruktor-Station-Design

Die Instruktor-Station ist, wo Simulatoren Erfolg oder Misserfolg haben. Ein Trainer mit wunderschöner synthetischer Umgebung und schlechter Instruktor-UI liefert nichts — der Instruktor kann die vom Lehrplan geforderten Ereignisse nicht einspielen, kann nicht einfrieren und zurückspulen, um den Entscheidungspunkt zu lehren, kann nicht vier Auszubildende in einer koordinierten Übung steuern. Engineering-Aufmerksamkeit, die zulasten der Instruktor-Station in das Headset-Erlebnis fließt, ist der häufigste Fehlermodus in der Verteidigungs-VR-Beschaffung.

Die Instruktor-Station sollte eine Einzelbildschirm-Anwendung sein — keine Monitor-Wand, die ihr eigenes Training erfordert. Die geforderten Features:

Szenario-Verzweigung. Der Instruktor wählt aus einem Baum vorerstellter Szenarien, mit Parametern (Wetter, Tageszeit, Opfor-Haltung, Komms-Degradierung) als Schieberegler verfügbar. Einmal erstellt, viele Male mit Variation abgespielt.

Freeze, Replay, Inject. Pausiere die Welt. Zurückspulen zum letzten Entscheidungspunkt. Ein unerwartetes Ereignis einspielen — einen Verwundeten, einen Komms-Ausfall, einen unidentifizierten Kontakt. Fortsetzen. Das ist das tägliche Brot des Lehrens.

Mehr-Auszubildenden-Koordination. Ein Instruktor, der vier oder acht Auszubildende führt, braucht eine Gottes-Sicht-Karte, pro Auszubildendem Gesundheit und Munition, pro Auszubildendem Komms-Patch-In und die Fähigkeit, einem Auszubildenden private Hinweise zu senden, ohne das gemeinsame Szenario zu brechen.

After-Action-Review-Export. Am Ende der Sitzung exportiert der Instruktor einen strukturierten AAR — Engagement-Zeitleiste, Entscheidungspunkte, Bewertungsraster. Der pädagogische Wert der Sitzung lebt oder stirbt mit diesem Artefakt.

Pädagogik — Vom „VR-Demo" zur übertragbaren Fertigkeit

Die Literatur zum Transfer of Training ist eindeutig: Simulator-Effektivität hängt von einer kognitiven Aufgabenanalyse (Cognitive Task Analysis, CTA) ab, die vor dem Bau des Szenarios durchgeführt wird. CTA zerlegt die operative Aufgabe in Wahrnehmungshinweise, Entscheidungen und motorische Aktionen; der Simulator übt dann diese spezifischen Elemente. Ein ohne CTA gebauter Simulator übt, was die Entwickler cool fanden — manchmal nützlich, oft nicht.

Kirkpatricks vier Stufen strukturieren weiterhin die Evaluation: Reaction (mochten die Auszubildenden es), Learning (haben sie die Fertigkeit im Simulator erworben), Behaviour (taucht die Fertigkeit auf dem Live-Truppenübungsplatz auf), Results (leistet die Einheit besser im Feld). Verteidigungsprogramme, die nur Level 1 melden — „Auszubildende bewerteten es mit 4,6/5" — messen noch nicht, was zählt. Die vertraglich vertretbaren Programme messen Level 3 und vergleichen die Scharfschuss-Leistung zwischen simulator-trainierten und nicht-simulator-trainierten Kohorten.

After-Action-Review ist, wo Level-2-Lernen sich verfestigt. AAR ist nicht „zeige das Replay" — es ist strukturiertes Befragen, Selbsteinschätzung der Auszubildenden und explizites Benennen der Entscheidungspunkte und der verpassten Hinweise. Der Job des Simulators ist es, AAR günstig, häufig und evidenzbasiert zu machen; der Job des Instruktors ist es, ihn gut zu führen. Fusion von Simulator-Telemetrie mit biometrischen, Eye-Tracking- und Sprachdaten gibt dem AAR-Gespräch echte Evidenz zum Verankern.

xAPI/SCORM-Integration

SCORM (2004 3rd/4th Edition) ist die Legacy-Spezifikation für Lerninhalte-Interoperabilität. xAPI (Experience API, auch „Tin Can" genannt) ist der moderne Nachfolger — Akteur-Verb-Objekt-Aussagen, die von jeder Lernerfahrung emittiert und in einem Learning Record Store (LRS) gespeichert werden. Moderne Verteidigungstrainer emittieren xAPI, nicht SCORM, obwohl viele LMS-Deployments noch beides konsumieren.

Ein LRS im Flottenmaßstab ist das analytische Rückgrat eines Operator-Einsatzbereitschaftsprogramms. Jedes Engagement, jedes Freeze-and-Discuss, jeder AAR-Score landet als xAPI-Statement, dem Auszubildenden, dem Szenario und der Einheit zugeordnet. Aggregiert beantwortet das LRS Fragen, die ein Einheits-S3 sonst nicht beantworten kann: welche Operatoren auf welchen Qualifikationen aktuell sind, welche Einheiten auf einem Szenario überindexiert und auf einem anderen unterindexiert sind, welche Szenario-Varianten die steilste Lernkurve produzieren.

LRS-Auswahl: Watershed und Learning Locker sind die etablierten kommerziellen und Open-Source-Wahlen. Die Verteidigungsentscheidung läuft meist auf Deployability hinaus — Learning Locker selbst-gehostet auf Kunden-Infrastruktur ist die übliche Wahl für klassifizierte Nutzung. xAPI-Profile (NATO veröffentlicht eines; die US Advanced Distributed Learning Initiative hat mehrere) beschränken das Vokabular, sodass Statements verschiedener Hersteller gegenseitig abfragbar sind.

Deployment-Realitäten

Zwei Deployment-Muster dominieren. Depot-Level-Installationen — eine feste Trainingseinrichtung, zwanzig Headsets, Racks mit Host-PCs, ein zentralisierter LRS, Netzwerk-Anschlüsse zum Basis-LAN. Stabil, hochwertig, teuer pro Quadratmeter. Deployable Kits — ein Pelican-Case mit vier Headsets, vier Laptops, einem tragbaren WLAN-Router, optionalem Satelliten-Backhaul. Niedrigere Fidelity, an vorderste Standorte einsetzbar, das tatsächlich genutzte Muster.

Netzwerkanforderungen verzweigen sich. Verbundene Installationen streamen Inhalte, synchronisieren LRS in die Cloud und ziehen Szenario-Updates. Air-gapped-Installationen tragen alles lokal — inklusive LRS, Content-Bibliothek und AAR-Export-Workflow — und gleichen auf einem periodischen Medien-Transferzyklus ab. Dasselbe Produkt muss beides unterstützen, weil der Kunde beides verlangen wird.

Die ungelöste Spannung ist der 5-jährige Verteidigungs-Lebenszyklus gegen den 18-monatigen Consumer-VR-Hardwarewechsel. Das Headset, das beim Vertragsabschluss spezifiziert wurde, ist bei initialer Einsatzbereitschaft End-of-Life. Die Abmilderungen sind architektonisch — OpenXR hält Runtimes austauschbar, strikte Layer-Trennung erlaubt Headset-Wechsel ohne Neuschreiben der Szenarien, Ersatzteilverträge beim Award kaufen Jahre operativer Lebensdauer über Consumer-EOL hinaus. Sie sind auch logistisch — Depot-Level-Imaging, Provisioning-Workflows und ein ehrliches Gespräch mit dem Kunden über Refresh-Budgets. Programme, die so tun, als ob die Zyklen passen, enden mit eingemotteten Trainern nach vier Jahren. Das ist dasselbe Operativ-vs-Kommerziell-Tempo-Missverhältnis, das in prädiktiver Wartung für militärische Flotten auftaucht — anderes Gebiet, identische Struktur.

Kernaussage: Der Simulator, der messbaren Transfer of Training liefert, ist nicht der mit dem besten Headset. Es ist der, bei dem die kognitive Aufgabenanalyse vorab erledigt ist, die Instruktor-Station die Lektion tatsächlich führt und das LRS beweist, dass die Lektion saß. Hardware-Fidelity sind die letzten 10 % des Engineering-Budgets, nicht die ersten.