Ein taktisches Mesh-Netzwerk, das in der Garnison funktioniert, ist ein gelöstes Problem. Die schwierige Frage ist, was passiert, wenn ein Gegner mit der Störung beginnt, wenn Relay-Knoten zerstört werden und wenn Einheiten in Gelände manövrieren, das ihre Funksichtlinie unterbricht. Resilienz militärischer Mesh-Netzwerke ist die Ingenieursdisziplin des Entwurfs von MANET-Infrastruktur, so dass diese kontrolliert degradiert — nicht-kritischen Datenverkehr zuerst verliert, automatisch um tote Knoten herumleitet und sich ohne Operateureingriff erholt, wenn die Bedingungen sich bessern.

Für Softwareteams, die TAK-basierte gemeinsame Lagebilder aufbauen, ist Resilienz kein Problem des Funkgeräteherstellers. Jede Architekturentscheidung — Routing-Protokollwahl, Store-and-Forward-Puffergröße, Topologieplanung, Überwachungsinstrumentierung — entscheidet darüber, ob TAK-Tracks unter Netzwerkbelastung weiter fließen oder ob das COP genau in dem Moment erlischt, in dem Kommandeure es am meisten benötigen.

Bedrohungsmodell: Was ein taktisches Mesh-Netzwerk tatsächlich degradiert

Bevor man für Resilienz entwirft, braucht man ein strukturiertes Bedrohungsmodell. Vier Degradierungskategorien treiben nahezu alle resilient-MANET-Designentscheidungen.

Punktstörung zielt auf eine bestimmte Frequenz oder einen Kanal, der vom Mesh-Funk verwendet wird. Es ist die energieeffizienteste Störtechnik für einen Gegner — ein schmalbandiger Sender kann einen einzelnen Kanal mit relativ bescheidener Leistung sättigen. Punktstörung wird durch Frequenzsprung effektiv neutralisiert, weil der Störsender das Mesh-Funkgerät nur während des Bruchteils der Zeit angreift, die es auf diesem Kanal verbringt.

Sweep-Störung bewegt einen Störsender über ein Frequenzband, verweilt kurz auf jedem Kanal bevor er weiterwechselt. Gegen langsam springende Funkgeräte kann Sweep-Störung jeden Kanal treffen bevor das Funkgerät ihn verlässt. Gegen schnell springende militärische Wellenformen, die mit Hunderten von Sprüngen pro Sekunde arbeiten, sinkt die Verweildauer pro Kanal unter die Symboldauer und die Störwirkung bricht zusammen.

Sperrfeuer-Störung überflutet gleichzeitig ein breites Spektrum, benötigt erheblich mehr Sendeleistung, ist aber in der Lage, alle Kanäle auf einmal zu degradieren. Sie ist erkennbar (erscheint als Rauschpegelanstieg über das gesamte Band) und erfordert große, leistungshungrige Sender — was sie zu einer gegnerischen Fähigkeit mit erkennbarer logistischer Signatur macht. Sperrfeuer-Störung ist das Szenario, das Frequenzsprünge allein nicht vollständig besiegen können; es erfordert die physische Streuung von Knoten, um den Anteil des Meshs im effektiven Radius des Störsenders zu reduzieren.

Reaktive Störung hört auf eine Übertragung und antwortet sofort mit einem Störimpuls. Es ist die effizienteste Störtechnik — Stören nur wenn eine Übertragung erkannt wird — und die schwierigste zu bekämpfen, weil feste Sprungmuster erlernt werden können. Die Bekämpfung reaktiver Störung erfordert randomisierte Sprungsequenzen mit TRANSEC-Schutz und zeitliche Streuung von Übertragungen.

Jenseits elektronischer Bedrohungen: Knotenzerstörung (Relay-Hardware durch direktes oder indirektes Feuer vernichtet) ist statistisch die häufigste Ursache für Mesh-Degradierung in aktiven Konflikten. Geländemaskierung — Einheiten betreten Gebäude, überqueren Bergrücken, bewegen sich durch dichte Stadtblöcke — erzeugt temporäre Partitionierungen, die aus Sicht des Routing-Protokolls Knotenzerstörung imitieren. Die Unterscheidung zwischen einem partitionierten-aber-lebenden Knoten und einem zerstörten Knoten bestimmt, ob das Mesh versuchen sollte, die Verbindung wiederherzustellen oder permanent umzuleiten.

MANET-Routing-Protokolle unter Belastung: OLSR vs. BATMAN vs. AODV

Das Routing-Protokollverhalten bei Knotenausfall ist eine der wichtigsten Resilienz-Variablen, und die Unterschiede zwischen den Protokollen sind groß genug, um operativ bedeutsam zu sein.

OLSR (Optimized Link State Routing, RFC 3626 / OLSRv2 RFC 7181) ist proaktiv: Jeder Knoten pflegt eine vollständige Topologiekarte, die kontinuierlich durch HELLO- und TC-Nachrichten (Topology Control) aktualisiert wird. Wenn ein Knoten ausfällt, erkennen benachbarte Knoten das Ausbleiben von HELLOs innerhalb der Neighbor-Hold-Time und entfernen den Link aus ihren Topologietabellen. TC-Propagierung verteilt die aktualisierte Topologie durch das Mesh. Da jeder Knoten bereits die vollständige Topologie kennt, ist die Berechnung einer Alternativroute sofort möglich, sobald die Topologietabelle aktualisiert ist. In einem 20-Knoten-Mesh mit Standard-OLSR-Timern (Hello-Intervall 2s, Neighbor-Hold-Time 6s) dauert die Routenkonvergenz nach Knotenausfall 4–8 Sekunden.

BATMAN (Better Approach To Mobile Adhoc Networking) ist ebenfalls proaktiv, verteilt Routing-Informationen aber anders. Jeder Knoten speichert nur den besten nächsten Hop zu jedem Ziel, abgeleitet aus der Originator-Message-Empfangsqualität (OGM). Nach einem Knotenausfall erhalten benachbarte Knoten keine OGMs mehr; ihre besten-nächsten-Hop-Einträge für dieses Ziel laufen ab und werden durch den nächstbesten Pfad ersetzt, während OGMs aus anderen Richtungen akkumulieren. Die Konvergenz in einem 20-Knoten-Mesh dauert bei Standardeinstellungen 5–10 Sekunden.

AODV (Ad-hoc On-Demand Distance Vector) ist reaktiv: Es entdeckt Routen nur, wenn ein Paket gesendet werden muss. Dies eliminiert proaktiven Kontrollverkehr vollständig, führt aber Routenentdeckungslatenz ein (typischerweise 1–3 Sekunden für einen Anfrage/Antwort-Zyklus in einem 10-Hop-Mesh) bei jedem neuen Fluss. Für TAK-Positionsberichte — wo jedes CoT effektiv ein neuer kurzer Fluss ist — akkumuliert sich der AODV-Routenentdeckungs-Overhead zu erheblicher Lieferverzögerung. AODV ist selten die richtige Wahl für resiliente TAK-Infrastruktur.

Praktische Anleitung: Für TAK-Meshes auf Kompanieskala (bis zu 50 Knoten) bietet OLSR mit abgestimmten Hello-Intervallen das beste Konvergenz-zu-Overhead-Verhältnis. Für Bataillons-Deployments (50–200 Knoten) ist BATMANs geringerer Kontroll-Overhead vorzuziehen. Bestimmen Sie in jedem Fall die Konvergenzzeit empirisch auf Ihrer spezifischen Funkhardware, bevor Sie Akzeptanzkriterien festlegen — vom Hersteller angegebene Konvergenzzeiten werden oft auf unkontrollierten kabelgebundenen Prüfständen gemessen, nicht auf durchsatzbegrenzten taktischen Funkgeräten.

Frequenzsprung und Spreizspektrum: Wie FHSS/DSSS das Stören erschwert

Frequency Hopping Spread Spectrum (FHSS) ändert die Sendefrequenz viele Male pro Sekunde gemäß einer Pseudozufallssequenz, die von allen synchronisierten Knoten im Mesh geteilt wird. Für einen Punktstörsender, der auf einen Kanal zielt, bedeutet FHSS, dass nur ein Bruchteil 1/N aller Übertragungen (wobei N die Anzahl der Sprungkanäle ist) gestört werden. Ein Funkgerät, das über 50 Kanäle springt, gibt einem Punktstörsender nur 2% Trefferquote pro Übertragung.

Der Schlüsselparameter ist die Sprungrate im Verhältnis zur Symboldauer. Militärische Funkgeräte arbeiten mit Hunderten bis Tausenden von Sprüngen pro Sekunde. Bei 1.000 Sprüngen/Sekunde mit 1ms-Symbolen befindet sich das Funkgerät für höchstens ein Symbol pro Sprungbesuch auf jedem Kanal. Ein Sweep-Störsender muss lange genug auf jedem Kanal verweilen, um ein vollständiges Symbol zu erfassen — bei 1.000 Sprüngen/Sekunde muss der Störsender 1.000 Kanäle/Sekunde sweepen, während jeder Kanal 1ms Signal hat. Dies ist operativ sehr schwierig ohne Kenntnis der Sprungsequenz.

Direct Sequence Spread Spectrum (DSSS) verfolgt einen anderen Ansatz: Statt Frequenzsprung wird das Datensignal mit einem hochratigen Pseudozufallscode multipliziert, der es über eine breite Bandbreite verteilt. Der Verarbeitungsgewinn — das Verhältnis von gespreizter Bandbreite zu Datenbandbreite — bestimmt den Störabstand. Ein Funkgerät mit 20 dB Verarbeitungsgewinn kann korrekt empfangen, selbst wenn der Störsender im selben Band 100× stärker als das gewünschte Signal ist.

Für TAK-Transport-Integration: Sowohl FHSS als auch DSSS sind vollständig in der Funkhardware und Firmware implementiert. TAK Server, ATAK und WinTAK kommunizieren mit dem Funk über eine Standard-IP-Schnittstelle (Ethernet oder USB) und sind sich der Spreizspektrumschicht vollständig unbewusst. Anwendungen, die auf dem Mesh laufen, erfordern keine Änderungen, um vom FHSS/DSSS-Schutz zu profitieren — die Resilienz ist für die Anwendungsschicht transparent.

Der einzige Aspekt auf Anwendungsebene ist die Synchronisation: FHSS-Funkgeräte erfordern Zeitsynchronisation zur Aufrechterhaltung der Sprungsequenz-Ausrichtung. Wenn die Uhr eines Knotens erheblich driftet, verliert er die Synchronisation mit dem Mesh und erscheint anderen Knoten, als wäre er ausgefallen. Die Überwachung des Synchronisationsstatus jedes Mesh-Knotens — über die Radio-Management-API auf Silvus StreamCaster und Persistent Systems MPU5 verfügbar — ist ein wesentlicher Bestandteil eines resilienten Mesh-Monitoring-Stacks.

Store-and-Forward für getrennte Operationen

Kein Mesh-Design kann 100% Konnektivität in einer umkämpften Umgebung garantieren. Die praktische Frage ist, was mit TAK-Daten passiert, wenn das Mesh partitioniert ist — wenn ein Vorauselement für Minuten oder Stunden den Kontakt zum TAK Server verliert, bevor die Partition heilt.

TAK-Server-Replikation ist der primäre Mechanismus zur Handhabung längerer Trennungen. Eine vorausdeployierte TAK-Server-Instanz (läuft auf einem Laptop oder robusten Rechenknoten mit lokalem Mesh-Funk) pflegt ihre eigene Datenbank von CoT-Ereignissen. Wenn die Verbindung zum TAK Server der höheren Ebene verloren geht, empfängt und bedient der vorausdeployierte TAK Server weiterhin CoT von allen verbundenen ATAK/WinTAK-Knoten im lokalen Mesh-Segment. Wenn Konnektivität wiederhergestellt wird, replizieren die beiden TAK-Server-Instanzen ihre Ereignisdatenbanken bidirektional — jedes während der Trennung generierte CoT wird an beiden Enden synchronisiert.

Diese Architektur bedeutet, dass Vorauselemente während der Trennung vollständige Lagebildinformationen über ihr lokales Mesh-Segment beibehalten, und übergeordnete Hauptquartiere die vollständige Geschichte der Vorauselement-Aktivität wiedererlangen, sobald der Link wiederhergestellt ist. Die kritischen Konfigurationsparameter sind: Replikationsintervall (wie oft verbundene TAK Server Zustand austauschen — typischerweise 30–60 Sekunden), CoT-Stale-Zeit (wie lange ein TAK Server einen Track ohne Aktualisierung behält, bevor er abläuft — sollte großzügig eingestellt werden, 90–300 Sekunden, für getrennte Operationen) und Ereignisdatenbank-Aufbewahrungszeitraum.

CoT-Nachrichtenpufferung an Endpunkten behandelt kürzere Trennungen auf der Ebene einzelner Geräte. Wenn ein ATAK- oder WinTAK-Gerät keinen TAK Server oder Mesh-Peer erreichen kann, puffert es ausgehende CoT-Nachrichten in einer lokalen Warteschlange. Bei Wiederverbindung wird die Warteschlange sequenziell geleert. Die Puffergröße ist eine Designentscheidung: Eine 10-minütige Trennung bei 1 CoT/Sekunde pro Gerät in einem 20-Geräte-Mesh erzeugt 12.000 gepufferte Nachrichten, die bei Wiederverbindung geleert werden müssen, ohne den neu wiederhergestellten Link zu überlasten.

Topologiedesign: Ring vs. Stern vs. Vollmesh

Physische Topologie — wie Relay-Knoten platziert und verbunden sind — bestimmt die Fehlermodi des Meshs und die Garantien, die für TAK-Track-Lieferung gegeben werden können.

Sterntopologie (alle Knoten leiten über einen zentralen Relay) hat das schlechteste Resilienz-Profil: der Hub ist ein Single Point of Failure. Die Zerstörung des Hubs partitioniert jeden Blattknoten gleichzeitig. Sterntopologien entstehen in der Praxis, wenn ein einzelner fahrzeugmontierter Relay dominante HF-Abdeckung hat und alle anderen Knoten standardmäßig über ihn leiten. Dieses Muster sollte für jedes resilienz-kritische Mesh-Segment architektonisch verboten sein.

Ringtopologie (Knoten in einer Schleife verbunden) bietet zwei disjunkte Pfade zwischen jedem Knotenpaar — im und gegen den Uhrzeigersinn um den Ring. Die Zerstörung eines einzelnen Knotens oder Links wandelt den Ring in eine Linie um, isoliert aber keinen überlebenden Knoten. Ringtopologien sind praktisch für lineare Operationen: Konvoirouten, Korridorvorstöße, lineare Verteidigungsstellungen.

Vollmesh (jeder Knoten mit jedem erreichbaren Nachbarn verbunden) bietet maximale Redundanz — bis zu N-1 unabhängige Pfade zwischen jedem Paar in einem N-Knoten-Mesh — ist aber nur erreichbar, wenn sich alle Knoten gleichzeitig in Funkreichweite befinden. Für kleine, geografisch kompakte Einheiten (eine Gruppe in offenem Gelände) ist Vollmesh erreichbar und bietet die beste Resilienz. Auf Zugstärke machen Funkreichweite und Gelände Vollmesh physisch unmöglich; partielles Mesh mit geplanten redundanten Links ist das realistische Ziel.

Der praktische Designprozess: Identifizieren Sie für jeden kritischen Knoten (TAK Server, Gefechtsstand, hochbelasteter Relay) mindestens zwei unabhängige HF-Pfade zu jedem anderen kritischen Knoten, unter Verwendung verschiedener Relay-Routen und, wo möglich, verschiedener Frequenzbänder. Dokumentieren Sie die geplante Topologie in einem Netzwerkdiagramm mit Ausfallszenario-Anmerkungen.

Energiemanagement: Knotenschlafzyklen und Solarladung

Resilienz und Energiemanagement stehen in Spannung. Ein Mesh-Knoten, der zur Batterieersparnis abgeschaltet wird, ist aus Sicht des Routing-Protokolls einem zerstörten Knoten gleichwertig. Die Ingenieuraufgabe ist es, die Feldausdauer zu verlängern, ohne unnötige Partitionierungen zu erzeugen.

Duty-Cycling — abwechselnde Funk-aktive und Funk-Schlaf-Perioden — kann die Batterielaufzeit je nach Schlafanteil um das 2–5-fache verlängern. Ein 50%-Arbeitszyklus (30 Sekunden aktiv, 30 Sekunden Schlaf) verdoppelt ungefähr die Batterieausdauer. Die Einschränkung ist die Routing-Protokoll-Konfiguration: Die OLSR-Neighbor-Hold-Time muss lang genug eingestellt sein, dass schlafende Nachbarn nicht vor dem Aufwachen für tot erklärt werden. Für einen 30-Sekunden-Schlafzyklus verhindert ein Hello-Intervall von 20 Sekunden und eine Neighbor-Hold-Time von 80 Sekunden falsche Nachbar-tot-Deklarationen, während es sich innerhalb von 2–3 Minuten von tatsächlichen Knotenausfällen erholt.

TAK-Track-Lieferung während des Duty-Cyclings: Ein schlafender Knoten kann während seiner Schlafperiode keine CoT-Nachrichten empfangen. Benachbarte Knoten, die als Relays dienen, puffern Nachrichten für schlafende Nachbarn und liefern sie beim Aufwachen. Dies erfordert, dass die Mesh-Funk-Firmware Nachbar-Bewusstsein für Schlafpläne unterstützt — eine Funktion, die in der Silvus StreamCaster Firmware vorhanden ist, aber nicht in allen Commodity-MANET-Implementierungen. Verifizieren Sie schlafbewusste Pufferungsunterstützung, bevor Sie Duty-Cycle-Topologie für TAK-Lieferung entwerfen.

Solarladung für feste Relay-Knoten eliminiert das Batterieentladungsproblem auf Kosten einer festen, potenziell erkennbaren Positionssignatur. Ein solargespeister Relay auf einem Bergrücken oder Gebäudedach kann unbegrenzt betrieben werden, aber seine feste Position und die visuelle Signatur des Panels schaffen Ausbeutungsrisiko. Die Batteriechemie für feldeingesetzte Mesh-Knoten: Lithium-Eisenphosphat (LiFePO4) wird gegenüber Lithiumkobaltoxid (LiCoO2) für den Feldeinsatz bevorzugt, da LiFePO4 über einem breiteren Temperaturbereich (−20°C bis +60°C) thermisch stabil ist, mehr Ladezyklen toleriert und bei Durchbohrung kein thermisches Durchgehen aufweist.

Überwachung und Selbstheilung: Mesh-Gesundheit für TAK-Operateure sichtbar machen

Ein resilientes Mesh, das still degradiert, ist operativ gefährlich — Kommandeure verlassen sich auf das COP und wissen möglicherweise nicht, dass es unvollständig ist. Überwachungsinfrastruktur muss den Mesh-Gesundheitszustand für Operateure über die gleiche TAK-Schnittstelle sichtbar machen, die sie bereits verwenden.

Die empfohlene Architektur: Ein Mesh-Überwachungsdämon läuft auf jedem TAK-Server-Knoten, fragt alle 30 Sekunden die Radio-Management-API ab und veröffentlicht CoT-Sensor-Nachrichten, wenn Verbindungsqualitätsschwellenwerte überschritten werden. RSSI unter −85 dBm auf einem kritischen Link löst einen gelben Alert aus; RSSI unter −95 dBm oder Paketverlust über 30% löst einen roten Alert aus, der als TAK-Kartenüberlagerung gerendert wird. Knotenverschwinden (keine Management-API-Antwort für 3 aufeinanderfolgende Abfragen) generiert einen CoT-Alarmmarker an der letzten bekannten Position des Knotens.

Automatische Routenneuberechnung wird vom Routing-Protokoll selbst (OLSR oder BATMAN) ohne Operateurbeteiligung durchgeführt. Die Rolle der Überwachungsschicht besteht darin, zu bestätigen, dass die Neuberechnung stattgefunden hat und dass die Alternativroute angemessen funktioniert — ein Mesh, das um einen ausgefallenen Knoten herum umgeleitet hat, aber jetzt einen 7-Hop-Pfad mit 40% Paketverlust auf jedem Hop betreibt, ist technisch verbunden, aber operativ degradiert und benötigt Operateursaufmerksamkeit.

Partitionierungsereignis-Erkennung ist die höchstpriorisierte Überwachungsfunktion. Eine Partitionierung — wo das Mesh sich in zwei oder mehr getrennte Segmente teilt — bedeutet, dass ein Bruchteil des COP für den anderen Bruchteil unsichtbar ist. Die Erkennung erfordert Überwachung von außerhalb der Partitionierung: Ein Knoten, der beide Segmente sehen kann (z.B. ein UAV-Relay oder Satellitenuplink-Gateway), kann die Partitionierung erkennen, indem er beobachtet, dass bestimmte Knoten-IDs nicht mehr im Replikationsstrom erscheinen.

Feldtestmethodik: Knotenausfall, HF-Einspeisung und COP-Degradierungsmessung

Kein resilientes Mesh-Design ist validiert, bis es unter realistischen Degradierungsbedingungen getestet wurde. Feldtests sollten einem strukturierten Protokoll folgen, das vor jedem operativen Deployment ausgeführt wird.

Knotenausfall-Tests sind die direkteste Validierung. Schalten Sie einzelne Relay-Knoten nacheinander aus, während das vollständige TAK COP läuft, und messen Sie: (1) Zeit vom Knotenabschalten bis zur OLSR/BATMAN-Routenrekonvergenz, (2) Zeit von der Routenrekonvergenz bis zur Wiederaufnahme der TAK-Track-Lieferung auf der fernen Seite des geknickten Knotens, (3) Prozentsatz der CoT-Nachrichten, die während des Ausfallfensters verloren gehen. Wiederholen Sie für jeden Relay-Knoten in der Topologie. Erwartete Werte für ein gut konfiguriertes OLSR-Mesh: Konvergenz innerhalb von 8 Sekunden, TAK-Lieferungswiederherstellung innerhalb von 15 Sekunden, Nachrichtenverlust unter 5% mit aktiviertem Store-and-Forward.

HF-Störungseinspeisung verwendet einen kalibrierten HF-Signalgenerator oder eine breitbandige Rauschquelle zur Simulation von Störung bei kontrollierten Leistungspegeln. Der Test verläuft in drei Phasen: (1) Basismessung (CoT-Lieferrate, RSSI, Routing-Tabellen-Stabilität) vor der Störung, (2) Messung bei aktiver Störung (gleiche Metriken während der Einspeisung), (3) Wiederherstellungsmessung (Zeit zur Rückkehr zur Basislinie nach Störungsbeseitigung). Dokumentieren Sie den Störungsleistungspegel, bei dem die CoT-Lieferrate unter 80% degradiert — dies ist der Störabstand der aktuellen Konfiguration.

COP-Degradierungsbewertung liefert eine operative Metrik für Testergebnisse. Definieren Sie den COP-Score als den Bruchteil erwarteter Tracks, der zu einem gegebenen Zeitpunkt im TAK Server sichtbar ist, gemittelt über das Testfenster. Ein Score von 1,0 bedeutet, dass alle Tracks aktuell sind; 0,5 bedeutet, dass die Hälfte der Tracks abgelaufen oder fehlt. Tragen Sie den COP-Score gegen die Zeit vom Beginn jedes Testereignisses (Knotenausfall, Störsenderaktivierung) auf, um eine Degradierungs- und Wiederherstellungskurve zu erzeugen. Die Fläche unter der Degradierungskurve (verlorene Track-Minuten insgesamt) ist die Missionsauswirkungs-Metrik, die zum Vergleich von Konfigurationsalternativen verwendet wird.