32-канальний обертовий датчик LiDAR генерує близько 700 000 точок на секунду. Кожна точка кодує точне вимірювання дальності, кут азимуту та кута місця, а також значення інтенсивності відбиття. З цього необробленого потоку даних військова автономна платформа повинна в режимі реального часу та без підключення до мережі отримати прохідну карту місцевості, набір виявлених перешкод та стиснене представлення, придатне для передачі по обмеженому тактичному радіоканалу. Це і є інженерна задача обробки хмари точок LiDAR на військовому периметрі: витягнення оперативно корисної 3D ситуаційної обізнаності з високопропускного датчика на обладнанні, обмеженому бюджетом потужності у 15 Вт, без можливості вивантаження у хмару та в умовах вимог затримки для автономної навігації в реальному часі.

Чому обробка хмари точок LiDAR на периферії важлива для військової автономії

Автономні наземні транспортні засоби, безпілотні авіаційні системи, що діють нижче зони затінення GPS у міських каньйонах, і роботизовані платформи піхоти — всі вони мають однакову фундаментальну залежність: їм потрібне розуміння 3D-геометрії довкілля в реальному часі для безпечної навігації та виконання завдань. LiDAR є бажаним основним датчиком для цього, оскільки забезпечує метрично точні вимірювання дальності (зазвичай 1–3 см точності на відстанях до 100 м), які не залежать від умов освітленості, не вимагають текстури сцени для роботи та поступово деградують в умовах легкого дощу та пилу. Оцінка глибини на основі камери може доповнювати LiDAR, але не може замінити його в умовах деградованої видимості, характерних для військових оперативних середовищ.

Обмеження периферії — це не вибір, а фізична та оперативна вимога. Необроблені дані хмари точок від 32-канального обертового датчика при 10 Гц генерують приблизно 20–40 МБ/с, що значно перевищує пропускну здатність будь-якого практичного тактичного радіоканалу (зазвичай 512 кбіт/с до 5 Мбіт/с у конфігурації MANET під навантаженням). Навіть якби канал був доступний, час туди і назад до хмарного процесора споживав би десятки-сотні мілісекунд — занадто довго для прийняття рішень щодо уникнення зіткнень на рухомому транспортному засобі. Для автономного наземного транспортного засобу, що рухається зі швидкістю 20 км/год, 100 мс додаткової затримки відповідають 55 см додаткової відстані руху до того, як система може відреагувати — неприйнятний запас поблизу перешкод. Обробка на платформі — це не бажана, а необхідна функція; це жорстка вимога по затримці та пропускній здатності.

Тому військові периферійні розгортання LiDAR потребують алгоритмів, що є одночасно обчислювально ефективними та стійкими до деградованих умов польової операції: вібрації, нахилу датчика, часткового перекриття рослинністю та відсутності чистих структурних ознак (стін, стель, підлог), від яких залежать внутрішні системи SLAM LiDAR. Алгоритми, розглянуті в цій статті, спеціально відібрані за їх підтвердженою ефективністю у зовнішніх неструктурованих середовищах.

SLAM для картографування місцевості: побудова 3D-карт у реальному часі з мобільних платформ

Одночасна локалізація та картографування (SLAM) є алгоритмічною основою картографування місцевості на базі LiDAR у середовищах із відмовою GPS або деградованим GPS. Система SLAM LiDAR підтримує дві взаємодіючі оцінки: поточну позу платформи (положення та орієнтацію у 3D-просторі) та карту середовища, накопичену за всіма попередніми сканами. Кожен новий скан від LiDAR зіставляється з попереднім сканом або локальною підкартою для обчислення інкрементного руху платформи, що оновлює оцінку пози. Скан із прив'язаною позою потім інтегрується у зростаючу карту, нарощуючи 3D представлення хмари точок місцевості, якою пройшла платформа.

Найпоширеніші алгоритми SLAM LiDAR для зовнішніх військових платформ — LOAM (LiDAR Odometry and Mapping), LIO-SAM (LiDAR-Inertial Odometry via Smoothing and Mapping) та KISS-ICP (Keep it Small and Simple ICP). LOAM витягує ознаки ребер та площин з кожного скану та зіставляє їх між кадрами, досягаючи низького дрейфу на структурованій місцевості, але вимагаючи відносно потужних процесорів для підтримки пропускної здатності 10 Гц. LIO-SAM щільно поєднує зіставлення сканів LiDAR з даними блоку інерціальних вимірювань (ІВП) за допомогою backend оптимізації граф-факторів, забезпечуючи стійку одометрію на платформах, схильних до вібрації та швидких змін положення — умов, що порушують чисту LiDAR-одометрію. KISS-ICP зводить алгоритм до його ключового ядра ICP з динамічним порогом точка-до-точки, досягаючи продуктивності в реальному часі на ARM Cortex-A55 ціною дещо вищого дрейфу на безхарактерній місцевості.

Виявлення замикання петлі — це механізм, що запобігає необмеженому накопиченню дрейфу SLAM. Коли платформа повертається до раніше відвіданого місця, оптимізатор заднього кінця виявляє перекриття між поточним сканом та збереженою підкартою, додає обмеження замикання петлі до графа поз та переоптимізовує всю траєкторію. Для військових розвідувальних місій, де безпілотний наземний апарат або робот проходить маршрут і повертається, замикання петлі зменшує остаточний дрейф карти з потенційно кількох метрів (накопичення відкритої петлі ICP на траверсі у 500 м) до сантиметрів. Компроміс — обчислювальна вартість: повне виявлення замикання петлі з використанням дескрипторів контексту скану або гістограм інтенсивності вимагає 50–200 мс на спробу виявлення, а крок оптимізації графа масштабується нелінійно з кількістю поз у графі для великих середовищ.

Виявлення та класифікація перешкод на вбудованому апаратному забезпеченні LiDAR

Картографування місцевості та виявлення перешкод — алгоритмічно відмінні завдання, що виконуються одночасно на одному потоці хмари точок. Картографування місцевості накопичує скани для побудови стійкої 3D-моделі; виявлення перешкод обробляє кожен скан незалежно для ідентифікації об'єктів, яких платформа повинна уникати або які мають тактичне значення. Стандартний конвеєр починається з сегментації площини ґрунту: відокремлення точок, що належать прохідній поверхні, від точок, що представляють надземні об'єкти. Підгонка площини RANSAC (Random Sample Consensus) є класичним підходом: вибір випадкового підмножини точок, підгонка моделі площини та ітерація до знаходження найбільшого набору внутрішніх точок. Для зовнішньої місцевості з непло́скими поверхнями прогресивні морфологічні фільтри або методи оцінки ґрунту на основі зображення дальності показують кращі результати, адаптуючись до схилів і хвилястості.

Надземні точки потім кластеризуються у кандидатні регіони перешкод за допомогою евклідової кластеризації або кластеризації на основі щільності (DBSCAN). Евклідова кластеризація групує точки в межах налаштовуваного порогу відстані у зв'язані компоненти, кожна з яких представляє окремий об'єкт. Для типових зовнішніх військових сценаріїв кластеризація з порогом відстані 0,5–1,0 м групує тіло людини в один кластер та транспортний засіб в один або кілька кластерів, водночас розділяючи окремі стовбури дерев та кущі. Кожен кластер описується своїм обмежувальним паралелепіпедом (розмірами та орієнтацією) та нормалізованим розподілом точок, що передається в класифікаційну мережу. PointNet та його наступник PointNet++ є стандартними архітектурами для цього завдання: вони оперують безпосередньо на необроблених координатах (x, y, z) точок кластера, застосовують спільний MLP до кожної точки для витягнення поточних ознак та агрегують з глобальним max-pool для отримання вбудовування фіксованого розміру, інваріантного до порядку точок. Кінцевий класифікатор MLP відображає вбудовування у ймовірності класів об'єктів.

Розгортання класифікаторів типу PointNet на вбудованому апаратному забезпеченні вимагає такого ж процесу квантування та оптимізації, що й розгортання моделей TensorFlow Lite на вбудованому військовому апаратному забезпеченні. INT8-квантування моделі PointNet зменшує зберігання параметрів приблизно з 3,5 МБ (FP32) до менш ніж 1 МБ, а затримка виведення на Jetson Orin NX знижується з 18 мс до менш ніж 5 мс на кластер. Оскільки кластери обробляються незалежно, загальна затримка виявлення перешкод для скану з 20–30 надземними кластерами становить зазвичай 50–100 мс на Jetson Orin NX — добре в межах бюджету 200 мс наскрізного часу для виявлення перешкод при частоті сканування 10 Гц.

Алгоритми зменшення щільності точок: воксельні сітки, вибірка найвіддаленішої точки та військові компроміси

Необроблені хмари точок від 32-канального обертового LiDAR містять 50 000–150 000 точок на скан. Обробка кожної точки через алгоритм SLAM або конвеєр виявлення перешкод є обчислювально зайвою та часто контрпродуктивною: щільність точок на малих відстанях значно вища, ніж потрібно для будь-якого з завдань, тоді як щільність на великих відстанях надто мала, щоб додати значиму інформацію понад те, що могло б захопити грубіше представлення. Зменшення щільності знижує кількість точок до рівня, що відповідає вимогам обробки, обмінюючи просторову роздільну здатність на обчислювальну ефективність.

Воксельне зменшення щільності є найпоширенішим підходом у військових периферійних розгортаннях. 3D-простір ділиться на регулярну сітку кубічних вокселів, і всі точки в кожному вокселі замінюються їх центроїдом. Параметр розміру вокселя безпосередньо контролює компроміс між роздільною здатністю та обчисленнями: розмір вокселя 0,1 м зменшує скан зі 120 000 точок приблизно до 5 000–10 000 точок для типових зовнішніх сцен — зменшення в 10–20 разів, зберігаючи метричну геометрію, необхідну для SLAM. Розмір вокселя 0,2 м зменшує до 2 000–4 000 точок з відповідним зниженням роздільної здатності карти. Воксельне зменшення щільності є обчислювально тривіальним (пошук в хеш-таблиці на точку) і виконується менш ніж за 2 мс на ARM-процесорі, що робить його придатним для стадії попередньої обробки в реальному часі, що живить усі нижчестоячі алгоритми.

Вибірка найвіддаленішої точки (FPS) є стандартним методом зменшення щільності, що використовується як підготовка вхідних даних для класифікаторів типу PointNet. Для кластера з N точок FPS ітеративно вибирає точку, найбільш віддалену від поточного вибраного набору, до вибору K точок. Це дає просторово рівномірну вибірку, що зберігає геометричний розподіл кластера — критично важливо для PointNet, який покладається на глобальну структуру форми. Обчислювальна вартість становить O(N * K), що є прийнятним для малих кластерів (50–500 точок), що передаються в класифікатор перешкод, але було б надмірним для зменшення щільності повних необроблених сканів. На практиці воксельне зменшення щільності обробляє стадію попередньої обробки повного скану, а FPS обробляє нормалізацію кожного кластера безпосередньо перед виведенням класифікатора.

Стиснення хмари точок для тактичної передачі в умовах обмеженої пропускної здатності

Навіть після воксельного зменшення щільності передача повних оброблених хмар точок по тактичному радіоканалу рідко є можливою. Зовнішній скан зі зменшеною щільністю при роздільній здатності вокселя 0,1 м з 5 000 точок, кожна закодована як три координати FP32 та одне значення відбиття, займає приблизно 64 КБ. При частоті сканування 10 Гц необроблений потік становить 640 КБ/с — перевищуючи доступну пропускну здатність більшості конфігурацій MANET, що працюють в умовах перешкод. Практичне рішення — передавати похідні продукти даних, а не необроблені або з меншою щільністю хмари точок: сітки зайнятості, плитки цифрової моделі рельєфу (DEM) та структуровані повідомлення про виявлення перешкод.

2,5D сітка зайнятості кодує місцевість як сітку комірок, кожна з яких зберігає висоту найвищого сигналу LiDAR та прапорець прохідності. Для площі 100 м × 100 м з роздільною здатністю 0,25 м сітка містить 160 000 комірок. Зберігання кожної комірки як 16-бітового цілого числа зі знаком для висоти плюс один біт для прохідності та застосування LZ4-стиснення зменшує плитку 100 м до приблизно 15–30 КБ залежно від складності місцевості. При частоті оновлення 1 Гц на плитку навантаження потокової передачі карти становить 15–30 КБ/с — прийнятне навіть для сильно завантаженого каналу MANET. Приймальна платформа може відновити модель місцевості якості планування маршруту з цих плиток, не отримавши жодного пакета необробленої хмари точок.

Події виявлення перешкод є ще більш компактними. Структуроване повідомлення, що кодує положення (3 FP32), клас (1 байт), обмежувальний паралелепіпед (3 FP32 розміри плюс 1 FP32 курс), показник достовірності (1 FP32), ідентифікатор треку (4 байти) та оцінку швидкості (3 FP32), займає приблизно 60 байт на перешкоду. Передача 30 перешкод на скан при 10 Гц генерує потік виявлення 18 КБ/с — незначний на будь-якому практичному каналі. Для бюджетів каналу нижче 64 кбіт/с передача лише потоку подій виявлення (повне пригнічення оновлень плиток карти) забезпечує оператору-приймачу обізнаність про перешкоди в реальному часі при менш ніж 25% доступної пропускної здатності каналу.

Ключова думка: Найпоширеніша помилка надмірної інженерії у військових периферійних розгортаннях LiDAR — це спроба потоково передавати стиснені дані хмари точок по тактичному каналу замість похідних продуктів. Кодек хмари точок без втрат, такий як Draco або MPEG G-PCC, досягає стиснення в 4–8 разів на зовнішньому скані зі зменшеною щільністю, зменшуючи потік 640 КБ/с до 80–160 КБ/с — все ще значно вище доступного бюджету каналу в більшості розгорнутих конфігурацій. Правильна архітектура передає плитки сітки зайнятості та структуровані повідомлення про виявлення, залишаючи повну хмару точок лише для локального журналювання та аналізу після виконання завдання. Команди, що спочатку будують шар передачі похідних продуктів і додають локальне журналювання необробленої хмари як опціональну функцію, успішно розгортають системи; команди, що спочатку намагаються вирішити проблему стиснення, рідко виводять працюючу систему в поле.

Апаратні платформи: розгортання в умовах обмежень GPU на Jetson, FPGA та військових одноплатних комп'ютерах

NVIDIA Jetson AGX Orin є поточним еталоном продуктивності для військових периферійних навантажень LiDAR. Його GPU Ampere з 2048 ядрами та 64 блоками Tensor Core забезпечує 275 TOPS пропускної здатності INT8 при налаштовуваному TDP від 15 до 60 Вт. Запуск повного конвеєра обробки LiDAR — воксельне зменшення щільності, SLAM LIO-SAM, сегментація ґрунту, евклідова кластеризація та класифікація INT8 PointNet — на 32-канальному датчику при 10 Гц споживає приблизно 8–12 Вт на Jetson AGX Orin, залишаючи запас для драйверів зв'язку, бойового програмного забезпечення та системних витрат у рамках бюджету потужності платформи у 20 Вт. Для платформ з меншими бюджетами потужності Jetson Orin NX (10–25 Вт) обробляє той самий конвеєр при 10 Гц, якщо оптимізацію заднього кінця SLAM обмежити до 5 Гц, а Orin Nano (5–15 Вт) є достатнім для простіших навантажень, що пропускають повний SLAM на користь лише одометрії від скану до скану.

FPGA-платформи виконують іншу роль у ланцюзі обробки LiDAR. Операції вхідного кінця — прийом хмари точок від порту Ethernet датчика, хешування воксельної сітки, RANSAC площини ґрунту та генерація зображення дальності — мають детерміновані вимоги до затримки та отримують переваги від конвеєрного паралелізму, що пропонують FPGA. Xilinx Zynq UltraScale+ MPSoC, що виконує воксельне зменшення щільності та сегментацію ґрунту в програмованій логіці, може забезпечити субмілісекундну затримку з гарантованою пропускною здатністю, подаючи хмару з меншою щільністю та видаленим ґрунтом на підсистему ARM CPU для SLAM та на GPU для класифікації. Ця гетерогенна архітектура — FPGA для вхідного попереднього оброблення, GPU для класифікації на основі машинного навчання, CPU для заднього кінця SLAM — стає все більш стандартною у високопродуктивних військових програмах безпілотних наземних апаратів. Військові одноплатні комп'ютери, сертифіковані за MIL-STD-810G на удари та вібрацію та за стандартами TEMPEST на контроль випромінювань, зазвичай інтегрують багатоядерний ARM-процесор з роз'ємом PCIe, що приймає або системний модуль Jetson, або модуль Xilinx FPGA залежно від вимог програми до затримки та сертифікації.

Управління тепловим режимом — практичне обмеження, яке команди розробників часто недооцінюють при інтеграції обробки LiDAR у військову платформу. Jetson AGX Orin при TDP 60 Вт виробляє 60 Вт тепла, яке необхідно відводити від модуля у герметичному корпусі за військовими стандартами. Пасивні рішення охолодження з тепловими трубками та зовнішніми ребрами охолодження можливі до приблизно 30 Вт постійного навантаження; вище цього рівня зазвичай потрібен контур рідинного охолодження з насосом. Встановлення TDP Jetson на 15–20 Вт за допомогою конфігурації режиму живлення nvpmodel задовольняє більшість бюджетів пасивного охолодження, забезпечуючи при цьому достатню пропускну здатність для конвеєра 32-канального LiDAR. Теплові обмеження впливають на всі військові периферійні розгортання для виведення, а не лише на обробку LiDAR, і тепловий бюджет має бути частиною конструкції платформи з першої апаратної ітерації, а не розглядатися як пізня проблема інтеграції.

Інтеграція з автономними системами та відстеженням бойових підрозділів для ситуаційної обізнаності

Конвеєр обробки LiDAR, що функціонує ізольовано — виробляючи карти місцевості та виявлення перешкод, що споживаються лише стеком навігації власної платформи — забезпечує локальну автономію, але не спільну ситуаційну обізнаність. Оперативна цінність множиться, коли похідні продукти даних від кожної автономної платформи передаються по тактичній мережі та зливаються у загальну оперативну картину, доступну кожному оператору, командиру та підключеній системі. Архітектура інтеграції для цього вимагає трьох елементів: геопосилального формату даних для картографічних продуктів, структурованого формату повідомлень для подій виявлення та проміжного програмного забезпечення публікації-підписки, що доставляє обидва споживачам з відповідною частотою оновлення та пріоритетом.

Плитки карти місцевості від кожної автономної платформи геопосилаються з використанням поточного положення та орієнтації, оціненого SLAM платформи, злитого з будь-яким доступним виправленням GPS. Плитка проектується у глобальну систему координат (сітка UTM або MGRS) та позначається ідентифікатором відстеження бойових підрозділів платформи-генератора та відміткою часу. Геопросторовий шар даних TAK Server приймає ці плитки як вкладення Mission Package або накладення векторної геометрії, роблячи їх видимими для кожного підключеного клієнта ATAK як живий шар карти, що оновлюється в міру просування автономної платформи. Оператори бачать структуру місцевості областей, що розвідуються автономними системами, в міру того, як ці системи їх проходять, а не чекаючи на дамп даних після виконання завдання.

Виявлення перешкод від класифікатора LiDAR публікуються як події CoT на TAK Server, дотримуючись того ж шаблону інтеграції, що й ШІ для акустичного виявлення пострілів та інші системи периферійних датчиків. Подія CoT містить клас перешкоди (транспортний засіб, особа, споруда), розміри та орієнтацію обмежувального паралелепіпеда, показник достовірності та оцінку швидкості з фільтра відстеження. Автономні платформи в межах зони зв'язку одна з одною можуть також обмінюватися подіями виявлення рівноправно, дозволяючи підтримувати спільну карту перешкод для групи без необхідності центрального сервера. Цей однорівневий обмін перешкодами є особливо цінним у міських операціях, де кілька автономних систем зачищають будівлю та потребують підтримки спільної картини зачищених приміщень і виявлених загроз без покладання на потенційно деградований зворотний канал до командного пункту.

Злийте дані місцевості та перешкод LiDAR у вашу оперативну картину

Corvus SENSE зливає отримані з LiDAR дані місцевості та перешкод з іншими потоками датчиків, дозволяючи автономним платформам та піхоті обмінюватися тривимірною оперативною картиною в реальному часі навіть у середовищах з відмовою GPS.

Дізнатися про Corvus SENSE → Замовити брифінг

Цей аналіз підготований інженерами Corvus Intelligence, що розробляють критично важливі ISR та польові застосування для оборонних та урядових організацій. Дізнатися про нашу команду →