Создана сеть завершения разреженных семантических сцен для облаков точек LiDAR

Создана сеть завершения разреженных семантических сцен для облаков точек LiDAR Источник фото: pixabay.com

Наблюдается растущая зависимость автономных и аналогичных роботизированных систем от надежного трехмерного зрения обработка LiDAR-сканирований с помощью глубоких сверточных нейронных сетей.

Предыдущие попытки выполнить сложную задачу завершения семантической сцены, которая влечет за собой вывод плотной трехмерной структуры и связанных семантических меток из «разреженных» представлений, в некоторой степени были успешными в небольших сценах внутри помещений, когда они снабжались плотными облаками точек или плотными картами глубины.

Однако производительность этих систем резко падает при использовании в больших сценах на открытом воздухе, характеризующихся динамическими и экспоненциально более разреженными условиями.

Точно так же обработка всего разреженного тома становится невозможной из-за ограничений памяти, а обходные пути приводят к неэффективности вычислений, поскольку практикующие специалисты вынуждены делить общий объем на несколько равных сегментов и делать выводы по каждому в отдельности, что делает невозможным выполнение в реальном времени.

В своей новой работе ученые сформулировали метод, учитывающий разреженность крупномасштабных сред, и представили S3CNet, нейронную сеть на основе разреженной свертки, которая предсказывает семантически завершенную сцену из единого унифицированного облака точек LiDAR.

Было показано, что предлагаемый метод превосходит все аналоги в трехмерной задаче, достигая самых современных результатов в тесте SemanticKITTI. Кроме того, был представлен 2D-вариант S3CNet со стратегией слияния нескольких видов, чтобы дополнить 3D-сеть.

Источник: arxiv.org