Система планирования пути и навигации на основе глубокого Q-Learning для пожаротушения

Система планирования пути и навигации на основе глубокого Q-Learning для пожаротушения Источник фото: pixabay.com

Ученые предложили агента, основанного на глубоком Q-обучении, который невосприимчив к дезориентации и беспокойству, вызванных стрессом. Он способен принимать четкие решения для навигации на основе наблюдаемых и сохраненных фактов в условиях живого огня.

Живой огонь создает динамичную, быстро меняющуюся среду, которая представляет собой проблему для методологий глубокого обучения и искусственного интеллекта, помогающих пожарным поддерживать их ситуационную осведомленность, отслеживать и ретранслировать важные функции, необходимые для принятия ключевых решений при реагировании на эти катастрофические события.

Недавно ученые разработали агента, способного принимать правильные решения ориентации навигации в условиях живого огня. В качестве доказательства концепции они имитировали структурный пожар в игровом движке Unreal Engine, который обеспечивает взаимодействие агента с окружающей средой.

Агент обучается с помощью алгоритма глубокого Q-обучения, основанного на наборе вознаграждений и штрафов в соответствии с его действиями в среде. Агент, обученный с помощью этого подхода с глубоким Q-обучением, превосходит агентов, обученных с помощью альтернативных систем планирования пути, и демонстрирует эту методологию как многообещающую основу для создания помощника по навигации по планированию пути, способного безопасно направлять пожарных в условиях реального пожара.

Источник: arxiv.org