Исследователи в области робототехники представили гибридный планировщик, который исследует вероятные состояния, сгенерированные из изученного распределения по местоположению целевого объекта.
Специалисты обратились к задаче манипуляции по извлечению целевого объекта с загроможденной полки. Когда целевой объект скрыт, робот должен искать его в беспорядке. Решение этой задачи требует рассуждения о вероятном местонахождении целевого объекта.
Это также требует физических рассуждений о взаимодействиях с несколькими объектами и будущих окклюзиях. В своей новой работе ученые представили управляемый данными подход для создания действий с учетом окклюзии в замкнутом цикле.
Они создали гибридный планировщик, который исследует вероятные состояния, сгенерированные из изученного распределения по местоположению целевого объекта. Поиск ведется эвристикой, обученной обучению с подкреплением для оценки закрытых наблюдений.
Метод оценен в различных средах с различной плотностью препятствий и физическими параметрами. Результаты подтверждают, что он может искать и извлекать целевой объект в различных физических средах, при этом обучаясь только в моделировании. Он обеспечивает поведение, близкое к реальному времени, с вероятностью успеха более 88%.