Результаты обширных оценок ученых показывают, что RLzoo не только превосходит существующие библиотеки DRL в простоте дизайна API, но и представляет собой эталонную реализацию некоторых алгоритмов DRL.
В последнее время мы стали свидетелями стремительного роста внедрения технологий глубокого обучения с подкреплением (DRL). Однако полностью реализовать перспективы этих технологий на практике чрезвычайно сложно.
Пользователи должны вкладывать огромные усилия в создание агентов DRL, включение агентов в различные внешние обучающие среды и настройку реализации гиперпараметров агента, чтобы они могли соответствовать современной производительности (SOTA).
В новом эксперименте учеными был исследован RLzoo – новая библиотека DRL, цель которой заключается в упрощении разработки и воспроизведения алгоритмов DRL. RLzoo имеет как высокоуровневые, так и низкоуровневые API, полезные для создания и настройки агентов DRL.
Он имеет алгоритм построения адаптивного агента, который может автоматически интегрировать настраиваемые агенты RLzoo в различные внешние обучающие среды. Чтобы помочь воспроизвести результаты алгоритмов SOTA, RLzoo предоставляет богатые справочные реализации алгоритмов DRL и эффективные настройки гиперпараметров.