Глубокое обучение с подкреплением поможет гарантировать безопасность в интернете

Глубокое обучение с подкреплением поможет гарантировать безопасность в интернете Источник фото: pixabay.com

Предварительные результаты экспериментов ученых показывают, что переход к политике по умолчанию при обнаружении неопределенности решения является ключом к использованию преимуществ в производительности, обеспечиваемых использованием машинного обучения без ущерба для безопасности.

В последнее время глубокое обучение успешно применяется для решения множества сетевых задач. Основная проблема заключается в том, что когда операционная среда для системы с расширенным обучением отличается от среды обучения, система часто принимает плохо информированные решения, что приводит к неэффективной работе.

Ученые утверждают, что безопасное развертывание систем, основанных на машинном обучении, требует возможности определять в реальном времени, является ли поведение системы согласованным, с целью перехода по умолчанию к разумной эвристике, когда это не так.

Специалисты представили три подхода к количественной оценке неопределенности решения, которые различаются с точки зрения сигнала, используемого для вывода неопределенности. Они проиллюстрировали полезность обеспечения безопасности в Интернете в контексте предлагаемого подхода глубокого обучения с подкреплением (RL) к потоковой передаче видео.

Хотя глубокое RL для потоковой передачи видео превосходит другие подходы, когда операционная среда и среда обучения совпадают, преобладает простая эвристика, когда они отличаются.

Источник: arxiv.org