Предварительные результаты экспериментов ученых показывают, что переход к политике по умолчанию при обнаружении неопределенности решения является ключом к использованию преимуществ в производительности, обеспечиваемых использованием машинного обучения без ущерба для безопасности.
В последнее время глубокое обучение успешно применяется для решения множества сетевых задач. Основная проблема заключается в том, что когда операционная среда для системы с расширенным обучением отличается от среды обучения, система часто принимает плохо информированные решения, что приводит к неэффективной работе.
Ученые утверждают, что безопасное развертывание систем, основанных на машинном обучении, требует возможности определять в реальном времени, является ли поведение системы согласованным, с целью перехода по умолчанию к разумной эвристике, когда это не так.
Специалисты представили три подхода к количественной оценке неопределенности решения, которые различаются с точки зрения сигнала, используемого для вывода неопределенности. Они проиллюстрировали полезность обеспечения безопасности в Интернете в контексте предлагаемого подхода глубокого обучения с подкреплением (RL) к потоковой передаче видео.
Хотя глубокое RL для потоковой передачи видео превосходит другие подходы, когда операционная среда и среда обучения совпадают, преобладает простая эвристика, когда они отличаются.