Специалисты в области искусственного интеллекта и машинного обучения предложили схемы моделирования неопределенности данных на основе графов и попарных расстояний в неконтролируемом и контролируемом контекстах.
Спектральное обучение подпространств - это общий этап предварительной обработки данных во многих системах машинного обучения. Основная цель - научиться осмысленному встраиванию данных в низкую размерность.
Однако большинство методов машинного обучения подпространству не принимают во внимание возможные неточности измерения или артефакты, которые могут привести к данным с высокой неопределенностью.
Обучение непосредственно из необработанных данных может ввести в заблуждение и отрицательно повлиять на точность. В своем новом исследовании ученые предложили моделировать артефакты в обучающих данных, используя распределения вероятностей. Каждая точка данных представлена распределением Гаусса с центром в исходной точке данных, имеющим дисперсию, которая моделирует неопределенность.
Переформулировка структуры вложения графов помогла сделать ее пригодной для обучения на основе распределений неопределенности изучаемых данных.