Ученые предложили методы атрибуции на основе интегрированного градиента с использованием структуры Тейлора

Ученые предложили методы атрибуции на основе интегрированного градиента с использованием структуры Тейлора Источник фото: pixabay.com

Сейчас специалисты по машинному обучению активно продвигают новые методы атрибуции на основе интегрированного градиента с использованием структуры Тейлора. Результаты экспериментов показывают, что предложенный метод превосходит существующие в модельных интерпретациях.

Методы атрибуции были разработаны для понимания процесса принятия решений в моделях машинного обучения, особенно в глубоких нейронных сетях, путем присвоения оценок важности отдельным характеристикам. Существующие методы атрибуции часто основаны на эмпирической интуиции и эвристике.

По-прежнему отсутствует единая структура, которая могла бы обеспечить более глубокое понимание их обоснований, теоретической достоверности и ограничений. Чтобы восполнить пробел, ученые разработали схему атрибуции Тейлора, чтобы теоретически охарактеризовать достоверность объяснений. Ключевая идея состоит в том, чтобы разложить поведение модели на термины первого порядка, независимые элементы высокого порядка и интерактивные термины высокого порядка, что позволяет более четко отнести эффекты высокого порядка и сложные взаимодействия функций.

Теоретические исследования показывают, что эти методы атрибуции неявно отражают термины высокого порядка, включающие сложные взаимозависимости признаков. Среди этих методов интегрированный градиент - единственный, удовлетворяющий трем предлагаемым свойствам. Результаты экспериментов показывают, что предложенный метод превосходит существующие в модельных интерпретациях.

Источник: arxiv.org