Разработана условная модель оценки градиентов для генерации сигналов

Разработана условная модель оценки градиентов для генерации сигналов Источник фото: djbiography.ru

Эмпирические эксперименты ученых показали, что созданная ими условная модель WaveGrad может генерировать высококачественные аудиосэмплы, соответствующие базовому уровню авторегрессии, и пользоваться при этом меньшим количеством последовательных операций.

В новом исследовании специалисты представили ​​WaveGrad – условную модель для генерации сигналов посредством оценки градиентов плотности данных. WaveGrad построена на предшествующей работе оценки сопоставления и вероятностных моделей распространения.

Она начинает с гауссовского стационарного белого шума, спектральные составляющие которого равномерно распределены по всему диапазону задействованных частот, и итеративно уточняет сигнал с помощью дискретизатора на основе градиента, созданного на основе мел-спектрограммы и прочих психофизических единиц высоты звука.

WaveGrad не является авторегрессионным инструментом и требует только постоянного количества шагов генерации во время логического вывода. Эта модель может использовать всего 6 итераций для создания высококачественных аудиосэмплов. WaveGrad проста в обучении и неявно оптимизирует взвешенную вариационную нижнюю границу логарифмической вероятности.

 

Источник: arxiv.org