语音风格迁移研究进展
语音风格迁移技术指在不改变说话内容的前提下,将源说话人的音色或语音风格转换为目标说话人的音色或语音风格.随着人们对社交媒体隐私保护等方面的迫切需求和基于神经网络篡改技术的快速发展,语音风格迁移技术在领域内被深入研究.在语音风格迁移基本原理的基础上,从声码器、语料对齐以及迁移模型3个重要影响因素的角度对研究现状进行分析,主要包括传统声码器与WaveNet声码器、平行语料与非平行语料以及传统迁移模型与神经网络模型,归纳出目前语音风格迁移技术存在的问题与挑战,并对发展方向进行展望.
语音、风格迁移、声码器、语料对齐、神经网络
49
TP391(计算技术、计算机技术)
上海市自然科学基金16ZR1413100
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
301-308,362