10.3969/j.issn.1006-2475.2022.07.014
基于残差门控循环卷积和注意力机制的端到端光学乐谱识别方法
光学乐谱识别对推动音乐智能化与数字化有着重大意义.传统的乐谱识别流程冗杂,易导致错误积累,但目前基于序列建模的乐谱识别方法不能从全尺度上获取音符上下文信息,在识别效果上仍有提升空间.为此,提出一种基于残差门控循环卷积和注意力机制的端到端光学乐谱识别方法.以残差门控循环卷积作为骨干网络,丰富模型提取上下文信息能力;结合一个注意力机制解码器,能更好地挖掘乐谱特征信息及其内部相关性,增强模型表征能力并对乐谱图像中的音符及音符序列进行识别.实验结果表明,改进后的网络与原卷积循环神经网络(CRNN)模型相比,符号错误率和序列错误率均显著下降.
光学乐谱识别、门控循环卷积、注意力机制、端到端
TP391(计算技术、计算机技术)
国家自然科学基金;江西省自然科学基金资助项目;江西省核地学数据科学与系统工程技术研究中心开放基金资助项目
2022-08-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
85-90