10.3772/j.issn.1000-0135.2021.04.005
通用语料的眼动数据对微博关键词抽取的性能提升探究
眼动数据记录了浏览者在浏览信息时的眼球轨迹,已有研究依据眼动数据度量阅读者在不同单词上的注意力强弱,并进一步将该特征加入微博关键词抽取模型中,从而提高抽取模型的性能.然而,目前的微博关键词抽取模型仅考虑通用领域眼动数据的总注视时长这一特征,尚未全面探究眼动数据对微博关键词抽取任务性能的影响.因此,本文将从眼动特征的选择、眼动特征与文本特征的组合这两个方面,全面考察通用语料的眼动数据对微博关键词抽取任务性能的影响.同时,由于眼动数据集与测试数据集在数据规模上相差较大,使得眼动特征过于稀疏,进而影响其作用的发挥,本文提出了一个眼动数据的扩充方案用于解决这一问题.
眼动数据、关键词抽取、序列标注、深度学习、注意力机制
40
TP301.6;U418.4;V355.2
国家自然科学基金;国家社会科学基金
2021-05-27(万方平台首次上网日期,不代表论文的发表时间)
共12页
375-386