一种循环神经网络的词义消歧方法
词义消歧是自然语言处理领域中的一个重要研究问题.针对汉语一词多义现象,结合上下文语境,采用循环神经网络(Recurrent Netural Networks,RNN)来确定歧义词汇的真实含义.以目标歧义词汇为中心,提取其左右4个邻接的词汇单元.从中抽取词形、词性和语义类作为消歧特征.以消歧特征为基础,结合循环神经网络来构建词义消歧分类器.利用SemEval-2007:Task#5的训练语料和哈尔滨工业大学语义标注语料来优化RNN的参数.使用SemEval-2007:Task#5的测试语料对词义消歧分类器进行测试.实验结果表明:所提出的方法能够提高词义消歧的准确率.
词义消歧、自然语言处理、循环神经网络、消歧特征
25
TP391.2(计算技术、计算机技术)
国家自然科学基金;中国博士后科学基金;黑龙江省自然科学基金;黑龙江省普通高校基本科研业务费专项资金
2020-05-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
80-85