10.11896/j.issn.1002-137X.2017.04.053
基于上下文翻译的有监督词义消歧研究
针对目前有监督词义消歧方法存在的数据稀疏问题,提出一种基于上下文翻译的词义消歧方法.该方法假设由歧义词上下文的译文所组成的语境与原上下文语境所表述的意义相似.根据此假设,首先,将译文所组成的上下文生成大量的伪训练语料;然后,利用真实训练语料和伪训练语料训练一个贝叶斯消歧模型;最后,利用该消歧模型决策歧义词的词义.实验结果表明,与传统的消歧方法相比,所提出的方法消歧准确率提高了4.35%,并且超过了参加SemEval-2007测评的最好的有监督消歧系统.
词义消歧、上下文扩充、机器翻译、伪训练语料、贝叶斯模型
44
TP391(计算技术、计算机技术)
国家自然科学基金项目61502287;山西省高校科技创新项目2015105;国家863计划项目2015AA015407
2017-05-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
252-255,280