10.3778/j.issn.1002-8331.1512-0150
面向中文指代消解的最优样本比例研究
已有的中文指代消解系统研究大多是基于有监督的机器学习方法,训练集中正负例的比值直接影响到分类器模型,进而影响指代消解结果。针对如何选取训练集正负例比值的问题,实现了一个中文指代消解系统,提出了训练数据正负例比值与指代消解系统评测结果之间的数学模型,并引入一种改进的遗传算法计算训练数据最优比值,使系统评测结果最优。在ACE 2005中文语料上的实验表明,改进的遗传算法更适合指代消解任务,适当增大负例的比值能够提高指代消解系统的性能。
指代消解、训练数据、遗传算法
52
TP391(计算技术、计算机技术)
2016-09-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
140-145