10.3969/j.issn.1002-137X.2011.08.055
基于事件实例驱动的新闻文本事件抽取
目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题.提出了一种基于事件实例驱动的事件抽取方法.首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-medoids算法完成事件抽取.该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性.实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高.
事件实例、分类、新闻文本、聚类、事件抽取
38
TP391(计算技术、计算机技术)
国家社科重大基金项目09&ZD014;国家863项目2007AA01Z439
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
232-235