基于二元分类的复述搭配抽取
以动宾关系的搭配为例研究复述搭配的抽取.具体地,该方法将复述搭配抽取视作二元分类问题,并综合使用了基于翻译、词典、极性词以及网络挖掘的多种特征.实验结果表明,所采用的二元分类方法对于抽取复述搭配是行之有效的,其中使用的各种特征对于提高复述搭配抽取的效果皆有帮助.利用该方法,共抽取出28万余对的复述搭配,其准确率超过70%.进一步的实验结果表明,使用抽取的复述搭配,可以为约40%的句子实现复述生成,从而说明了该方法的实际应用价值.
复述搭配、二元分类、复述特征
21
TP391(计算技术、计算机技术)
the National Natural Science Foundation of China under Grant Nos.60803093,60675034;the National High-Tech Research and Development Plan of China under Grant No.2008AA01Z144 国家高技术研究发展计划863
2010-08-30(万方平台首次上网日期,不代表论文的发表时间)
共10页
1267-1276