10.3778/j.issn.1002-8331.2008.33.045
问题分类中基于句法和语义信息的特征选择
问题分类是问答系统中一个非常重要的子模块,其关键在于问题的特征选择.考虑了问题的句法信息和语义信息,提出了一种利用问题疑问词、依存关系、主要动词、中心名词和名词的最高上位词作为特征进行分类的新方法.实验中,采用k-最邻近和朴素贝叶斯两种分类算法对该方法进行测试,结果表明了该方法具有较好的分类效果.在自定义的分类体系上,分别达到了82.2%和83.7%的分类精度,性能高于基于bag-of-words的特征选择方法.
问答系统、问题分类、特征选择、依存关系、上位词
44
TP391(计算技术、计算机技术)
微软亚洲研究院互联网服务科研基金Microsoft Research Asia Intemet Services in Academic Research Fund FY07-RES-OPP-116
2009-02-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
144-147