10.3969/j.issn.1008-0821.2013.10.016
面向社区问答的中文短文本分类算法研究
为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用维基百科进行特征扩展以辅助中文问题短文本分类.首先通过维基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算.然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息.实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果.
社区问答、维基百科、特征扩展、短文本分类
33
G254(图书馆学、图书馆事业)
2013-11-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
70-74