10.3778/j.issn.1002-8331.2008.33.044
基于SVM的中文报道关系识别方法研究
针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量.在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算.最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试.测试结果表明,这种方法可以有效地改善系统的性能.
报道关系识别、话题检测与跟踪、多向量表示模型
44
TP391(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60475022;山西省自然科学基金the Natural Science Foundation of Shanxi Province of China under Grant 20041041;山西省回国留学人员基金2002004
2009-02-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
141-143