10.3772/j.issn.1000-0135.2010.05.003
基于最大公共子图的文本相似度算法研究
用图结构表示文本,能更好地反映文本内部的结构特征,体现文本内的语义关系及词语在上下文中的语序关系,在此基础上,本文提出了一种基于最大公共子图的文本相似度计算方法,应用最大公共子图提取文本的公共部分,并利用最大公共子图的性质度量文本间的相似程度.最后针对分类试验结果中存在的问题,提出图模型修正方法以改进文本的表示效果,并对修正前后不同β取值下的F-Score值进行比较.修正后的试验结果表明,基于最大公共子图的文本相似度算法有着较好的分类性能.
最大公共子图、文本相似度、图结构模型
29
TP3;TN9
国家自然科学基金资助项目70771019;国家高技术研究发展计划863计划资助项目008AA04Z107
2010-11-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
785-791