10.3969/j.issn.1003-3513.2009.03.010
基于句子关系图的网页文本主题句抽取
针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系.抽取文本主题句的任务转化为搜索图中边最多的点.利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题.选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性.
主题句、句子关系图、句子相似度
TP391(计算技术、计算机技术)
国家自然科学基金项目"企业组织知识管理中的若干基础科学问题研究"项目70431001的研究成果之一
2009-06-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
57-61