10.3969/j.issn.1002-137X.2010.05.036
一种基于LexRank算法的改进的自动文摘系统
自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相
关学科的广泛关注.首先介绍了基于LexRank算法的自动文摘方法.针对该方法的不足,从句子相似度计算方法、
句子权重计算方法以及冗余处理等方面对它进行了改进,从而可以根据输入文本内容动态地调整相关影响因子.实
现的文摘系统,可以对中文和英文的单文本或多文本进行自动文摘.在哈工大和DUC的测评语料上进行了实验,结
果表明该系统在一定程度上改进了文摘的质量,在多文本文摘中的抗噪声方面也有一定的优越性.最后讨论了自动
摘要研究存在的问题,并指出了自动文摘的研究趋势.
文摘、LexRank、句子相似度、动态调整、冗余处理
37
TP393(计算技术、计算机技术)
国家自然科学基金项目60573057,60473057,90604007
2010-06-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
151-154,218