DOI：10.3969/j.issn.1002-137X.2010.05.036

一种基于LexRank算法的改进的自动文摘系统

引用

摘要：

自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相关学科的广泛关注.首先介绍了基于LexRank算法的自动文摘方法.针对该方法的不足,从句子相似度计算方法、句子权重计算方法以及冗余处理等方面对它进行了改进,从而可以根据输入文本内容动态地调整相关影响因子.实现的文摘系统,可以对中文和英文的单文本或多文本进行自动文摘.在哈工大和DUC的测评语料上进行了实验,结果表明该系统在一定程度上改进了文摘的质量,在多文本文摘中的抗噪声方面也有一定的优越性.最后讨论了自动摘要研究存在的问题,并指出了自动文摘的研究趋势.

关键词：文摘、LexRank、句子相似度、动态调整、冗余处理

所属期刊栏目：37

分类号：TP393(计算技术、计算机技术)

资助基金：国家自然科学基金项目60573057,60473057,90604007

在线出版日期：2010-06-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：151-154,218

英文信息展示

期刊专题