词语位置加权TextRank的关键词抽取研究
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果.实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法.
关键词抽取、词排序、TextRank、图模型、LDA
G350(情报学、情报工作)
国家社会科学基金项目"Web2.0环境下的网络舆情采集与分析"09CTQ027;国家社会科学基金重大项目"云计算环境下的信息资源集成与服务研究"项目12
2013-10-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
30-34