基于加权TextRank的文本关键词提取方法
为提升提取文本关键词的准确性,文中提出了一种文本关键词提取方法.该方法融合词频、词长、词语位置及词性等关键词提取影响因素,提出了候选关键词的权重公式;通过实验获取权重公式的相对最优权重系数;将权重公式应用到TextRank算法的候选关键词得分公式中,以提升提取文本关键词的准确性.通过实验对比了OPW-Text-Rank算法与TextRank算法对单文本关键词提取的准确率、召回率及F值,结果表明,OPW-TextRank算法在窗口大小为6时,提取关键词的准确率高于TextRank算法.在以文本关键词提取为基础的自然语言处理系统中所提算法具有一定的实用性.
提取、加权、词频、TextRank
46
TP391.1(计算技术、计算机技术)
2019-07-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
142-145