10.3969/j.issn.1002-1965.2014.04.028
基于改进TF-IDF算法的情报关键词提取方法
传统的TF-IDF完全基于词频,忽略了词语的其它特征项对关键词的影响。本文提出基于TF-IDF、词位置和词跨度的关键词自动提取的方法。该方法通过在传统的TF-IDF关键词权重计算方法中,加入位置权值及词跨度权值,避免单纯采用TF-IDF算法产生的偏差。实验结果表明,该方法在情报关键词提取中有广泛的应用价值,其准确率、召回率及F1值与传统方法相比有明显提升。
提取、TF-IDF、位置权值、词跨度值
TP391(计算技术、计算机技术)
2014-05-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
153-155