10.3969/j.issn.1672-612X.2010.08.023
基于改进的TF-IDF特征权重算法的网页自动分类
TF-IDF是文档特征权重表示常用方法,但不能真正地反映特征词对区分每个类的贡献.故针对网页分类中特征选择方法存在的问题,加入网页标签特征权重改进TF-IDF公式,提出了一种比较有效的网页分类算法,实验结果表明该方法具有较好的特征选择效果,能够有效地提高分类精度.
网页分类、tf-idf、特征权重
29
TP301(计算技术、计算机技术)
2010-11-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
106-109