10.3321/j.issn:1002-8331.2007.35.047
基于信息熵的改进TFIDF特征选择算法
特征的选择对文本分类的精确性有着非常重要的影响.针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足,对TFIDF特征选择算法进行了深入的分析,并结合信息熵的概念提出了一种新的TFIDF特征选择算法.实验结果表明,改进后的算法可以有效地提高文本分类的精确度.
词条信息熵、特征选择、TFIDF、数据挖掘
43
TP301.6(计算技术、计算机技术)
国家自然科学基金50677069
2008-03-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
156-158,171