10.3321/j.issn:1000-0054.2001.07.028
关于文本特征抽取新方法的研究
该文研究了已有和最新的各种基于评估函数的特征筛选方法,评价了它们的优缺点和适用范围,并实现了一种用评估函数代替TFIDF法中IDF函数进行分类的新算法。然后进一步从如何放宽特征独立性假设,利用等级关系的角度探讨了对特征筛选可能的改善。
文本挖掘、词袋法、评估函数、特征独立性假设、等级树、特征抽取
41
TP301(计算技术、计算机技术)
国家自然科学基金79990580;国家重点基础研究发展计划973计划G1998030414;清华大学校科研和教改项目
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
98-101