10.3969/j.issn.1007-7634.2006.01.021
基于模式聚合和决策树的文本分类规则抽取
本文首先提出一种改进的χ2统计量,以此衡量词条对文本分类的贡献.然后根据模式聚合理论,将对各文本类分类贡献比例相近似的词条聚合为一个特征,建立出文本集的特征向量空间模型.此方法有效地降低了文本特征向量空间的维数.最后使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取可理解的分类规则的优势.
规则抽取、模式聚合、χ2统计量、决策树
24
TP391(计算技术、计算机技术)
中国科学院资助项目60275020
2006-07-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
96-99,123