10.3969/j.issn.1671-1815.2013.07.025
基于论域划分的无监督文本特征选择方法
由于缺乏类信息,使得无监督文本特征选择问题一直未较好地加以解决.为此,对该问题进行了研究并提出了一个基于论域划分的无监督文本特征选择.该方法主要是把论域划分的思想引入到无监督文本特征选择之中,其首先使用一种新型无监督文档进行文本特征初选以过滤低频的噪声词,然后再使用所给的基于论域划分的属性约简进行文本特征优选.实验结果表明这个方法能够克服文本聚类时缺乏类的先验知识的不足,可以较好地解决无监督文本特征选择问题.
文本聚类、特征选择、文档频、论域划分
13
TP301.6(计算技术、计算机技术)
国家自然科学基金61201447;河南省基础与前沿技术研究计划项目102300410266、122300410287;郑州市科技计划项目121PPTGG362-12;郑州轻工业学院博士科研基金2010BSJJ038
2013-05-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
1836-1839