10.3969/j.issn.1002-1965.2004.07.003
数字图书馆中基于向量空间模型的文档分类系统
介绍了一个建立在向量空间模型上的文档分类系统.该系统着重解决向量维数压缩和中文专有词汇获取等问题.在特征项的选取上,并不采用文档中出现的全部词汇,而是利用语料库统计信息生成的关键词汇.实验结果表明,较之以采用全体词汇作为特征项进行分类的方法,本方法能有效地进行向量维数压缩,同时也提高了分类准确率.
信息检索、文档分类、向量空间模型、数字图书馆
23
TP3;TU2
2004-08-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
9-11