10.3969/j.issn.1002-1965.2006.06.021
一种基于向量空间模型的改进文本分类算法
探讨了基于向量空间模型的文本分类技术,通过规范化向量空间模型术语,论述了向量空间模型中TD-IDF向量化文档的不足;提出基于位置等因素的权重改进算法;借助扩展的潜在语义索引算法KLSC和辅助主题词表来消除模型很难处理一词多义、一义多词的现象;根据用户个性化的服务需求,给出了个性化服务的意见.
向量空间模型、文本分类、信息检索、潜在语义索引、核潜在语义索引
25
G35(情报学、情报工作)
2006-07-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
63-64,67