10.3778/j.issn.1002-8331.2011.05.036
一种基于Nutch的网页聚类系统的设计与实现
设计了一种在中英文环境下、能够对Nutch的搜索结果进行聚类处理的搜索结果聚类系统,该系统基于k-means算法和后缀树聚类算法,是一个由Nutch搜索引擎、文本分词、TF-IDF权重计算以及文本聚类等模块构成的搜索引擎结果文档聚类系统,并通过实验对k-means算法和后缀树算法进行了对比.
Nutch、聚类、k-means、后缀树
47
TP311(计算技术、计算机技术)
2011-06-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
118-122