10.3778/j.issn.1002-8331.2011.12.032
一种快速网页检索结果聚类策略
在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和 K-means 算法都是经常用到的.但它们都有各自的不足.提出一种两阶段聚类方法.第一阶段利用 HAC 聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用 K-means 算法聚类标题和摘要取得比较合理的聚类结果.由于标题一般都比较短,可以大大减少 HAC 算法的运行时间.这样既满足网络检索对时间的要求又可以得到较好的聚类结果.
网页检索结果聚类、层次聚类、两阶段聚类
47
TP39(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60773069,60873169;黑龙江大学校青年自然科学基金
2011-07-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
110-112,121