10.3321/j.issn:1000-565X.2009.01.025
基于概念分组的Web搜索结果聚类算法
为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间的距离,据此实现Web搜索结果的聚类;最后,综合考虑特征词在类内和文档集中的重要性进行类别标签的选择.实验结果表明本算法具有较好的聚类性能,明显优于k-均值算法,且产生的类别标签容易理解.
信息检索、搜索引擎、Web文档、聚类、概念分组
37
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60603098
2009-04-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
130-134