一种基于社会性标注的网页排序算法
社会性标注作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中,由此产生的大量社会性标注数据成为网页质量评价的一个新维度.文中研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关系的网页排序算法.首先利用统计主题模型,使用相关标签为网页和用户建模,并计算查询相关性.然后利用二部图模型刻画网页和用户问的互增强关系,并使用相关标签与用户兴趣和网页内容的匹配度为互增强关系赋予权重.最后结合查询相关性和互增强关系,以迭代方式同时计算网页和用户的评分.实验结果表明,文中提出的检索模型和互增强模型能够有效地提高排序算法的性能.与目前的代表性算法相比,该算法在检索性能上有明显提高.
社会性标注、网页检索、网页质量、排序算法、主题模型
33
TP391(计算技术、计算机技术)
国家自然科学基金60703014,60933005;国家"九七三"重点基础研究发展规划项目基金G2007CB311100;国家"八六三"高技术研究发展计划项目基金2006AA010105-02,2007AA01Z416,2007AA01Z442,2009AA01Z437
2010-08-31(万方平台首次上网日期,不代表论文的发表时间)
共10页
1014-1023