10.3969/j.issn.1002-1965.2008.06.019
一种基于网页内容和链接分析的主题搜索算法
先从网页内容和网页链接的角度计算网页与主题的相似度,然后将二者归一化,最终确定网页与主题的相关度.从分析网页内容相似度的角度保证网页与主题的相关性,从网页链接分析的角度解决网页搜索的权威性和覆盖乔率.算法还对PageRank算法进行了改进,将访问网页的概率加入到算法计算过程中,实验结果表明,新的算法具有较高的搜索效率.
网络蜘蛛、主题搜索、PageRank网页内容、网页链接分析
27
TP3;G25
山东省自然科学基金资助项目2005G21
2008-08-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
64-66