一种改进的基于树路径匹配的网页结构相似度算法
提出一种改进的基于树路径匹配的网页结构相似度算法,该算法定义了树路径的序列相似度和位置相似度,找出网页的树路径集合,通过网页间的最佳树路径匹配计算结构相似度.实验结果表明,用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际,更合理有效.
网页结构相似度、序列相似度、位置相似度
50
TP391(计算技术、计算机技术)
国家自然科学基金61152001,61170111;中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题基金20110102;中央高校基本科研业务费专项基金SWJTU11ZT08
2013-02-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
1199-1203