10.3969/j.issn.1006-2475.2013.04.007
主题爬虫相关度算法研究综述
首先阐述主题爬虫相关度算法目标扣相关度的计算内涵;然后根据信息处理的进化观点,以信息特征项的处理为线索,分别从字符层、语言层、语义层3个层次系统分析当前主题爬虫相关度的计算方法,并比较不同层次间各个算法的优缺点;最后总结现有的研究成果,并给出进一步的研究方向.
相关度、算法、主题爬虫、概念
TP391.3(计算技术、计算机技术)
公益性科研院所基本科研业务费专项资金资助项目2012-J-06
2013-09-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
27-30,39