基于语义爬虫的商品信息主题采集研究
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法.在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化.实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率.
主题爬虫、商务信息、语义、主题链接分析、本体学习
TP393(计算技术、计算机技术)
教育部人文社会科学重点研究基地重大项目07JJD870220;湖北省教育厅人文社会科学项目2009b228
2010-09-28(万方平台首次上网日期,不代表论文的发表时间)
3-8