10.3969/j.issn.1002-1965.2011.07.035
基于本体的TBT电子信息产品领域主题爬虫研究
针对技术性贸易壁垒(TBT)预测预警问题,本文结合TBT预警原理,将主题爬虫引入电子信息产品的TBT预警领域,建立电子信息产品主题相关本体,并借鉴向量空间模型中关键词权重分析方法,在此基础上使用Heritrix的扩展定制类从海量数据中筛选主题相关数据信息.通过实验验证了基于本体和向量空间模型的主题爬虫在领域信息获取的效率方面有明显提高,也为下一步研究奠定了良好的基础.
主题爬虫、TBT预警、本体、Heritrix
30
TP393(计算技术、计算机技术)
北京市自然科学基金“基于Multi-Agent的电子信息产品TBT预警” 9072001
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
157-161