10.3969/j.issn.1002-137X.2006.07.019
遗传算法在主题Web信息采集中的应用研究
传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题.在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法.通过此算法,利用元搜索技术可进一步提高网络蜘蛛的性能,具有更高的查全率和查准率,能够较好地解决现存问题.
网络蜘蛛、遗传算法、Web社区、信息采集
33
TP3(计算技术、计算机技术)
2006-09-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-74