10.3969/j.issn.0490-6756.2009.04.019
基于智能的网页信息提取系统的研究与设计
随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人工干预,实现了信息提取的智能化.实验表明,该系统能够更准确、更有效地分类相似网页和提取网页信息.
智能、Web信息提取、RoadRunner、HTML结构树
46
TP391(计算技术、计算机技术)
四川省应用基础基金2008JY0027;四川省科技支撑计划项目07GG006-040
2009-12-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
957-962