10.3969/j.issn.1002-1965.2006.08.018
一种基于XML的Web信息抽取方法
目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用.针对这一问题,出现了Web信息抽取技术.在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法.该方法包括网页分析过程、映射的自动生成和信息抽取过程.在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法.
XML、Web信息抽取、抽取规则、半结构化
25
G35(情报学、情报工作)
湖南省教育厅资助项目
2006-09-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
49-51