10.3321/j.issn:1003-9775.2004.04.027
基于本体论的Web信息抽取
以本体论为基础,以所要提取的信息的层次结构作为信息提取的路径,定义了Web页面的信息项本体,并自动解析生成Web页面的结构本体.通过对这两个本体进行对比,构造了一种归纳学习算法来半自动地生成信息提取规则,对Web页面的信息提取具有较高的效率.
本体论、Web、归纳学习、HTML
16
TP311(计算技术、计算机技术)
国家自然科学基金69773019
2004-05-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
535-541