10.3969/j.issn.1007-2373.2007.06.010
基于树结构的包装器全自动生成方法的研究
论文研究并实现了一种包装器全自动生成算法,使用两个页面的树形结构,从对比两棵树之间的相同与差异发现模式,从树结构中结点的不匹配之处推导出包装器.在实际HTML页面上的实验已经证明,这种方法能够更好的发现可选结构和迭代结构.
Web数据抽取、包装器、树结构、匹配算法、自动
36
TP311(计算技术、计算机技术)
2008-04-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
41-46