10.3969/j.issn.1671-1815.2014.18.017
基于频繁结构的Deep Web查询接口集成
随着网络规模的日益扩大,海量的信息被“深藏”于各类在线数据库中,用户只能通过查询接口才能获取其中的数据,这部分内容称之为Deep Web;因此对同一领域的Deep Web数据进行集成是非常必要的.查询接口的集成是其中一个非常关键的子问题.查询接口的集成分为模式匹配和模式集成两个步骤;重点研究集成查询接口中属性布局的确定.DeepWeb中查询接口数量巨大,以及动态性与异构性的特点给该问题带来了巨大的挑战.将查询接口的结构建模成一棵树,然后通过挖掘频繁的模式子树来构建集成的查询接口树,使其最大化地满足属性间的结构约束和顺序约束.该算法具有较低的时间复杂度,并具有很好的扩展性,对八个领域的查询接口进行集成的实验结果证明了算法的有效性.
频繁结构、查询接口、属性布局、模式子树、查询接口树
14
TP301.6(计算技术、计算机技术)
贵州省联合基金项目黔科合J字LKQS[2013]29号,黔科合J字LKQS[2013]13号
2014-08-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
81-88,93