自治异构数据源聚集模型与算法研究
自治异构数据源信息共享的主要问题是如何在P2P环境下对自治数据节点的信息进行统一访问.采用分层结构组织数据源节点能够提高查询效率,减小计算开销,但需要节点根据彼此相似度实现局部的聚类.给出了数据源节点信息发布的形式化描述,提出了基于模式元素匹配的自治异构数据源多重聚集模型以及聚类组织构建过程,采用TA算法解决top-K聚类节点搜索问题,并在此基础上提出TAL算法.实验结果表明,TA和TAL算法能够高效地解决节点聚类排序的问题,特别是TAL算法在聚类节点范围较大时计算性能优于TA.
数据集成、聚集模型、全局和局部聚集函数、TA、TAL
45
TP311(计算技术、计算机技术)
国家自然科学基金项目70501031,70371008
2008-11-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
1546-1553