一种基于 Sketch 的 Top-k 紧密中心性快速搜索算法
在大数据的时代背景下,由于网络数据(network data)能有效简洁地描述社交网络、电子商务、医疗记录、在线教育等多种应用中各类复杂关系,越来越受到工业界和学术界的关注。在社交网络分析任务中,一个基本操作是从网络中发现重要程度前 k 大的节点。紧密中心性(closeness centrality)是一种常见的节点重要性刻画指标,它用节点在网络中心的程度来反映节点的重要性。用紧密中心性衡量节点重要性进行节点搜索的问题称为 top-k 紧密中心性搜索问题。然而,传统的精确算法由于其多项式级别的复杂度无法高效地扩展到大规模的网络数据上。近来,研究人员提出了近似算法,通过牺牲结果精度来获得性能提升。通过分析发现,目前存在的近似算法虽然性能得到了有效提升,但是结果精度牺牲过大。为了解决这个问题,该文设计了一种新颖的近似算法,叫做基于 Sketch的紧密中心性搜索算法。此近似算法应用了一个全新的计算方式,利用 Sketch 估计同一距离的邻居数目,然后得到近似的最短距离之和,最终得到各个节点的紧密中心性的估计值。此算法的时间复杂度为 O(m tD max ),其中 t 是常数,D max 是网络直径,m 是网络边数。根据实际社交网络的小世界现象的特性,此近似算法基本是个线性算法。最后,相比于目前存在的精确算法和近似算法,该文通过全面的实验验证了基于 Sketch 的紧密中心性搜索算法在时间性能和结果精度等两方面的优势。
紧密中心性、图算法、近似算法、图分析、社交网络
39
TP311(计算技术、计算机技术)
国家自然科学基金61272155,61572039;国家“九七三”重点基础研究发展规划项目基金2014CB340405;深圳政府研究项目JCYJ20151014093505032资助.
2016-11-07(万方平台首次上网日期,不代表论文的发表时间)
共14页
1965-1978