社会化媒体大数据多阶段整群抽样方法
在线社会化媒体大数据是行动者自组织关系的集合,其内部蕴含了多层次的社会实体关系,因此,在线社会化媒体大数据抽样方法的研究对于社会计算这一新兴研究领域具有重要的理论和应用价值.现有抽样方法存在大型马尔可夫链难以并行化、样本局部性陷入、马尔可夫链燃烧预热等问题.针对这些问题,提出了在线社会化媒体大数据整群多阶段抽样方法OSM-MSCS.该方法首先进行整群分解,将总体分解成若干小型凝聚子群;而后,使用动态延迟拒绝方法对凝聚子群内部的关系抽样;最后,使用Gibbs方法完成不同凝聚子群之间相干关系的筛选,从而获得整个样本序列.实验结果表明,OSM-MSCS方法能够有效地对各种结构特征的在线社会化媒体大数据进行抽样,从“个体地位-群体凝聚性-整体结构性”这3个层次进行综合评价,其抽样效果要明显好于MHR和BFS这两种最主流的抽样方法.
在线社会化媒体、大数据、马尔可夫蒙特卡洛方法、多阶段整群抽样
25
TP311(计算技术、计算机技术)
教育部中央高校基金13SZYB01;陕西省社科联重大理论与现实问题研究项目2013C124;中国电信“社会化媒体大数据云服务商业模式的研究”项目SN2012-YS-13709
2014-06-06(万方平台首次上网日期,不代表论文的发表时间)
共16页
781-796