10.3969/j.issn.1002-1965.2015.11.033
基于Clauset和PageRank的社交网络族群兴趣发现研究
传统的话题识别方法实现对新闻媒体信息流中新话题的自动识别,主要针对长文本信息,不适用于数据稀疏的微博客。为此,本文提出一种以用户语言为基础的话题词库,构建主题词共现图进行微博客话题识别。在此基础上,分别用Clauset算法及PageRank算法进行了模块化的聚类。前者从内容视角发现了不同的兴趣簇群,其社区结构较为扁平化;后者从人的视角发现了不同的兴趣簇群,群意见领袖均为现实社会的权威人物,其社区结构呈现较明显的层级性。
词共现图、族群兴趣、Clauset PageRank
G202(信息与传播理论)
2015-12-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
183-187