10.3969/j.issn.1002-1965.2017.02.020
基于云计算的网络舆情藤蔓式串并行聚类方法研究
[目的/意义]针对目前在线网络海量信息难以快速获取其舆情的问题,为有效提升舆情获取速度,提出一种基于云计算的网络舆情藤蔓式串并行聚类方法.[方法/过程]首先构建舆情文本相似性度量模型,并设计确定舆情最佳聚类阈值的方法,以度量舆情信息间的相似性及确定舆情最佳聚类阈值;然后构建舆情藤蔓式串并行聚类模型,以一个舆情主题为聚类起始,之后如藤蔓的主干自动分支和延伸样,自主扩展舆情聚类主题,并根据舆情信息间的相似性和聚类阈值聚类同主题的舆情信息;最后在舆情藤蔓式串并行聚类模型的基础上,利用云计算的并行计算能力,快速、准确地聚类各主题的舆情信息.[结果/结论]实验结果表明:该方法能快速获取网络舆情,且具有较高的舆情聚类准确度,可为在线网络舆情实时监控提供一定的方法支持.
在线网络舆情、云计算、文本相似性、藤蔓式串并行聚类
36
G202(信息与传播理论)
教育部人文社会科学研究项目“基于大数据分析的在线社会网络舆情挖掘及风险管控研究”15YJC870004;湖南省哲学社会科学基金项目“网络环境下社会舆情危机事件的识别及评价策略研究”13YBA302
2017-05-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
122-126,107