10.3969/j.issn.1002-1965.2014.09.022
基于爆发词识别的微博突发事件监测方法研究
鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突发事件。最后以新浪微博数据为例进行实验,验证了提出的算法对突发事件监测能取得不错的效果。
微博、爆发词、共现分析、突发事件
TP391.1(计算技术、计算机技术)
2014-10-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
123-128