面向论坛的突发性热点话题快速发现与跟踪
面对网络论坛中的海量信息,提出一种基于噪音过滤和话题聚类的突发性热点话题快速发现方法.该方法首先对采集到的论坛数据进行预处理,建立以主贴标题为索引的候选话题集;然后通过定义的热度和回复加速度指标对集合进行多重过滤;最后采用本文提出的聚类算法进行话题聚类获取突发性热点话题.研究结果表明:该方法对突发性热点话题发现的精确率、召回率和F1均达到80%以上,且在信息处理效率方面优势明显;该方法可有效跟踪突发性热点话题,弥补了传统静态方法不能有效跟踪热点话题的不足.
网络论坛、突发性热点话题、聚类、回复加速度
45
TP393(计算技术、计算机技术)
国家教育部博士点基金资助项目200806990030;西北工业大学基础研究基金资助项目JC201149
2014-09-30(万方平台首次上网日期,不代表论文的发表时间)
2648-2653