10.3969/j.issn.1671-685X.2021.01.009
基于文本聚类算法的网络舆情话题检测研究
话题检测技术可以及时发现网络舆情热点话题和突发性事件,可以持续跟踪话题,实时掌握网络舆情事件的动向.文本聚类算法是实现话题检测与跟踪的重要方法,传统K-Means 聚类算法结构简单,收敛速度快,但存在对初始聚类中心选择敏感、容易陷入局部最优解等局限.引入差分进化算法对K-Means 算法进行改进,既具有差分进化算法的全局优化能力,又保留了 K-Means 算法简单高效的优点,并兼顾了网络舆情话题检测的准确性和实时性.实验表明,改进后算法的误检率、漏检率和耗费函数都有明显改善,提高了话题检测准确度上的有效性和实用性.
网络舆情、文本聚类、话题检测
29
TP391(计算技术、计算机技术)
山西省"1331工程"重点学科建设计划经费资助项目;山西警察学院创新团队资助项目
2021-03-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
69-72