10.3969/j.issn.1673-2006.2014.04.021
基于LDA模型的中文微博热点话题发现
针对微博文本数量增加速度快、信息量繁杂等问题,将LDA模型应用到热点话题的挖掘中,构建出微博热点话题的识别过程.首先应用LDA模型对微博语料库进行主题建模,采用困惑度方法确定最佳主题个数,通过Gibbs抽样算法实现参数推理,获得语料库的主题一词汇概率分布和文本一主题概率分布,在此基础上计算并识别出微博中的热点话题、热点词汇和热点话题微博.实验结果显示该模型与人工挑选的结果基本一致,表明该模型具有较好的热点识别效果.
LDA、微博、热点话题
29
TP391(计算技术、计算机技术)
宿州学院校级科研平台开放课题项目“问答社区中基于LDA的问题推荐机制研究”2013YKF14;安徽省大学生创新创业训练计划项目“基于微博的网络舆情挖掘研究”AH201310379082;安徽省大学生创新创业训练计划项目“改进的BP神经网络在ERP实施风险评价中的应用”AH201310379078;安徽省高校省级自然科学研究项目“基于本体的直搜索研究及应用”KJ2012Z395
2014-07-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-73,77