10.3969/j.issn.1673-808X.2015.03.015
一种适用于微博主题提取的SMLDA模型
针对微博文本简短、格式内容散乱、信息描述不完全、数据噪声大导致无法高效获取微博主题的问题,提出一种基于 LDA改进的 SMLDA模型。该模型综合考虑微博作者之间的关系、微博特定主题的标签以及微博文本之间转发关系和背景主题,采用 Gibbs抽样算法推导模型参数。在真实新浪微博数据集上进行试验分析,实验结果表明,SMLDA 模型与LDA模型比较,前者效率更高,提取结果更准确。
新浪微博、Gibbs算法、主题提取
TP393(计算技术、计算机技术)
国家863计划2012AA011005
2015-07-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
241-244