10.11896/j.issn.1002-137X.2017.07.034
融合异常检测与随机森林的微博转发行为预测方法
针对目前微博转发行为预测具有的特征选择任意性、准确率不高的问题,提出了融合异常检测与随机森林的微博转发行为预测方法.首先,提取用户基本特征、博文基本特征、博文内容主题特征,并基于相对熵计算用户活跃度、博文影响力;其次,通过结合过滤式与封装式特征选择方法筛选出关键特征组;最后,融合异常检测与随机森林算法,依据筛选后的关键特征组进行微博转发行为预测,并利用袋外数据误差估计设置随机森林中的决策树和特征数.在真实新浪微博数据集上与基于逻辑回归、决策树、朴素贝叶斯、随机森林等算法的微博转发行为预测方法进行实验对比,结果表明所提方法的预测准确率(90.5%)高于基准方法中最优的随机森林方法的预测准确率,同时验证了特征筛选方法的有效性.
转发预测、随机森林、异常检测、特征筛选、相对熵
44
TP391(计算技术、计算机技术)
广西科技攻关项目桂科攻1598019-6
2017-08-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
191-196,220