基于EM-LDA综合模型的电商微博热点话题发现
[目的]在社交营销环境下,准确且有效地挖掘电商微博中的热点话题.[方法]提出一种综合模型EM-LDA对电商微博文本数据进行主题挖掘.EM-LDA综合模型包含两个子模型:ET-LDA模型和IT-LDA模型,前者对含有哈希标签的微博进行主题挖掘,后者对不含有哈希标签的微博进行主题挖掘.[结果]在确定合适的主题个数之后,标准LDA模型和EM-LDA综合模型均被用来挖掘电商微博文本数据的热点话题,与标准LDA模型相比,EM-LDA综合模型的热词挖掘准确率和有效性均较高,且能提高主题可解释性.[局限]在ET-LDA模型中,未考虑微博联系人之间的关联关系,即模型中未引入用户特征;在IT-LDA模型中没有考虑如何处理那些既是转发式又是对话式的电商微博.[结论]EM-LDA综合模型根据数据的特点,改进了标准LDA模型,能够提升电商微博热点话题识别的准确性.
电商微博、热点话题挖掘、哈希标签、EM-LDA
TP393;G356(计算技术、计算机技术)
本文系江苏省高校哲学与社会科学重点项目"江苏网络经济发展现状与对策研究"项目编号:2013ZDIXM017的研究成果之一.
2015-12-30(万方平台首次上网日期,不代表论文的发表时间)
33-40