10.11925/infotech.2096-3467.2019.0294
基于Q-LDA主题模型的网络健康社区主题挖掘研究
[目的]信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力.[方法]研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,利用实际数据对模型进行验证.[结果]Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高16%,能够更有效地挖掘网络健康社区信息所隐藏的主题.[局限]只选取网络健康社区内某一种疾病版块的文本数据,其代表性可能存在不足.[结论]在考虑网络健康信息质量的情况下进行主题挖掘,其结果能更好地满足网络健康社区用户的需求.
文本数据、在线健康社区、知识发现、主题挖掘
3
C81;G35(统计方法)
本文系山东省社会科学规划研究项目“移动互联网环境下群健身运动规律测度及提升方案研究”项目编号:17CHLJ40
2020-03-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
52-59