10.11959/j.issn.2096-271.2019008
基于百度贴吧的HIV高危人群特征分析
对百度贴吧"恐艾吧"中在线高危人群的帖子内容、线上活动时间规律进行了分析,利用LDA话题模型,对比分析了有无HIV感染者参与的主贴讨论的话题之间的差异,使用基于关键词的机器学习方法区分了在"恐艾吧"中发布话题的用户的性取向,计算不同性取向人群中HIV的流行率.研究结果说明,使用在线数据挖掘的技术和方法比传统方法更加高效,可以作为高危人群研究的重要补充.此外,基于机器学习对人群性取向进行智能判别,对于公共卫生管理部门监测疫情在不同人群中的发展状况有重要意义.
在线高危人群、男同性恋、HIV、LDA话题模型、百度贴吧、机器学习
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目91846301, 71771213, 71790615, 71690233;中国教育部文学和社会科学基金资助项目17YJCZH157;深圳市"鹏城学者计划"基金
2019-04-16(万方平台首次上网日期,不代表论文的发表时间)
共11页
98-108