10.3778/j.issn.1002-8331.2007-0186
抑郁症网络社交与疑似抑郁微博初步筛选算法
在社交网络数据与抑郁症有关研究中往往需要采取人工方式标注抑郁症和非抑郁症用户,费时费力.通过高校大学生的微博社交数据的采集与分析,研究并提出了一种基于抑郁关键词与语义扩展的大学生疑似抑郁微博初步筛选算法——综合词法.该方法通过基础关键词表的构建和基于词嵌入学习模型WORD2VEC的语义扩展形成抑郁关键词表,最后利用该词表对被测微博进行语义相似度计算,进而识别其是否为疑似抑郁微博.在首都高校大学生微博数据集上的实验结果表明:综合词法在筛选准确率上优于SDS问卷分词法和专家词法;综合词法能够快速地从海量大学生微博中自动筛选占比非常少的疑似抑郁微博,减少专家标注工作量,提高标注效率,并可进一步为后续抑郁症患者精确识别(分类问题)提供良好的数据处理基础.
抑郁症;社交媒体;话题模型;社交行为分析;微博识别
58
V221+.3;TB553(飞机构造与设计)
北京高教保卫学研究会重大课题
2022-01-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
158-164