10.11925/infotech.2096-3467.2018.1207
基于机器学习的社交媒体用户分类研究
[目的]充分利用社交媒体用户的个人多维度信息,研究用户自动分类问题.[方法]将社交媒体用户定义为个体民众、媒体、政府和组织4种类型,从用户多维度信息中提取人口统计学、命名和自我描述三组特征,构建基于机器学习算法的用户自动分类模型,在Twitter真实数据集上通过实验对比各分类算法性能,并分析各组特征的贡献度.[结果]支持向量机和随机梯度下降分类模型的准确率和召回率均在83%以上,命名、人口统计学和自我描述特征对于分类性能的影响依次递增.[局限]由于标注的用户数量有限,可能无法让模型充分学习用户特征,而且没有考虑不同类型用户数量的不均衡问题.[结论]基于支持向量机和随机梯度下降的分类模型能够较准确地识别出4种类型用户,对后续社交媒体用户划分研究具有借鉴意义.
支持向量机、用户分类、机器学习、特征提取
3
TP393;G35(计算技术、计算机技术)
国家自然科学基金重大课题“国家安全大数据综合信息集成与分析方法”71790612;国家自然科学基金青年项目“突发公共卫生事件社交媒体信息主题演化与影响力建模”71603189;国家自然科学基金青年项目“基于学术异质网络表示学习的知识群落发现”项目71804135的研究成果之一
2019-11-07(万方平台首次上网日期,不代表论文的发表时间)
共9页
1-9