期刊专题

10.11925/infotech.2096-3467.2018.1207

基于机器学习的社交媒体用户分类研究

引用
[目的]充分利用社交媒体用户的个人多维度信息,研究用户自动分类问题.[方法]将社交媒体用户定义为个体民众、媒体、政府和组织4种类型,从用户多维度信息中提取人口统计学、命名和自我描述三组特征,构建基于机器学习算法的用户自动分类模型,在Twitter真实数据集上通过实验对比各分类算法性能,并分析各组特征的贡献度.[结果]支持向量机和随机梯度下降分类模型的准确率和召回率均在83%以上,命名、人口统计学和自我描述特征对于分类性能的影响依次递增.[局限]由于标注的用户数量有限,可能无法让模型充分学习用户特征,而且没有考虑不同类型用户数量的不均衡问题.[结论]基于支持向量机和随机梯度下降的分类模型能够较准确地识别出4种类型用户,对后续社交媒体用户划分研究具有借鉴意义.

支持向量机、用户分类、机器学习、特征提取

3

TP393;G35(计算技术、计算机技术)

国家自然科学基金重大课题“国家安全大数据综合信息集成与分析方法”71790612;国家自然科学基金青年项目“突发公共卫生事件社交媒体信息主题演化与影响力建模”71603189;国家自然科学基金青年项目“基于学术异质网络表示学习的知识群落发现”项目71804135的研究成果之一

2019-11-07(万方平台首次上网日期,不代表论文的发表时间)

共9页

1-9

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

3

2019,3(8)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn