期刊专题

10.11925/infotech.2096-3467.2018.0003

高校网络舆情安全中主题分类方法研究——以新浪微博数据为例

引用
[目的]通过一种特征加权方法解决高校新浪微博主题分类研究所面临的高维性和稀疏性问题.[方法]计算特征属于类别的概率,进一步预测文档属于类别的概率,使得特征由基于词的表示转换为基于类别的表示,最终采用支持向量机对转换后的特征矩阵进行分类.[结果]传统rf,tf×idf以及tf×rf三种方法在结合本文提出的方法后,在微平均F1/宏平均F1方面分别提升:7.2%/7.8%,7.5%/7.9%以及6.4%/5.7%.[局限]仅针对主题分类中特征加权方法进行探索,未对主题分类中其他部分展开研究.[结论]在高校网路舆情主题分类中,该方法可以有效地降低特征矩阵维度,同时提升分类能力与分类效率.

网络舆情安全、主题分类、特征加权、机器学习

2

TP391.1(计算技术、计算机技术)

国家自然科学基金项目“基于网络结构演化的Folksonomy模式中社群知识组织与知识涌现研究”71473035;国家自然科学基金青年科学基金项目“基于贝叶斯图模型的海量短文本数据统计推断”11501095;吉林省科技厅重点科技攻关项目“基于异构信息网络融合社会关系的电子商务推荐系统关键技术研究与开发”项目20150204040GX的研究成果之一

2018-09-07(万方平台首次上网日期,不代表论文的发表时间)

共8页

55-62

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2

2018,2(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn