高校网络舆情安全中主题分类方法研究——以新浪微博数据为例-期刊-万方数据知识服务平台

HEADERS

搜索

DOI: 10.11925/infotech.2096-3467.2018.0003

高校网络舆情安全中主题分类方法研究——以新浪微博数据为例

1.东北师范大学数学与统计学院长春130024;东北师范大学发展规划处长春1300242.东北师范大学信息科学与技术学院长春130024

引用

打印

摘要：[目的]通过一种特征加权方法解决高校新浪微博主题分类研究所面临的高维性和稀疏性问题.[方法]计算特征属于类别的概率,进一步预测文档属于类别的概率,使得特征由基于词的表示转换为基于类别的表示,最终采用支持向量机对转换后的特征矩阵进行分类.[结果]传统rf,tf×idf以及tf×rf三种方法在结合本文提出的方法后,在微平均F1/宏平均F1方面分别提升:7.2％/7.8％,7.5％/7.9％以及6.4％/5.7％.[局限]仅针对主题分类中特征加权方法进行探索,未对主题分类中其他部分展开研究.[结论]在高校网路舆情主题分类中,该方法可以有效地降低特征矩阵维度,同时提升分类能力与分类效率.

关键词：

网络舆情安全主题分类特征加权机器学习

分类号：

TP391.1(计算技术、计算机技术)

资助基金：

国家自然科学基金 ( Folksonomy71473035 ) 国家自然科学基金 ( 11501095 ) 吉林省科技厅科技攻关计划重点项目 ( 20150204040GX )

在线出版日期：

2018-09-07 （万方平台首次上网日期，不代表论文的发表时间）

页数：

8 (55-62)

英文信息

同项目论文

Folksonomy;71473035:国家自然科学基金

[1] 孙红光 , 藏润强 , 姬传德 ,等. 基于语义的聚焦爬虫算法研究 [J]. 东北师大学报（自然科学版） . 2018 ,50(2).51-57. DOI: 10.16163/j.cnki.22-1123/n.2018.02.010 .

[2] 孙红光 , 高星 , 孙铁利 ,等. 基于改进Single-Pass算法的网络新闻话题发现 [J]. 吉林大学学报（理学版） . 2018 ,56(1).114-118. DOI: 10.13413/j.cnki.jdxblxb.2018.01.19 .

[3] 张邦佐 , 王佳同 , 孙玮 ,等. 结合用户行为信息和信任传递的推荐算法 [J]. 东北师大学报（自然科学版） . 2017 ,49(4).71-75. DOI: 10.16163/j.cnki.22-1123/n.2017.04.014 .

[4] 臧雪峰 , 刘天琦 , 孙小新 ,等. 一种基于Bhattacharyya系数和项目相关性的协同过滤算法 [J]. 计算机科学 . 2017 ,44(12).52-57. DOI: 10.11896/j.issn.1002-137X.2017.12.010 .

[5] 杨凤芹 , 樊娜 , 孙红光 ,等. 段落及类别分布的特征选择方法 [J]. 小型微型计算机系统 . 2018 ,39(1).17-22. DOI: 10.3969/j.issn.1000-1220.2018.01.005 .

[6] 藏润强 , 孙红光 , 杨凤芹 ,等. 基于Levenshtein和TFRSF的文本相似度计算方法 [J]. 计算机与现代化 . 2018 ,(4).84-89. DOI: 10.3969/j.issn.1006-2475.2018.04.016 .

数据分析与知识发现

北大核心 CSSCI CSTPCD

ISSN：1003-3513

年,卷(期)：2018,2(7)

所属栏目：研究论文

FOOTERS