10.3969/j.issn.1002-1965.2015.04.024
国内微博研究热点分析及主题挖掘*--以计算机和图书情报学科为研究对象
以CNKI数据库中计算机和图书情报学科的核心期刊论文及硕博士学位论文为研究对象,以共词分析法和主题模型为工具,首先从数据集中提取并确定能够反映当前国内关于微博研究的重要关键词,然后采用SPSS的层次聚类法和LDA主题挖掘模型分别对共词矩阵和主题词向量进行定量分析,归纳出国内微博研究的热门知识点和重要主题,并对研究热点和研究主题进行宏观剖析,认为当前国内微博研究主要呈现出用户、内容和应用的三层结构特点。最后通过比较热点分析与主题挖掘的结果发现,国内的主要成果集中在微博内容层面的研究,涉及了情感分析、短文本处理、信息处理技术、主题发现、事件检测和信息挖掘等几个方面。
微博、共词分析、主题挖掘、LDA
G350;TP393(情报学、情报工作)
教育部人文社会科学研究青年项目“微博热点事件发现及其内容自动摘要研究”14YJC870021;“基于社会网络分析的微博传播趋势预测及干预策略研究”13YJCZH258;广东省科技计划项目“基于数据挖掘的旅游电子商务平台的关键技术研究”2012B031400016;广东省普通高校科技创新项目“面向网络英文文本的涉华舆情分析关键技术研究”2013KJCX0071的研究成果。
2015-05-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
127-132