10.3969/j.issn.1008-0821.2015.05.013
特征融合在微博数据挖掘中的应用研究
针对传统的微博聚类分析中,只单独针对微博阅读数、评论数等数据(下称微博结构化数据)进行分类或者单独针对由微博内容进行文本分词得到的分词数据(下称微博分词)进行分类的问题,本文采用了Kohonen聚类,研究结合微博结构化数据和微博分词的融合数据聚类的效果是否比单独对微博结构化数据或对微博分词聚类有所提高.实证数据实验结果显示,微博结构化数据单独聚类会出现一个类的标准差特别大(本文称为离群类),而对融合数据聚类,微博结构化数据则不会出现离群类;融合数据聚类结果对微博分词的影响不显著.
微博、聚类、融合数据
35
G250.78(图书馆学、图书馆事业)
2015-07-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
68-72,77