基于节点内容及拓扑结构的引文网络社团划分
引文网络的社团划分是文本挖掘的一种重要方法,为提高引文网络社团划分的准确性,本文提出一种综合考虑引文网络的内容和拓扑结构属性的社团划分方法.该算法首先利用改进的余弦相似度方法计算节点相似度,然后综合考虑节点结构与内容相似度对网络进行重构,在此基础上以相邻节点对相似度作为边权,运用Louvain社团划分方法对加权引文网络进行社团划分,提出一种综合考虑节点内容及结构属性的社团划分方法.通过在真实引文网络数据集上的实验表明,本文所提出的方法能改善引文网络的划分效果.
引文网络、社团划分、聚类、文本挖掘、文本相似度
G350(情报学、情报工作)
本文系“国家高技术研究发展计划863计划——微生物数字资源知识管理系统构建及关键技术研究”2014AA021503和中国科学院2013年度“西部之光”人才培养计划“引文耦合网络演化分析及在科技评价与预测中的应用研究”科发人字[2013]165号3-6的成果之一.
2017-02-28(万方平台首次上网日期,不代表论文的发表时间)
89-97