10.3969/j.issn.1002-1965.2020.08.026
基于PageRank和Node2 vec的研究热点与集群发现 ——以国际深度学习研究领域为例
[目的/意义]为有效挖掘领域研究热点与集群,规避单纯基于频次统计的热点排序方法所存在的弊端,以及基于高频关键词共词网络集群发现方法所带来的偏差.[方法/过程]提出利用无向加权PagaRank算法进行研究热点排序,综合考量关键词之间共现的数量和质量,同时强调全部关键词共词网络的重要性,综合Node2vec表示学习和t-SNE聚类算法对全部关键词进行集群发现,以国际深度学习领域研究文献为例,分别进行热点排序和集群发现.[结果/结论]研究表明PageRank算法不仅能够区分频次统计算法无法区分的排名,而且从整体网络结构衡量研究热点,综合考量共现的数量和质量,使排序结果更为准确;整合Node2vec和t-SNE算法进行研究集群发现,可有效改善单纯利用高频关键词进行集群发现的不足,避免在有限的关联密切的高频关键词之间强制分门别类;综合热点和集群发现方法,可在凸显热点的基础上描述集群细节,有效揭示集群脉络.
深度学习、热点排序、集群发现、Node2vec、PageRank
39
G353.1(情报学、情报工作)
国家自然科学基金重大研发计划重点支持项目"基于知识关联的金融大数据价值分析、发现及协同创造机制研究";中国博士后科学基金面上资助项目"基于动态知识图谱的学科主题演化预测研究"
2020-09-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
174-179,153