基于LDA主题模型的文献特征项多重共现可视化方法
文献计量学是运用数学和统计学方法对文献知识单元进行定量分析、揭示文献内部知识内容的一门科学.共现网络分析是文献计量研究中分析文献特征项数据关系的一种可视化方法,根据被分析特征项的数量分为单重共现网络分析和多重共现网络分析.与单重共现网络分析相比,多重共现网络分析增加了特征项的维度,对文献知识的呈现更加深入.但是,由于被分析特征项维度的增加,导致共现网络中的节点数量增多,节点间连线重合度和交叉频率过大,降低了文献计量可视化的效果.因此,目前文献计量共现网络分析主要以单重共现为主,多重共现网络分析可视化效果尚有待提升.为解决多重共现网络中节点过多、连线密度过大、不利于发现数据价值以及可视化效果较低等问题,引入LDA主题模型,采用空间划分的方法,将特征项全域可视化的问题转化为子空间可视化问题.首先,使用SATI文献题录信息分析软件抽取文献关键词,进行TF-IDF计算,以计算结果作为实验数据;其次,使用Python构建主题模型,对目标文献集合进行主题聚类分析;最后,使用Ucinet软件对不同主题子空间文献进行多重共现分析,并将子空间分析结果叠加和重构,完成多重共现可视化系统的结构化表达.结果表明:与原多重共现可视化方法相比,在内容呈现等价的前提下,基于LDA主题模型的多重共现可视化改进方法由于缩小了多重共现网络分析系统的规模,即子空间文献数量与特征词数目,因而降低了共现网络中的节点数量和节点间连线密度,使得多重共现可视化系统的结构更为清晰,增加了数据的可读性,突出了数据价值,有效提升了多重共现可视化效果.因此,多重共现可视化改进方法在一定程度上可以推进文献构成元素在多重组合知识挖掘方面的深入研究,提高不同领域文献计量的实证研究质量.
管理计量学、LDA主题模型、多重共现分析、Ucinet、可视化
43
G353.1(情报学、情报工作)
河北省自然科学基金;国家文化;旅游科技创新工程项目;河北省省级科技计划资助项目;河北省省级科技计划资助项目;河北省社会科学发展研究课题
2022-05-11(万方平台首次上网日期,不代表论文的发表时间)
共13页
181-193