10.11925/infotech.2096-3467.2017.1058
基于LDA主题模型的文献关联分析及可视化研究
[目的]基于机器学习进行有效的科研主题发现与分析建模研究.[方法]以LDA主题模型为基础进行科研主题发现,通过Python语言实现分析建模,关联分析科研主题的年代、机构、基础研究与应用研发等信息,对比披露了各年代、机构的研发重点及基础研究和应用研究的差异,并对结果进行可视化.[结果]基于101 813条石墨烯领域的论文和专利数据进行实证分析,结果表明通过建模进行12个主题的发现、关联分析及其可视化全流程可在很短时间(约2分钟)内完成,通过机器学习的手段突破了传统分析工具以及数据分析体量的局限性,提升了针对大量文本数据信息挖掘及分析的效率.[局限]尚未探讨主题间关联关系权重及主题演进等涉及复杂网络分析的内容.[结论]机器学习对情报分析有着无限可能,需要基于实际需求开发更多有效的分析模型,满足大文本分析和可视化.
LDA主题模型、数据分析、机器学习、Python、数据可视化
2
TP393(计算技术、计算机技术)
2018-06-07(万方平台首次上网日期,不代表论文的发表时间)
共9页
98-106