10.3772/j.issn.2095-915x.2016.04.004
AToT 模型可视化工具开发
随着科研人员需要处理的文献集规模的日益庞大,以LDA 为代表的主题模型能够从语义层面挖掘大规模文献集中隐含的主题,因此,LDA 主题模型的应用越来越广泛。LDA 模型仅仅关注文献集的内容,而忽略了文献其他重要的外部信息,AToT 模型在LDA 主题模型的基础上引入了文献作者和文献发表时间两个属性,使AToT 模型不仅可以挖掘文献中隐含的信息,还可以分析文献作者的研究兴趣及文献主题随时间的变化。AToT 模型对文献集建模的结果是以概率矩阵的形式呈现,不能直观、全面、清晰的呈现挖掘出来的信息,特别是对数据挖掘不熟悉的科研人员,因此,本文开发了一个基于AToT 模型的可视化系统,该可视化系统清晰、美观地展现了AToT 模型中文献、主题、作者、时间、词项间的关系。如文档中的主题分布、主题的词项分布、作者的研究兴趣分布、主题的相似主题和主题的演化趋势等。
LDA 模型、AToT 模型、可视化、Django
2
G35;TP39(情报学、情报工作)
国家自然科学基金项目基于论文和专利资源的技术机会发现研究71403255;“十二五”国家科技支撑计划项目面向科技情报分析的信息服务资源开发与支撑技术研究2015BAH25F01;中国工程科技知识中心建设项目“知识组织体系建设”CKCEST-2016-2-10资助。
2016-11-18(万方平台首次上网日期,不代表论文的发表时间)
共10页
20-29