基于LDA主题关联过滤的领域主题演化研究
[目的]发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹.[方法]根据文献出版时间划分多个时间窗口,通过LDA主题模型识别各个时间窗口中的主题;利用主题关联(Topic Association)过滤规则确定相邻时间窗口主题间的演化关系;形成连续时间段内主题新生、消亡、继承、分裂和合并的演化轨迹.[结果]在保证主题延续性的条件下,更准确地识别主题的新生、消亡、继承、分裂和合并的演化类型.[局限]固定的时间窗口,未考虑主题演化周期的多样性.[结论]该方法可以有效降低LDA主题模型中相似度较小主题的干扰,提升主题演化关系识别的准确性.
主题关联、主题演化、主题模型、LDA
TP393(计算技术、计算机技术)
本文系国家科技支撑计划子课题“基于文献知识网络的领域学术关系研究与示范”项目编号:2011BAH10B06-04的研究成果之一.
2015-04-23(万方平台首次上网日期,不代表论文的发表时间)
18-25