主题模型在主题演化方法中的应用研究进展
[目的]对基于主题模型的演化方法进行梳理与分析,总结各方法优缺点及在情报分析领域的适用性.[文献范围]从Google Scholar、Web of Science中以“Topic/Theme Evolution”、“Time Topic Model”、“Dynamic TopicModel”为关键词/主题词进行文献检索,结合引文查询,经阅读后筛选出25篇作为本文的参考文献.[方法]采用文献分析法,对比各模型实现机制与功能特征,总结不同种类模型的优缺点及适用领域.[结果]目前的主题演化模型主要在可变主题数、支持在线分析、连续时间窗三个维度进行实现,大多数系统具备1-2个功能,基本可以满足情报分析的应用需求.[局限]对一些模型的具体实现分析不够深入.[结论]不同来源、不同粒度、不同时间窗的演化分析应该针对具体应用需求,结合模型特点使用相应的主题模型演化方法.
主题模型、LDA、主题演化
TP391(计算技术、计算机技术)
本文系“十二五”国家科技支撑计划课题“基于STKOS的科技监测应用示范”项目编号:2011BAH10B06-02、国家自然科学基金项目“基于语义的医学领域前沿知识发现及演化机制研究”项目编号:71303259和教育部人文社会科学研究一般项目“基于决策树的热点识别与趋势预测方法研究”项目编号:11YJC870008的研究成果之一.
2014-12-01(万方平台首次上网日期,不代表论文的发表时间)
63-69