10.3969/j.issn.1003-9775.2015.05.001
基于概率主题建模的新闻文本可视化综述
伴随着信息技术的发展, 传统纸质新闻逐渐向新媒体新闻转变. 与此同时, 近年来数据挖掘和自然语言处理等技术得到了极大的发展, 使得对新闻所蕴含丰富语义和主题进行深度挖掘成为可能. 然而, 信息的超载使得主题可视化成为一个新的挑战, 即如何以更好的方式来呈现海量互联网文本所蕴含的主题. 隐形语义分析(LDA)是近年来兴起的主题建模方法, 被当前学术界认为是主流的主题建模技术. 文中首先介绍以LDA为主的文本概率主题建模技术及其发展, 讨论了新闻主题建模特点; 随后概括对比新闻主题可视化的若干方法, 并对其进行分类, 分析不同方法的适用性和局限性; 最后对新闻主题可视化进行总结和展望.
概率图模型、主题建模、可视化
27
TP391(计算技术、计算机技术)
国家自然科学基金61402401, 61103099;浙江省自然科学基金LQ14F010004;中国工程科技知识中心建设项目;中央高校基本科研业务费专项资金2014FZA5014, 2014QNA5008
2015-07-16(万方平台首次上网日期,不代表论文的发表时间)
共12页
771-782