复杂文本网数据的主题建模进展
文中介绍了大规模文本网数据的主题建模研究的特点和近年来的重要进展.主题建模方法吸引了世界范围的广泛兴趣,并且促进了许多重要的数据挖掘、计算机视觉和计算生物应用系统的发展,包括文本自动摘要、信息检索、信息推荐、主题检测和追踪、自然场景理解、人体动作识别以及微阵列基因表达分析等.文中重点介绍文本网数据的4个主要特点以及对应的主题模型.文本网数据含有动态、高阶、多通路及分布式的结构,而之前的主题模型仅对部分的结构进行建模.而文中讨论了在三维马尔可夫模型的框架下统一对文本网数据的4个结构特点进行建模,并分析了结合三维马尔可夫模型和二型模糊系统对分布式单词计算和主题建模应用的可能性.除了对文本网数据的结构建模之外,还讨论了一些对三维马尔可夫模型能量最小化的机器学习算法.
主题模型、文本网数据、数据挖掘、单词计算、二型模糊系统
35
TP391(计算技术、计算机技术)
国家自然科学基金61003154,61003259,61170124;复旦大学上海智能信息处理重点实验室课题IIPL-2010-009;江苏省高校自然科学研究重大项目基金12KJA520004
2013-03-13(万方平台首次上网日期,不代表论文的发表时间)
共15页
2431-2445