10.3321/j.issn:1002-0470.2006.12.005
面向动态演化的话题检测研究
受CURE聚类算法的启发,在分析了动态演化特性的基础上,提出了一种面向动态演化特性的双质心话题模型,以解决话题动态演化特性对话题检测的影响.该模型动态地建立分界点,以其为界将话题表示成初始质心和当前质心两个质心.初始质心代表分界点之前话题所关注的内容,当前质心表示从分界点到当前时间之间话题所关注的内容.提出了基于时间和词分布密度两种不同的分界点确定方法.详细描述了分界点、初始质心、当前质心的建立及更新方法.最后对基于双质心话题模型的英语话题检测算法进行了研究探讨,通过实验证明了该算法的有效性.
话题检测、动态演化、双质心、分界点、分布密度
16
TN91
国家自然科学基金60435020;国家高技术研究发展计划863计划2004AA117010-08
2007-01-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
1230-1235