基于模糊聚类的网络论坛热点话题挖掘
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.
网络论坛(BBS)、热点话题挖掘、模糊聚类、帖子线索
34
TP181(自动化基础理论)
国家自然科学基金资助项目60473135,60773084,J0724003,60603023;教育部博士点基金资助项目20070151009
2013-09-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
52-54,58