面向网络论坛的高质量主题发现
提出了一种通用的高质量主题发现框架.在该框架下,利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题.提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,周来评价被抽取特征的重要性.在腾讯论坛数据集上进行了大量的实验.实验结果表明,该框架能够很好地发现高质量主题.提出的特征抽取算法、特征选择算法以及高质量主题发现框架能够在很多Web2.0领域得到应用,例如,博客、社会网络平台等.
网络论坛、高质量、特征选择、特征抽取、分类
22
TP311(计算技术、计算机技术)
国家自然科学基金60933005,60903139;国家高技术研究发展计划8632007AA01Z438
2011-12-19(万方平台首次上网日期,不代表论文的发表时间)
共20页
1785-1804