10.3778/j.issn.1002-8331.1107-0441
结构特征和内容分析融合的博客文章分类
针对博客文章内容上,包含多个主题,类别归属不明显,多为作者自己主观意见且结构上,包括不同于文本的标签,普通文本分类方法直接应用于博客文章效果不理想的问题,提出一种结构特征和内容分析融合的博客文章分类方法.内容上,通过迭代两种不同特征选择方法,提高特征集代表性的前提下,利用正文,标题两个方面分类.结构上,利用博客文章特有的标签分类,并将三个方面融合.实验结果表明,改进的分类方法有效地提高了博客文章分类的性能.
文本分类、博客文章分类、结构特征、内容分析
49
TP391(计算技术、计算机技术)
2013-07-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
123-126,173