10.3778/j.issn.1002-8331.2012.30.007
语言自然节奏在文本分类中的研究与应用
大规模文体分类是一个非常复杂的任务.提出了一种基于语言自然节奏的文本分类方法,通过对语言中标点标记的自然节奏进行分析,获取其特征,应用贝叶斯分类器,可以快速高效地完成文本分类任务.这种文本分类方法与当前主流基于词条特征的文本分类方法不同,不需要理解和分析语义,即无需分析文章中的词条,特征空间小,数据稀疏性现象不明显,文本分类效果显著.
文本分类、标点符号、语言自然节奏、状态转移
48
TP18(自动化基础理论)
天津市高等学校科技发展基金项目20110819
2012-12-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
28-32