10.3778/j.issn.1002-8331.2009.35.038
面向不均衡类别朴素贝叶斯犯罪案件文本分类
针对案件文本的特点,提出了具有针对性的特殊文本预处理方法,并比较了两种有效的特征选择方法.针对案件类别分布不均衡的特点,提出了改进的多变量贝努里模型.实验结果表明,改进的多变量贝努里模型有效地提高了案件文本分类的准确率.
文本分类、朴素贝叶斯、犯罪挖掘、多变量贝努里模型、多项式模型
45
TP301.6(计算技术、计算机技术)
浙江省重大科技攻关项目the Key Scientific and Technological Project of Zhejiang Province,2006C13109
2010-03-02(万方平台首次上网日期,不代表论文的发表时间)
共4页
126-128,131