主动贝叶斯分类方法研究

引用

摘要：

在对实际数据进行分类求解时,往往会遇到大量未带类别标注的样本,现有的经典分类方法常采用先标注缺失样本,再进行分类,存在耗时且分类精度差等问题.为此,提出一种基于主动学习思想贝叶斯分类方法RANB. 引入主动学习旨在减少评价样本所需代价,提高分类器性能. RANB方法在主动学习策略的基础上融入条件熵和分类损失的思想,可以有效抑制不确定样本所带来的误差.实验表明,该方法与朴素贝叶斯分类器等经典方法相比,在保证分类性能的前提下,可有效地减少学习所需的样本数量,尤其是对于未带类别标志的样本,更是有其优越性.

关键词：数据挖掘、机器学习、朴素贝叶斯分类器、主动学习、条件熵

所属期刊栏目：44

分类号：TP18(自动化基础理论)

资助基金：安徽省自然科学基金050420207

在线出版日期：2008-06-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：47-51

英文信息展示

期刊专题