主动贝叶斯分类方法研究
在对实际数据进行分类求解时,往往会遇到大量未带类别标注的样本,现有的经典分类方法常采用先标注缺失样本,再进行分类,存在耗时且分类精度差等问题.为此,提出一种基于主动学习思想贝叶斯分类方法RANB. 引入主动学习旨在减少评价样本所需代价,提高分类器性能. RANB方法在主动学习策略的基础上融入条件熵和分类损失的思想,可以有效抑制不确定样本所带来的误差.实验表明,该方法与朴素贝叶斯分类器等经典方法相比,在保证分类性能的前提下,可有效地减少学习所需的样本数量,尤其是对于未带类别标志的样本,更是有其优越性.
数据挖掘、机器学习、朴素贝叶斯分类器、主动学习、条件熵
44
TP18(自动化基础理论)
安徽省自然科学基金050420207
2008-06-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
47-51