多标签代价敏感分类集成学习算法
尽管多标签分类问题可以转换成一般多分类问题解决,但多标签代价敏感分类问题却很难转换成多类代价敏感分类问题。通过对多分类代价敏感学习算法扩展为多标签代价敏感学习算法时遇到的一些问题进行分析,提出了一种多标签代价敏感分类集成学习算法。算法的平均错分代价为误检标签代价和漏检标签代价之和,算法的流程类似于自适应提升(Adaptive boosting, AdaBoost)算法,其可以自动学习多个弱分类器来组合成强分类器,强分类器的平均错分代价将随着弱分类器增加而逐渐降低。详细分析了多标签代价敏感分类集成学习算法和多类代价敏感AdaBoost 算法的区别,包括输出标签的依据和错分代价的含义。不同于通常的多类代价敏感分类问题,多标签代价敏感分类问题的错分代价要受到一定的限制,详细分析并给出了具体的限制条件。简化该算法得到了一种多标签AdaBoost 算法和一种多类代价敏感AdaBoost 算法。理论分析和实验结果均表明提出的多标签代价敏感分类集成学习算法是有效的,该算法能实现平均错分代价的最小化。特别地,对于不同类错分代价相差较大的多分类问题,该算法的效果明显好于已有的多类代价敏感AdaBoost算法。
多标签分类、代价敏感学习、集成学习、自适应提升算法、多分类
TP3;TN9
四川省科技支撑计划2011GZ0171,2012GZ0106资助@@@@Supported by the Key Technology Research and Develop-ment Program of Sichuan Province of China 2011GZ0171,2012GZ0106
2014-07-15(万方平台首次上网日期,不代表论文的发表时间)
共11页
1075-1085