处理不平衡数据分类时,传统模糊系统对少数类样本识别率较低.针对这一问题,首先,在前件参数学习上,提出了竞争贝叶斯模糊聚类(Bayesian fuzzy clustering based on competitive learning,BFCCL)算法,BFCCL算法考虑不同类别样本聚类中心间的排斥作用,采用交替迭代的执行方式并通过马尔科夫蒙特卡洛方法获得模型参数最优解.其次,在后件参数学习上,基于大间隔的策略并通过参数调节使得少数类到分类面的距离大于多数类到分类面的距离,该方法能有效纠正分类面的偏移.基于上述思想以0阶TSK型模糊系统为具体研究对象构造了适用于不平衡数据分类问题的0阶TSK型模糊系统(0-TSK-IDC).人工和真实医学数据集实验结果表明,0-TSK-IDC在不平衡数据分类问题中对少数类和多数类均具有较高的识别率,且具有良好的鲁棒性和可解释性.
不平衡数据、分类、马尔科夫蒙特卡洛、Takagi-Sugeno-Kang型模糊系统
43
TP1;O21
国家自然科学基金61502058,61572085,61572236;江苏省自然科学基金资助BK20160187;中央高校基本科研业务费专项资金资助项目JUSRP51614A;National Natural Science Foundation of China61502058,61572085,61572236;Natural Science Foundation of Jiangsu Province under GrantBK20160187;Fundamental Research Funds for the Central UniversitiesJUSRP51614A