基于代价敏感集成分类器的长方法检测
长方法(Long Method)是由于一个方法太长而需要重构的软件设计的问题.为了提高传统机器学习方法对长方法的识别率,针对代码坏味数据不平衡的特性,提出代价敏感集成分类器算法.以传统决策树算法为基础,利用欠采样策略对样本进行重采样,进而生成多个平衡的子集,并将这些子集训练生成多个相同的基分类器,然后将这些基分类器组合形成一个集成分类器.最后在集成分类器中引入由认知复杂度决定的误分类代价,使得分类器向准确分类少数类倾斜.与传统机器学习算法相比,此方法对长方法检测结果的查准率和查全率均有一定提升.
长方法、代码坏味、代价敏感、认知复杂度
45
TP311(计算技术、计算机技术)
2018-12-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
497-500