10.3778/j.issn.1002-8331.2011.12.062
面向电信欠费挖掘的数据质量评估策略研究
针对电信欠费挖掘主题,结合电信欠费数据非平衡的特点,重点研究了缺失与离群数据对分类结果的影响,从而提出了一个面向电信欠费挖掘的数据质量评估体系(TIM-DQAS):对于缺失评估,提出了一种基于类分布差异的属性加权算法,以衡量输入属性的缺失代价;对于离群评估,分析了非平衡数据中的离群点对分类结果的影响,提出离群度的概念,以量化离群点的影响.基于某城市电信小灵通数据的对比实验,给出了评估结果的参照值,验证了评估策略的有效性.
电信、数据挖掘、欠费主题、数据质量评估、缺失、非平衡、离群度
47
TP274(自动化技术及设备)
国家高技术研究发展计划863the National High-Tech Research and Development Plan of China under Grant 2008AA042902,2009AA04Z162;高等学校学科创新引智111计划资助B07031
2011-07-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
220-224,233