10.13413/j.cnki.jdxblxb.2018.04.26
基于离群因子的不确定数据生成算法
基于不确定数据的表示模型,针对属性级不确定数据,提出一种不确定数据生成算法AC-UDGen(attribute level continuous uncertain data set generation algorithm).该算法通过引入离群点检测-LOF(local outlier factor)算法,用每个数据对象的离群因子作为参数来控制不确定数据对象的扰动范围,可很好地满足原始数据的分布特征,解决了目前工作中缺乏原始数据分布特征的问题.实验结果表明,该算法生成的不确定数据集具有更好的聚类效果,并降低了离群点对聚类结果的影响,使每个数据对象MBR(minimum bounding rectangle)的大小可根据自身的分布特征自适应地变化.
不确定数据、表示模型、离群因子、AC-UDGen算法
56
TP391(计算技术、计算机技术)
吉林省科技厅重大科技项目20160203010GX;吉林省发改委产业创新专项基金20170505MA2
2018-08-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
925-932