期刊专题

基于改进LLE的高维数据离散化方法

引用
连续特征值离散化在数据挖掘、机器学习和模式识别等领域显得尤为重要.目前,现有的离散化方法主要处理低维数据,然而,现实世界中往往存在的是高维非线性数据.基于此,提出一种基于改进局部线性嵌入(LLE)的高维数据离散化方法——ILLE-HD3方法.首先,通过考虑数据的类信息对LLE方法进行改进,使其有效降维,以便于数据在低维空间中离散化.其次,在降维的基础上,提出了基于差异-相似集合(DSS)的连续特征值离散化算法,该算法利用类与特征之间的关联程度来决定连续城中断点的选取位置,并通过DSS理论定义分类错误标准,以控制连续域划分过程中产生的信息损失.最后,使用决策树分类工具C4.5和C5.0进行性能分析,结果表明,提出的ILLE-HD3方法处理高维非线性数据时具有较好的效果,与现有的方法相比,得到了较高的分类精度.

高维数据、局部线性嵌入、离散化、类-特征相互关联、差异-相似集合

42

TP18(自动化基础理论)

广东省省级教学管理A类课题20120101005;广东省经济和信息化委员会项目201210110600232

2015-09-07(万方平台首次上网日期,不代表论文的发表时间)

共6页

146-150,157

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

42

2015,42(z1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn