期刊专题

10.7544/issn1000-1239.2016.20150131

一种基于信息熵的混合数据属性加权聚类算法

引用
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注。为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果。工作主要包括:首先为了更加准确客观地度量对象与类之间的差异性,设计了针对混合数据的扩展欧氏距离;然后,在信息熵框架下利用类内信息熵和类间信息熵给出了聚类结果中类内抱团性及一个类与其余类分离度的统一度量机制,并基于此给出了一种属性重要性度量方法,进而设计了一种基于信息熵的属性加权混合数据聚类算法。在10个 UCI 数据集上的实验结果表明,提出的算法在4种聚类评价指标下优于传统的属性未加权聚类算法和已有的属性加权聚类算法,并通过统计显著性检验表明本文提出算法的聚类结果与已有算法聚类结果具有显著差异性。

聚类分析、混合数据、属性加权、信息熵、相异性度量

53

TP391(计算技术、计算机技术)

国家自然科学基金项目61432011,U1435212,61402272;国家“九七三”重点基础研究发展计划基金项目2013CB329404;山西省自然科学基金项目2013021018-1 This work was supported by the National Natural Science Foundation of China61432011,U1435212,61402272;the National Basic Research Program of China 973 Program 2013CB329404;the Natural Science Foundation of Shanxi Province of China 2013021018-1.

2016-06-16(万方平台首次上网日期,不代表论文的发表时间)

共11页

1018-1028

暂无封面信息
查看本期封面目录

计算机研究与发展

1000-1239

11-1777/TP

53

2016,53(5)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn