10.3969/j.issn.1560-8999.2008.05.006
基于MST聚类的空间数据离群挖掘算法
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算法并不适用于空间数据库.本文提出了基于MST(Minimum Spanning Tree,最小生成树)聚类的空间数据离群挖掘算法(SOM);有机结合了最小生成树理论与密度的方法,既体现了空间离群的局部特性,又体现了空间离群的孤立程度.该算法通过MST维护空间数据的基本空间结构特征,通过打断MST中最不一致的边形成MST聚类,不仅具有密度的聚类方法能够聚集非球状簇和分布不均的数据集的特点,而且聚类结果不依赖于用户参数的选择,因此,离群挖掘结果更合理.最后,通过实例数据,验证了该算法的有效性,它适用于大规模空间数据集的离群挖掘.
SOM算法、聚类的离群、空间离群、MST聚类
10
TP3;TP1
国家自然科学基金项目"面向地学应用的时空多尺度数据挖掘研究"60602052;福建省自然科学基金项目"涉及障碍物和便利体约束条件的空间聚类研究"2006J0131;福建省科技计划重点项目"网格环境下知识服务的语义建模技术与应用"2005H086;福建省高等学校新世纪优秀人才支撑计划
2008-12-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
586-592