10.3964/j.issn.1000‐0593(2019)04‐1307‐05
利用融合数据分布特征的模糊双支持向量机对恒星光谱分类
恒星光谱分类是天文学研究的一个热点问题.随着观测光谱数量的急剧增加,传统的人工分类无法满足实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类.关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类.其中,支持向量机(SVM )分类能力突出,被广泛应用于恒星光谱分类.该方法试图在两类样本之间找到一个最优分类面将两类分开.该方法具有较高的时间复杂度,计算效率有限.双支持向量机(TWSVM )的出现有效地解决了SVM面临的效率问题.该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面.TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注.但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升.鉴于此,在双支持向量机的基础上,提出融合数据分布特征的模糊双支持向量机(TWSVM‐SDP) .该方法引入线性判别分析(LDA )的类间离散度和类内离散度,用以表征光谱数据的分布性状;引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响.在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM 、双支持向量机TWSVM等传统分类方法相比,融合数据分布特征的模糊双支持向量机 TWS‐VM‐SDP具有更优的分类能力.该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据.接下来将利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究.
恒星光谱、分类、数据分布特征、模糊隶属度、双支持向量机
39
TP391(计算技术、计算机技术)
国家自然科学基金项目U1731128 ,11803080 ,山西省自然科学基金项目201601D011042 ,山西省高等学校创新人才支持计划2016 ,中北大学杰出青年基金支持计划2017
2019-12-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
1307-1311