10.3778/j.issn.1002-8331.2008.27.048
基于代表熵的基因表达数据聚类分析方法
针对基因表达数据样本少,维数高的特点,尤其是在样本分型缺乏先验知识的情况下,结合自组织特征映射的优点提出了基于代表熵的双向聚类算法.该算法首先通过自组织特征映射网络(SOM)对基因聚类,根据波动系数挑选特征基因.然后根据代表熵的大小判断基因聚类的好坏,并确定网络的神经元个数.最后采用FCM(Fuzzy C Means)聚类算法对挑选出的特征基因集进行样本分型.将该算法用于两组公开的基因表达数据集,实验结果表明该算法在降低特征维数的同时,得出了较高的聚类准确率.
代表熵、波动系数、自组织特征映射网络算法、基因表达数据
44
TP311(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60674029
2008-12-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
151-153