双层随机游走半监督聚类?
半监督聚类旨在根据用户给出的必连和不连约束,把所有数据点划分到不同的簇中,从而获得更准确、更加符合用户要求的聚类结果.目前的半监督聚类算法大多数通过修改已有的聚类算法或者结合度规学习,使聚类结果与点对约束尽可能地保持一致,却很少考虑点对约束对周围无约束数据的显式影响程度.提出一种由在顶点上的低层随机游走和在组件上的高层随机游走两部分构成的双层随机游走半监督聚类算法,其中,低层随机游走主要负责计算选出的约束顶点对其他顶点的影响范围和影响程度,称为组件;高层随机游走则进一步将各个点对约束以自适应的强度在组件上进行约束传播,把它们在每个顶点上的影响综合在一个簇指示矩阵中.UCI 数据集和大型真实数据集上的实验结果表明,双层随机游走半监督聚类算法比其他半监督聚类算法更准确,也比较高效.
半监督聚类、点对约束、随机游走、组件、影响扩散
TP181(自动化基础理论)
国家自然科学基金61003180,61070047,61103018;江苏省自然科学基金BK2010318;江苏省教育厅自然科学基金13KJB520026,09KJB20013;江苏省研究生科技创新计划CXLX12_0917;扬州大学新世纪人才计划
2014-06-18(万方平台首次上网日期,不代表论文的发表时间)
共17页
997-1013