一种基于随机游走模型的多标签分类算法
在数据挖掘领域,传统的单分类和多分类问题已经得到了广泛的研究.但是多标签数据的普遍存在性和重要性直到近些年来才逐渐得到人们的关注.在多标签分类问题中,由于标签相关性的存在,传统的单分类和多分类问题的解决方法,无法简单地应用于多标签分类问题.文中提出了一种基于随机游走模型的多标签分类算法,称为多标签随机游走算法.首先,将多标签数据映射成为多标签随机游走图.当输入一个未分类数据时,建立一个多标签随机游走图系列.而后,对图系列中的每个图应用随机游走模型,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布.最后,基于多标签随机游走算法,文中给出了一种新的阈值学习算法.真实数据集上的实验表明,多标签随机游走算法可以有效地解决多标签分类问题.
多标签、分类算法、随机游走、阈值学习
33
TP181(自动化基础理论)
国家自然科学基金60803016;国家"九七三"重点基础研究发展规划项目基金2007CB310802,2009CB320706;国家"八六三"高技术研究发展计划项目基金2008AA042301,2007AA040602
2010-10-28(万方平台首次上网日期,不代表论文的发表时间)
共9页
1418-1426