一种直推式多标记文档分类方法
真实世界的文档往往同时属于多个类别,因此,利用多标记学习技术进行文档分类是一个重要的研究方向,现有多标记文档分类方法需要利用大量有正确分类标记的文档才能获得好的分类性能,然而,在实际应用中往往只能得到少量的有标记文档作为分类所需的训练文档.出于利用未标记文档的想法,提出一种基于随机游走的直推式多标记文档分类方法,可以利用大量的未标记文档来辅助提高分类性能,实验结果表明,该方法的性能优于现有直推式多标记分类方法CNMF.
文档分类、多标记学习、直推学习、未标记文档、随机游走
45
TP181(自动化基础理论)
国家自然科学基金项目60505013,60721002;国家"八六三"高技术研究发展计划基金项目2007AA012169;全国优秀博士学位论文作者专项基金项目200343
2009-02-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
1817-1823