DOI：10.3969/j.issn.1671-1815.2018.28.014

一种基于最大间隔的偏标记学习算法

引用

摘要：

在机器学习中,偏标记学习是一类重要的弱监督学习框架;在该框架中训练示例不再具有单一明确的标记,每个训练示例的真实标记被隐藏在一个候选标记集中并且在学习过程中不可获知.为了解决从训练示例的候选标记集中学习真实标记的问题,基于最大间隔准则提出了一种新的偏标记学习算法;该算法是通过优化模型在候选标记集中最大输出与非候选标记集中最大输出之间的间隔,以及优化模型在候选标记集中最大输出与候选标记集中其他输出之间的间隔进行偏标记学习.采用改进的次梯度Pegasos算法完成模型参数的优化学习.在四组人工改造的UCI数据集中,在平均65％的情况下优于其他对比算法.在四组真实偏标记数据集中,相比其他对比算法,取得了4.4％～10.2％的性能提升.实验证明,具有更好的泛化性能.

关键词：偏标记学习、最大间隔准则、弱监督学习、Pegasos算法、分类

所属期刊栏目：18

分类号：TP391.75(计算技术、计算机技术)

资助基金：国家自然科学基金61703299,61403273,61402319;山西省自然科学基金201601D202044

在线出版日期：2018-11-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：109-115

英文信息展示

期刊专题