10.16511/j.cnki.qhdxxb.2021.22.015
集成加权软投票的众包真值推理方法
为了提高众包的质量并获取高质量的标注数据,已有许多基于真值推理的众包标注方法被提出.传统真值推理利用多噪声标签作为输入,通过聚合策略推断出真实标签,该过程只考虑了实例的标签而忽略了实例的特征,且忽略了不同工人对不同实例的标注质量.该文引入实例的特征以最大程度地挖掘实例中蕴含的有用信息.通过计算众包实例属于每一个类别的概率,得到新划分的众包数据集;提出一种基于元学习的集成分类器,在新数据集上训练并利用相似度计算得到工人权重,即工人对不同的实例有不同的标注能力;在投票模型的基础上引入工人权重,提出加权软投票的方法用于推测标签.在公开数据集和创建的数据集上的实验结果表明,所提出的方法优于现有的真值推理算法.
众包、特征、元学习、分类
62
TP311(计算技术、计算机技术)
国家重点研发计划;浙江省重点研发计划项目;国家自然科学基金
2022-03-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
347-354