面向小样本文本分类的互学习原型网络
小样本文本分类方法大多依赖于单一原型进行训练和推理,容易受到噪声等因素的影响,从而导致泛化能力不足.对此,提出了一种用于小样本文本分类的互学习原型网络.在保留现有算法通过文本嵌入特征直接计算原型的基础上,引入了基于转换器的双向编码表征模型,将文本嵌入特征输入模型中以生成新的原型;然后,利用互学习算法使这2个原型相互约束并进行知识交换,以过滤掉不准确的语义信息.此过程旨在提升模型的特征提取能力,并通过2个原型的共同决策来提高分类精度.在小样本文本分类数据集上的实验结果证实了所提方法的有效性.实验结果表明,在FewRel小样本关系分类数据集上,所提方法在类别为5且样本为1的分类实验中较当前最优方法的精度提高了 2.97%,较类别为5且样本为5的分类实验中精度提高了 1.99%.
人工智能、文本分类、小样本学习、互学习、原型网络
47
TP391.1(计算技术、计算机技术)
国家自然科学基金;军委装备发展部技术基础项目
2024-08-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
30-35