10.3778/j.issn.1002-8331.2104-0111
注意力金字塔卷积残差网络的表情识别
人脸表情是人类内心情绪最真实最直观的表达方式之一,不同的表情之间具有细微的类间差异信息.因此,提取表征能力较强的特征成为表情识别的关键问题.为提取较为高级的语义特征,在残差网络(ResNet)的基础上提出一种注意力金字塔卷积残差网络模型(APRNET50).该模型融合金字塔卷积模块、通道注意力和空间注意力.首先用金字塔卷积提取图像的细节特征信息,然后对所提特征在通道和空间维度上分配权重,按权重大小定位显著区域,最后通过全连接层构建分类器对表情进行分类.以端到端的方式进行训练,使得所提网络模型更适合于精细的面部表情分类.实验结果表明,在FER2013和CK+数据集上识别准确率可以达到73.001%和94.949%,与现有的方法相比识别准确率分别提高了2.091个百分点和0.279个百分点,达到了具有相对竞争力的效果.
残差网络、金字塔卷积、注意力机制、表情识别、特征提取
58
TP391(计算技术、计算机技术)
贵州省科技计划项目2021
2022-11-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
123-131