10.3969/j.issn.2095-2163.2023.05.003
改进的残差网络和混合注意力的人脸表情识别
针对传统残差网络对人脸表情特征提取存在的泛化能力差、识别准确度低等问题,本文实现了基于混合注意力机制和残差网络相结合的方法,从而能够更准确快速的实现对人脸表情进行识别.提出使用CABasicBlock代替ResNet34中的basic block作为骨干网络,并加入空间、通道注意力机制来提取人脸的全局面部特征,以及与表情重要关联的局部面部特征,使得网络收敛更快.在网络的残差模块后加入批量归一化和PReLU激活函数,以及在全连接层前加入了Dropout、全局平均池化,能有效预防训练过程发生过拟合,提升其泛化能力;引入Focal Loss函数平衡训练数据样本均衡性的问题,使用余弦退火策略对训练过程中的学习率进行动态衰减,从而减少训练时间.通过实验结果数据表明,在FER-2013测试数据集上的准确率为73.7%,说明此模型拥有更好的效果.最后,基于以上方法再结合OpenCV和PyQt5,构建了一个实时表情识别的可视化检测结果输出.
深度残差网络、CABasicBlock、表情识别、混合注意力机制、余弦退火策略
13
TP391.41(计算技术、计算机技术)
2023-05-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
9-17