10.3778/j.issn.1002-8331.2111-0044
基于注意力及视觉Transformer的野外人脸表情识别
目前的人脸表情识别更关注包含面部遮挡、图像模糊等因素的野外图像而非实验室图像,且COVID-19的流行使得人们不得不在公共场合佩戴口罩,这给表情识别任务带来了新的挑战.受启发于最近Transformer在众多计算机视觉任务上的成功,提出了基于注意力及视觉Transformer的野外人脸表情识别模型,并率先使用CSWin Transformer作为主干网络.加入通道-空间注意力模块来提高模型对于全局特征的注意力.Sub-center ArcFace损失函数被用来进一步优化模型的分类能力.在两个公开的野外表情数据集RAF-DB和FERPlus上以及它们对应的口罩遮挡数据集上对所提出的方法进行了评估,识别准确率分别为88.80%、89.31%和76.12%、72.28%,提高了表情识别精度.
人脸表情识别、Transformer、注意力机制、Sub-center ArcFace
58
TP391.4(计算技术、计算机技术)
上海市科委地方院校能力建设项目;国家自然科学基金
2022-05-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
200-207