基于集成卷积神经网络和Vit的眼底图像分类研究
在眼底图像的分类任务中,卷积神经网络(CNN)的应用较为普遍,但随着Transformer应用的推进,Vit(Vision Transformer)模型在医学图像的领域上展现了更高的性能。然而Vit模型通常需要在大型数据集上预训练,受医学图像获取成本较高的限制。因此,本文提出一种基于EfficientNet-Vit集成模型的眼底图像分类方法,此方法将卷积神经网络模型EfficientNetV2-S和Vit模型相结合,分别使用两种完全不同的方法提取眼底图像的特征,通过自适应加权融合算法计算得到最优加权因子0.6和0.4,利用加权软投票法进行模型集成,从而获得更好的分类结果。实验证明,相比于集成前,集成后的模型分类准确率分别提高了0.5%和1.6%。
生物光学、眼科学、眼底疾病、图像分类、集成模型、加权融合、bio-optics、ophthalmology、fundus disease、image classification、ensemble model、weighted fusion
49
TP391;TP278;TP183
2022-10-17(万方平台首次上网日期,不代表论文的发表时间)
共1页
2007205