基于集成卷积神经网络和Vit的眼底图像分类研究
在眼底图像的分类任务中,卷积神经网络(CNN)的应用较为普遍,但随着Transformer应用的推进,Vit(Vision Transformer)模型在医学图像的领域上展现了更高的性能.然而Vit模型通常需要在大型数据集上预训练,受医学图像获取成本较高的限制.因此,本文提出一种基于EfficientNet-Vit集成模型的眼底图像分类方法,此方法将卷积神经网络模型EfficientNetV2-S和Vit模型相结合,分别使用两种完全不同的方法提取眼底图像的特征,通过自适应加权融合算法计算得到最优加权因子0.6和0.4,利用加权软投票法进行模型集成,从而获得更好的分类结果.实验证明,相比于集成前,集成后的模型分类准确率分别提高了0.5%和1.6%.
生物光学、眼科学、眼底疾病、图像分类、集成模型、加权融合
49
TP391(计算技术、计算机技术)
上海市科委产学研医项目15DZ1940400
2022-11-28(万方平台首次上网日期,不代表论文的发表时间)
共9页
102-110