基于集成卷积神经网络和Vit的眼底图像分类研究

引用

摘要：

在眼底图像的分类任务中,卷积神经网络(CNN)的应用较为普遍,但随着Transformer应用的推进,Vit(Vision Transformer)模型在医学图像的领域上展现了更高的性能.然而Vit模型通常需要在大型数据集上预训练,受医学图像获取成本较高的限制.因此,本文提出一种基于EfficientNet-Vit集成模型的眼底图像分类方法,此方法将卷积神经网络模型EfficientNetV2-S和Vit模型相结合,分别使用两种完全不同的方法提取眼底图像的特征,通过自适应加权融合算法计算得到最优加权因子0.6和0.4,利用加权软投票法进行模型集成,从而获得更好的分类结果.实验证明,相比于集成前,集成后的模型分类准确率分别提高了0.5％和1.6％.

关键词：生物光学、眼科学、眼底疾病、图像分类、集成模型、加权融合

所属期刊栏目：49

分类号：TP391(计算技术、计算机技术)

资助基金：上海市科委产学研医项目15DZ1940400

在线出版日期：2022-11-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：102-110

英文信息展示

期刊专题