融合注意力机制和高效网络的糖尿病视网膜病变识别与分类

image-20230413155811814

一、简介

利用EfficientNet进行特征提取,采用迁移网络策略用DR的数据集对EfficientNet进行学习与训练,为了解决病变之间差异小的问题,在EfficientNet 输出结果上加入注意力机制,然后根据网络提取的特征进行分类,模型训练。结果:分类精准:97.2%,敏感性:95.6%,特异性:98.7%,kappa : 0.84

二、文章的复现前置知识

  1. EfficientNet卷积神经网络模型

  2. 迁移学习

  3. 数据增强和数据预处理

  4. Attention

三、文章的结构

  • summary

  • introduction

    • 介绍 diabetic retinopthy: DR病情背景
    • 介绍一下当下在diabetic retinopthy 上面的一些分类数据和他人的模型
  • 数据集的选择

    • Messidor数据集
  • method

    • 迁移学习:通过在imageNet 数据集上面进行EfficientNet的权重预训练,初始化权重

    • 选择小网络:综合数据集等因素选择参数比较少的网络EfficientNet

    • 注意力机制:把Efficient输出特征 F 作为 Attention 的输入,提高细节注意度

    • dropout:防止数据小而容易过拟合,在全连接层加入 dropout 进行随机失活处理

    • Adam优化器:选用良好的自适应学习率优化器Adam

    • 数据预处理

      • 去除黑色边缘,高斯平滑
      • 数据增强:随机旋转0~90进行数据增强
  • 实验结果分析

    • 和网络InceptionV3 进行对比,表明自己的模型优势

      image-20230413173506115

  • 结论

    image-20230413173652353

四、总结

  • 文章优点

    1. 文章结构清晰
    2. 文章使用的methed 使用的Attention 放在输出层,感觉可以试试看
    3. 文章的dropout 随机失活,可以防止过拟合
  • 文章缺点

    1. 文章的预处理有点简单,单纯的旋转数据增强度不高
  • 借鉴之处

    1. 借用文章结构,直接应用多个概念,直接水字数
    2. 文章的dorpout可以试试,我是用的ResNet50+Attention 感觉后面容易过拟合

五、复现

​ 文章具有可复现的可能,数据集+模型结构,但是在inmageNet 上面进行数据有点大,可能不能跑出预训练模型,结果可能不是很好(可以尝试)。