文献阅读(2)
融合注意力机制和高效网络的糖尿病视网膜病变识别与分类
一、简介
利用EfficientNet进行特征提取,采用迁移网络策略用DR的数据集对EfficientNet进行学习与训练,为了解决病变之间差异小的问题,在EfficientNet 输出结果上加入注意力机制,然后根据网络提取的特征进行分类,模型训练。结果:分类精准:97.2%,敏感性:95.6%,特异性:98.7%,kappa : 0.84。
二、文章的复现前置知识
-
EfficientNet卷积神经网络模型
-
迁移学习
-
数据增强和数据预处理
-
Attention
三、文章的结构
-
summary
-
introduction
- 介绍 diabetic retinopthy: DR病情背景
- 介绍一下当下在diabetic retinopthy 上面的一些分类数据和他人的模型
-
数据集的选择
- Messidor数据集
-
method
-
迁移学习:通过在imageNet 数据集上面进行EfficientNet的权重预训练,初始化权重
-
选择小网络:综合数据集等因素选择参数比较少的网络EfficientNet
-
注意力机制:把Efficient输出特征 F 作为 Attention 的输入,提高细节注意度
-
dropout:防止数据小而容易过拟合,在全连接层加入 dropout 进行随机失活处理
-
Adam优化器:选用良好的自适应学习率优化器Adam
-
数据预处理:
- 去除黑色边缘,高斯平滑
- 数据增强:随机旋转0~90进行数据增强
-
-
实验结果分析
-
和网络InceptionV3 进行对比,表明自己的模型优势
-
-
结论
四、总结
-
文章优点
- 文章结构清晰
- 文章使用的methed 使用的Attention 放在输出层,感觉可以试试看
- 文章的dropout 随机失活,可以防止过拟合
-
文章缺点
- 文章的预处理有点简单,单纯的旋转数据增强度不高
-
借鉴之处
- 借用文章结构,直接应用多个概念,直接水字数
- 文章的dorpout可以试试,我是用的ResNet50+Attention 感觉后面容易过拟合
五、复现
文章具有可复现的可能,数据集+模型结构,但是在inmageNet 上面进行数据有点大,可能不能跑出预训练模型,结果可能不是很好(可以尝试)。
评论