最近要学做一些关于低剂量重建得工作,花了两天时间专门看了一下SRCNN[1]的论文,以下是自己学习的一些总结。
首先,SRCNN的网络结构如下:

SRCNN是一个用于图像图像超分辨的CNN网络,也是用CNN做超分辨的开山之作。在原文中,作者设计了一个三层的全卷积神经网络。SRCNN算法流程如下:
1.首先对输入的低分辨率的图像使用双三次插值放大至目标尺寸。
2.将低分辨率图像输入三层卷积神经网络。
在SRCNN的训练过程中,作者采用平均均方差(MSE:mean squared error)来作为损失函数,并且为了在训练过程中避免边界效应,并未对图像进行填充。在训练过程中前两层的学习率设为0.0001,最后一层学习率为0.00001。在训练过程中,图片采用的是YCbCr格式的图像,并只对Y通道的图像进行超分辨处理,因此输入的通道数c=1。通过对比不同的数据集以及网络结构,作者得到如下结论。
1.大量的数据集会对训练的结果有一定提升作用,但提升作用不像其他视觉任务那样明显。
2.增加网络的宽度(filter数量)会显著的提升训练结果。
3.增加filter的size可以收集更丰富的结构信息,从而得到更好的结果。
4.增加网络层数不会对结果有明显的提升作用,反而会增加训练的难度。
5.在RGB图像上实现最好的效果,与单通道(Y-only)相比提升并不明显。加入CrCb反而不利于训练。
网友评论