当前位置：网站首页>去噪论文阅读——[RIDNet, ICCV19]Real Image Denoising with Feature Attention

去噪论文阅读——[RIDNet, ICCV19]Real Image Denoising with Feature Attention

2022-04-23 05:44:00 【umbrellalalalala】

知乎同名账号同步发表

一、架构参数详解

这部分先讲架构，下部分讲架构中比较关键的部分的motivation。
在这里插入图片描述

网络架构的细节已经标注在图中了。图的上半部分是总架构，下半部分是单独一个EAM的架构。

输入noisy image，输出noise-free image。

作者将架构分为了三个module：

feature extraction: $f_0=M_e(x)$ ，只有一层。
feature learning residual module: $f_r=M_{fl}(f_0)$ ，由若干EAM组成。
reconstruction module: $\hat{y}=M_r(f_r)$ ，只有一层。

loss function是：
$L(w)=\frac{1}{N}\sum_{i=1}^{N}||RIDNet(x_i)-y_i||_1=\frac{1}{N}\sum_{i=1}^{N}|RIDNet(x_i)-y_i|$

kernel size除了上图中比较细的那个卷积是 $1\times1$ ，其他所有都是 $3\times3$ 。

关于channel，几乎所有的卷积层都是64，除了下面这个结构中的一层下采样是4：
在这里插入图片描述
这个是channel-wise的feature attention，下面是展开之后的样子：

（注意上图少画了soft-shrinkage，作者在 $H_D$ 之后使用了它）
上图中的d，作者采用的是16，所以导致经过 $H_D$ 之后获得了唯一一个channel为4的feature map，其他所有层的channel都是64的。
️注意：最后的那个相乘是element-wise的，由于两者的size不同，所以需要先进行自适应的相乘，即将 $\times 1 \times c$ 的部分扩充为 $\times w \times c$ （adaptively rescaled），扩充方式是复制。

论文中notation和缩写有很多，其中ERB(enhanced residual block)指的就是：
在这里插入图片描述
上图这个比较细的卷积层就是整个架构唯一一个 $1\times1$ 的卷积层，其他所有卷积都是 $3\times3$ 的。
其他notation和缩写大多在上文的图中有标注，没标注的也比较简单，就不说了。

二、Contribution&innovation

先简要说一下，然后对重要地方，在下部分细讲。

作者表示他们的contribution如下：

是第一个在去噪中使用了feature attention的模型；
现有的model增加深度可能并不提升performance，并且造成梯度消失；
这是个one stage model（对比CBDNet是two stage model），说人话就是架构只有一个去噪阶段（对比CBDNet有估计噪声、去噪两个阶段）。

说一下第二个增加深度不增加性能，作者还表示：