当前位置：网站首页>研究生新生培训第四周：MobileNetV1, V2, V3

研究生新生培训第四周：MobileNetV1, V2, V3

2022-08-04 00:10:00 【Fanshoo】

PART 1：论文阅读和视频学习

一、MobileNet V1 & V2 & V3

1.MobileNet V1

mobilenetv1的一个主要特点是网络所需要的参数很少，以至于在手机这种移动设备上都可以跑，在准确率小幅度降低的代价下，可以再次大幅度减少我们的参数量。

其中的一个主要亮点为采用了DW卷积，很大程度上减少了运算量和参数数量。

同时也使用了PW卷积，一种卷积核为1*1的卷积，从输入到输出可以改变维度，dw和pw通常是一起使用的。

dw和pw的使用可以大大减少参数量，通常是普通卷积参数的1/8-1/9。

$\alpha$ 指是卷积核的倍率，值越大，则使用的卷积核数量越多， $\alpha$ 就算大幅度降低，准确率也不会降低太多，但是参数量会大幅度降低。 $\beta$ 指的是输入的图像的尺寸图像的大小从224到128，准确率小幅度降低，但是参数量会大幅度降低。

2.MobileNet V2

MobileNet V2 最主要的改动为采用了倒残差结构 ,与ResNet不同，这里采用的激活函数为ReLu6.

第二个主要的改动为，在最后一层1*1卷积后，采用了线性链接，relu激活函数在低维度的信息会造成较大的损失，高维信息造成的损失很小，就使用一个线性的激活函数，防止损失太多的信息。

3.MobileNet V3

MobileNet V3 中最主要的改动是引入了SE注意力机制

二、SENet

1.Squeeze ：顺着空间维度来进行特征压缩，将每个二维的特征通道变成一个实数，这个实数某种程度上具有全局的感受野，并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布，而且使得靠近输入的层也可以获得全局的感受野，这一点在很多任务中都是非常有用的

2.Excitation ：它是一个类似于循环神经网络中门的机制。通过参数来为每个特征通道生成权重，其中参数被学习用来显式地建模特征通道间的相关性。

3.Reweight ：将Excitation的输出的权重看做是进过特征选择后的每个特征通道的重要性，然后通过乘法逐通道加权到先前的特征上，完成在通道维度上的对原始特征的重标定。

上左图是将SE模块嵌入到Inception结构的一个示例。方框旁边的维度信息代表该层的输出。

除此之外，SE 模块还可以嵌入到含有skip-connections 的模块中。上右图是将SE 嵌入到ResNet模块中的一个例子，操作过程基本和SE-Inception一样，只不过是在Addition前对分支上Residual的特征进行了特征重标定。如果对Addition后主支上的特征进行重标定，由于在主干上存在0~1的scale操作，在网络较深BP优化时就会在靠近输入层容易出现梯度消散的情况，导致模型难以优化。

目前大多数的主流网络都是基于这两种类似的单元通过repeat方式叠加来构造的。由此可见，SE 模块可以嵌入到现在几乎所有的网络结构中。通过在原始网络结构的building block 单元中嵌入SE模块，我们可以获得不同种类的SENet。如SE-BN-Inception、SE-ResNet、SE-ReNeXt、SE-Inception-ResNet-v2等等。