当前位置:网站首页>全连接层的作用是什么?
全连接层的作用是什么?
2022-04-23 14:25:00 【小白学视觉】
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
来自 | 知乎
作者 | 魏秀参
地址 | https://www.zhihu.com/question/41037974/answer/150522307
编辑 | 机器学习算法与自然语言处理公众号
本文仅作学术分享,若侵权,请联系后台删文处理
全连接层到底什么用?我来谈三点。
全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。在实际使用中,全连接层可由卷积操作实现:对前层是全连接的全连接层可以转化为卷积核为1x1的卷积;而前层是卷积层的全连接层可以转化为卷积核为hxw的全局卷积,h和w分别为前层卷积结果的高和宽(注1)。
目前由于全连接层参数冗余(仅全连接层参数就可占整个网络参数80%左右),近期一些性能优异的网络模型如ResNet和GoogLeNet等均用全局平均池化(global average pooling,GAP)取代FC来融合学到的深度特征,最后仍用softmax等损失函数作为网络目标函数来指导学习过程。需要指出的是,用GAP替代FC的网络通常有较好的预测性能。具体案例可参见我们在ECCV 16(视频)表象性格分析竞赛中获得冠军的做法:「冠军之道」Apparent Personality Analysis竞赛经验分享 - 知乎专栏 ,project:Deep Bimodal Regression for Apparent Personality Analysis
在FC越来越不被看好的当下,我们近期的研究(In Defense of Fully Connected Layers in Visual Representation Transfer)发现,FC可在模型表示能力迁移过程中充当“防火墙”的作用。具体来讲,假设在ImageNet上预训练得到的模型为
,则ImageNet可视为源域(迁移学习中的source domain)。微调(fine tuning)是深度学习领域最常用的迁移学习技术。针对微调,若目标域(target domain)中的图像与源域中图像差异巨大(如相比ImageNet,目标域图像不是物体为中心的图像,而是风景照,见下图),不含FC的网络微调后的结果要差于含FC的网络。因此FC可视作模型表示能力的“防火墙”,特别是在源域与目标域差异较大的情况下,FC可保持较大的模型capacity从而保证模型表示能力的迁移。(冗余的参数并不一无是处。)
注1: 有关卷积操作“实现”全连接层,有必要多啰嗦几句。
以VGG-16为例,对224x224x3的输入,最后一层卷积可得输出为7x7x512,如后层是一层含4096个神经元的FC,则可用卷积核为7x7x512x4096的全局卷积来实现这一全连接运算过程,其中该卷积核参数如下:
“filter size = 7, padding = 0, stride = 1, D_in = 512, D_out = 4096”
经过此卷积操作后可得输出为1x1x4096。
如需再次叠加一个2048的FC,则可设定参数为“filter size = 1, padding = 0, stride = 1, D_in = 4096, D_out = 2048”的卷积层操作。
小白团队出品:零基础精通语义分割↓↓↓

下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


版权声明
本文为[小白学视觉]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_42722197/article/details/124358117
边栏推荐
- Matrix exchange row and column
- ie8 浏览器提示是否 阻止访问js脚本
- Solve the problem of SSH configuration file optimization and slow connection
- 矩阵交换行列
- IE8 browser prompts whether to block access to JS script
- Man man notes and @ reboot usage of crontab
- Docker篇 (五) MySQL的安装
- redis 模块编程中 key value的生命周期
- Detailed explanation of SAR command
- ArrayList集合基本使用
猜你喜欢

uni-app消息推送

C语言知识点精细详解——数据类型和变量【2】——整型变量与常量【1】

555 timer + 74 series chip to build eight way responder, 30s countdown, proteus simulation, etc

关于在vs中使用scanf不安全的问题

AT89C51单片机的数字电压表开发,量程0~5V,proteus仿真,原理图PCB和C程序等

XX project structure notes

Multisim Simulation Design of DC adjustable regulated power supply of LM317 (with simulation + paper + reference)

查找水仙花数-for循环实践

循环队列的基本操作(实验)

51单片机的直流电机PWM调速控制系统(附Proteus仿真+C程序等全套资料)
随机推荐
js 键值判断
基于单片机的DS18B20的数字温度监控报警系统设计【LCD1602显示+Proteus仿真+C程序+论文+按键设置等】
一些小小小小记录~
LM317的直流可调稳压电源Multisim仿真设计(附仿真+论文+参考资料)
Sed learning for application
矩阵交换行列
顺序栈的基本操作
错误:无法远程查找到密钥 “428F7ECC7117F726“
Man man notes and @ reboot usage of crontab
Upgrade of openssh and modification of version number
js 格式化时间
交通灯系统51单片机设计(附Proteus仿真、C程序、原理图及PCB、论文等全套资料)
Web page, adaptive, proportional scaling
Multisim Simulation Design of DC adjustable regulated power supply of LM317 (with simulation + paper + reference)
Arrays类的使用案例
Proteus simulation design of four storey and eight storey elevator control system, 51 single chip microcomputer, with simulation and keil c code
flannel 原理 之 TUN模式
Some little records~
关于在vs中使用scanf不安全的问题
Nacos uses demo as configuration center (IV)