当前位置:网站首页>卷积神经网络的推导过程
卷积神经网络的推导过程
2022-08-09 03:07:00 【白小李】
目录
前言
本此周报主要是对CNN的基本流程进行手动推导学习,进一步理解卷积网络的运行过程。同时温习整个卷积神经网络的运作机制。
一、基本流程
在卷积神经网中的输入x,通常是以矩阵进行输入,在下图中的输入矩阵,横数是“很好看呢!”这几个的个数,列数是词向量的维度,0.3、0.1、0.1,在词向量空间中就代表好字。在第一层卷积运算层中有3种fitter,而每种fitter有3个。在convolve之后,每一个fitter都会有一个卷积结果。之后经过激活层(activation),通过映射到高维度来解决分类以及其它问题。在卷积层之间周期性的引进池化 层(pooling),在减少训练参数数量的同时,防止过拟合的发生并从每一个fitter里面选出最大值,最后通过dropout层和输出层,将卷积后的结果输出来。
本质:神经网络中一层层的卷积本质上就是大量的卷积核在发挥不同的作用。
二、推导
1、初始化
首先convolve4×3的输入和2×3的background fitter,之后将得到的3×1的结果放进激活层中,在这个推导例子中,采用ReLu作为激活函数,经过激活函数的结果进行max pooling,进一步降低维度,得到一个1×1的结果,再将这个结果放入softmax layer进行多分类或者将某个值转化为激活概率。
此次优化的参数一共有8个,一个是background fitter上的6个参数以及线性层参数w1、w2。初始化如图所示。
2、正向计算(Forward)
4×3的输入卷积后得到的3×1的结果中,以1.6举例,0.4×1+0.7×1+0×1+0.3×1+0.1×1+0.1×1=1.6。同理1.4和2.5也是这么计算出来的。之后经过ReLu函数,大于0的时候是本身,小于0的时候是0。经过maxpooling留下最大的2.5这个node作为softmax的输入,最后得出概率分布。
3、反向传播(Backpropagation)
反向传播即先从后面开始算,首先算loss对O1求导,即预测概率减去实际标签,再loss对O2求导。
之后是算loss对W1求导,采用链式法则展开后,转换为对O1求导×O1对W1求导,同理对O2进行求导。
第三步算loss对Z求导。
接下来算maxpooling的梯度。
再算loss对S的梯度
最后一步是算卷积层的导数。在向量比较少的时候,可以通过向量展开计算。在CNN中算fitter的梯度可以被转化成一个反过来的卷积运算。
4、更新
最后进行更新两个w参数和6个u参数,学习率为1。此时便完成了一轮的参数更新
结论
对于卷积神经网络的推导过程有了一个大致的了解,下周计划对卷积的代码进行学习和复现,争取将卷积这部分从理论和实际方面都掌握好,以及对卷积神经网络中的激活函数再次进行学习。
边栏推荐
- hcip MPLS 实验
- Arrays and slices
- Promoting practice with competitions-Like the 84th biweekly game reflection and the 305th weekly game supplementary questions
- 【es6】教程 Symbol数据以及迭代器和生成器
- 【扫雷--1】
- Day021 图书管理系统(对象和数组)
- 【洛谷】P5091 【模板】扩展欧拉定理
- 【信号去噪】基于Sage-Husa自适应卡尔曼滤波器实现海浪磁场噪声抑制及海浪磁场噪声的产生附matlab代码
- C专家编程 第9章 再论数组 9.3 为什么C语言把数组形参当做指针
- 渗透测试-域环境下的信息收集
猜你喜欢
C专家编程 第9章 再论数组 9.6 C语言的多维数组
DSPE-PEG-OH,DSPE-PEG-Hydroxyl,磷脂-聚乙二醇-羟基仅供科研实验使用
【剑指offer】二进制中1的个数&&2的幂
grafana的panel点击title,没有反应,没有出现edit选项
Leetcode Brushing Questions - 148. Sort Linked List
Postman interface test [official website] latest version installation and use tutorial
2022-08-08 第五小组 顾祥全 学习笔记 day31-集合-IO流-File类
dice和iou
开发工程师必备————【Day05】UDP协议;进程的并发与并行
高并发+海量数据下如何实现系统解耦?【中】
随机推荐
深度学习:优化器
多御安全浏览安卓版升级尝鲜,新增下载管理功能
01| 数据类型
【洛谷】P5091 【模板】扩展欧拉定理
如何实现有状态转化操作
别了,IE浏览器
开发工程师必备————【Day05】UDP协议;进程的并发与并行
【扫雷--1】
Hudi从内核到实战介绍
【图像去噪】基于边缘增强扩散 (cEED) 和 Coherence Enhancing Diffusion (cCED) 滤波器实现图像去噪附matlab代码
Doris从理论详解到千万级数据量场景使用
CI/CD:持续集成/持续部署(难舍难分)
书签收藏难整理?这款书签工具管理超方便
Building PO layered architecture of automated testing framework from 0
C专家编程 第8章 为什么程序员无法分清万圣节和圣诞节 8.10 轻松一下---国际C语言混乱代码大赛
Leetcode Brushing Questions - 148. Sort Linked List
Ingress的概念和原理
C18-PEG- ALD批发_C18-PEG-CHO_C18-PEG-醛基
SQL注入(2)
Zabbix 5.0 监控教程(五)