当前位置:网站首页>深度学习调参的技巧
深度学习调参的技巧
2022-04-23 15:23:00 【moletop】
如何调参:
-
batchsize要合适
-
epoch要合适,观察收敛情况,防止过拟合
-
是否添加batch nomal
-
dropout是否需要
-
激活函数选择:除了gate之类的地方,需要把输出限制成0-1之外,尽量不要用sigmoid,可以用tanh或者relu之类的激活函数.1. sigmoid函数在-4到4的区间里,才有较大的梯度。之外的区间,梯度接近0,很容易造成梯度消失问题。2. 输入0均值,sigmoid函数的输出不是0均值的。
-
损失函数一轮加正则,一轮不加正则
-
优化器的选择:adam,adadelta等,在小数据上,实验的效果不如sgd, sgd收敛速度会慢一些,但是最终收敛后的结果,一般都比较好。如果使用sgd的话,可以选择从1.0或者0.1的学习率开始,隔一段时间,在验证集上检查一下,如果cost没有下降,就对学习率减半。 很多论文都这么搞,实验的结果也很不错. 当然,也可以先用ada系列先跑,最后快收敛的时候,更换成sgd继续训练.同样也会有提升.据说adadelta一般在分类问题上效果比较好,adam在生成问题上效果比较好。
-
ensemble
-
同样的参数,不同的初始化方式
-
不同的参数,通过cross-validation,选取最好的几组
k折交叉详解:https://www.cnblogs.com/henuliulei/p/13686046.html
-
同样的参数,模型训练的不同阶段,即不同迭代次数的模型。
-
不同的模型,进行线性融合. 例如RNN和传统模型.
-
版权声明
本文为[moletop]所创,转载请带上原文链接,感谢
https://blog.csdn.net/Leiroy/article/details/124241857
边栏推荐
- 我的 Raspberry Pi Zero 2W 折腾笔记,记录一些遇到的问题和解决办法
- Sword finger offer (2) -- for Huawei
- Leetcode exercise - 396 Rotation function
- 8.2 text preprocessing
- X509 certificate cer format to PEM format
- win10 任务栏通知区图标不见了
- How to use OCR in 5 minutes
- Nacos程序连接MySQL8.0+ NullPointerException
- A series of problems about the best time to buy and sell stocks
- Mysql连接查询详解
猜你喜欢
G007-HWY-CC-ESTOR-03 华为 Dorado V6 存储仿真器搭建
Leetcode167 - sum of two numbers II - double pointer - bisection - array - Search
What is the effect of Zhongfu Jinshi wealth class 29800? Walk with professional investors to make investment easier
Basic operation of circular queue (Experiment)
TLS / SSL protocol details (28) differences between TLS 1.0, TLS 1.1 and TLS 1.2
How does eolink help telecommuting
Thinkphp5 + data large screen display effect
T2 icloud calendar cannot be synchronized
Squid agent
Lotus DB design and Implementation - 1 Basic Concepts
随机推荐
免费在upic中设置OneDrive或Google Drive作为图床
Collation of errors encountered in the use of redis shake
Leetcode exercise - 396 Rotation function
Reptile exercises (1)
网站某个按钮样式爬取片段
asp. Net method of sending mail using mailmessage
Nuxt project: Global get process Env information
Detailed explanation of MySQL connection query
API gateway / API gateway (III) - use of Kong - current limiting rate limiting (redis)
setcontext getcontext makecontext swapcontext
What is the effect of Zhongfu Jinshi wealth class 29800? Walk with professional investors to make investment easier
Educational codeforces round 127 A-E problem solution
函数(第一部分)
8.2 text preprocessing
Tencent has written a few words, Ali has written them all for a month
Basic operation of sequential stack
regular expression
Kubernetes详解(九)——资源配置清单创建Pod实战
js——實現點擊複制功能
HJ31 单词倒排