当前位置:网站首页>Pytorch GPU模型推理时间探讨2——显卡warm up
Pytorch GPU模型推理时间探讨2——显卡warm up
2022-08-10 16:37:00 【pip install USART】
问题背景在上一篇文章里
还没看过上一篇的小伙伴可以戳这里
改进
步入正题,上文说到,每10批推理的第一批10次推理的时间都很慢,于是重新改写了一下代码,这次每个模型只进行10次推理,继续观察现象。结果以截图的形式给出:
结论
从这些结果来看,每个模型的前两次推理都很慢,尤其是第一次。到谷歌上找了一下原因,这是因为显卡需要warm-up,就是“热身”,这样才能发挥出显卡的性能。而至于后续的推理时间的计时仍有较大偏差,还是因为异步计时的问题,这个留着后面再解决。
关于热身,个人理解,显卡开始工作时控制单元需要对资源进行调度,例如分配warp等。这些应该都是在第一次推理的时候进行。类似的,举个栗子,在F1比赛中,每场赛车的正赛开始前,都会有一圈“暖胎圈”,各个车手依次起步,在赛道上不停画龙——连续左转右转——来对轮胎进行一定的磨损,使其与地面充分摩擦,来达到工作状态与工作温度,进一步使赛车达到最佳状态,跑出最好成绩。这就类似显卡的“warm-up”一样。
如果有说的不对的地方,还请路过的大佬评论区指正
边栏推荐
猜你喜欢
The sword refers to OfferⅡ 045. The bottommost leftmost value of the binary tree dfs
北海 Kraken:基于 Flutter 构建的高性能 Web 渲染引擎
WIZnet 物联网设计大赛 - WizFi360大赛延迟通知
重庆新壹汽与一汽集团达成新能源项目战略合作,赋能“碳中和”创造“碳财富”
数据可视化:Metabase
MySQL的使用演示及操作,MySQL数据字符集的设置
生成树协议(STP---Spanning Tree Protocol)
MySQL数据库完全备份与增量备份怎么实现
String compression (3) short string compression
深度学习培训二笔记
随机推荐
最详解决:jupyter notebook不会自动打开浏览器问题
Embedded Development: Embedded Basics - Mapping Peripherals Using Arrays of Pointers
自助服务知识库是什么?
【JDK】Oracle又一个JDK大版本停止扩展技术支持
LeetCode-922. Sort Array By Parity II
一种新的测试方法:视觉感知测试
【科研】常见火灾数据集
shell中判断文件目录是否存在
WIZnet 物联网设计大赛 - WizFi360大赛延迟通知
分享几个自动化测试的练手项目
Taurus.MVC WebAPI 入门开发教程4:控制器方法及参数定义、获取及基础校验属性【Require】。
v-show指令:切换元素的显示与隐藏
神经网络如何提高准确率,神经网络的求解方式
数据库注入提权总结(二)
如何将静图变gif动图?教你jpg合成gif的方法
聚焦企业流程智能化发展新趋势,中国信通院2022 RPA创新产业峰会即将开启
使用Jedis连接linux上的redis
C专家编程 第10章 再论指针 10.7 使用指针创建和使用动态数组
kuangbin专题一 简单搜索
The sword refers to OfferⅡ 045. The bottommost leftmost value of the binary tree dfs