当前位置:网站首页>腾讯邱东洋:深度模型推理加速的术与道

腾讯邱东洋:深度模型推理加速的术与道

2022-04-23 20:04:00 智源社区

随着业务规模的不断发展,算法模型复杂度不断增加,实时性要求很高的场景,对在线推理优化提出很大挑战。本文将和大家分享腾讯智能对话产品中模型推理优化的常见方法和聚焦GPU推理的方法论。主要内容包括以下几大方面:

  • 背景介绍

  • 推理性能优化的常用方法

  • GPU并行加速的方法论

  • 总结

版权声明
本文为[智源社区]所创,转载请带上原文链接,感谢
https://hub.baai.ac.cn/views/16623