当前位置:网站首页>精度、速度完美平衡,最新图像分割SOTA模型重磅发布!!!
精度、速度完美平衡,最新图像分割SOTA模型重磅发布!!!
2022-04-23 12:47:00 【Tom Hardy】
支撑影视人像抠图、医疗影像分析、自动驾驶感知等万亿级市场背后的核心技术是什么?那就要说到顶顶重要的图像分割技术。相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代,也是智能视觉算法工程师拥有关键核心竞争力的关键!
图1 图像分割应用
正因如此,DeepLabv3、OCRNet、BiseNetv2、Fast-SCNN等优秀算法层出不穷,然而在实际产业落地过程中往往需要综合考虑硬件性能、精度等多方面因素,对算法的需求也是苛刻的。往往业界算法在保障高识别精度的情况下,就会牺牲算法运行速度;反之追求速度,则会带来精度的大幅度损失。
图2 各算法速度与精度平衡情况示意
如何能同时实现速度和精度的均衡,在当前云、边、端多场景协同的产业大趋势下高标准满足产业需求,是各届研究人员致力投入的方向。
PP-LiteSeg就是这样一个同时兼顾精度与速度的SOTA(业界最佳)语义分割模型。它基于Cityscapes数据集,在1080ti上精度为mIoU 72.0时,速度高达273.6 FPS , (mIoU 77.5 时,FPS为102.6),超越现有CVPR SOTA模型STDC,真正实现了精度和速度的SOTA均衡。
图3 PP-LiteSeg精度/速度说明
空口无凭,欢迎优秀的你直接试用! (记得Star收藏跟进最新状态)
传送门:
https://github.com/PaddlePaddle/PaddleSeg
更值得令人惊喜的是,PP-LiteSeg不仅在开源数据集评测效果优秀,在产业数据集也表现出了惊人的实力!例如在质检、遥感场景,PP-LiteSeg的精度与高精度、大体积的OCRNet持平,而速度却快了近7倍!!!
图4 PP-LiteSeg和OCRNet在某工业质检数据集识别情况对比
图4 PP-LiteSeg和OCRNet在deepglobe数据集识别情况对比
那PP-LiteSeg为何可以拥有这么优秀的效果呢?
PP-LiteSeg提出三个创新模块:灵活的解码模块(FLD)、注意力融合模块(UAFM)、简易金字塔池化模块(SPPM)。FLD灵活调整解码模块中通道数,平衡编码模块和解码模块的计算量,使得整个模型更加高效;UAFM模块效地加强特征表示,更好地提升了模型的精度;SPPM模块减小了中间特征图的通道数、移除了跳跃连接,使得模型性能进一步提升。
图5 PP-LiteSeg 模型结构和优化点
正是基于这些模块的设计与改进,最终PP-LiteSeg超越其他方法,在1080ti上精度为mIoU 72.0时,速度高达273.6 FPS , (mIoU 77.5 时,FPS为102.6),实现了精度和速度的SOTA平衡。更多关于PP-LiteSeg的内容,请参考:
https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.5/configs/pp_liteseg
为了让开发者们更深入的了解PP-LiteSeg这个SOTA模型,解决落地应用难点,掌握产业实践的核心能力,飞桨团队精心准备了精品直播课!
扫码报名直播课
进入技术交流群
4月26日20:30,百度资深高工将为我们详细介绍精度和速度平衡的PP-LiteSeg,对其原理及使用方式进行拆解,更有汽车金属垫片缺陷分割实战,加上直播现场互动答疑,还在等什么!抓紧扫码上车吧!
【引用说明】
图1
1.辅助驾驶图片来源百度地图APP AR导航截图
2.3D分割数据集来源于MRISpineSeg spine dataset
3.人像抠图源于百度飞桨内部工作人员
4.遥感图像源于中科星图 GEOVIS iBrain空天大数据智能解译产品
图4:合作伙伴提供质检数据样例
图5:源于deepglobe数据集
END
版权声明
本文为[Tom Hardy]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_29462849/article/details/124358189
边栏推荐
- BUUCTF WEB [BJDCTF2020]ZJCTF,不过如此
- [csnote] ER diagram
- 【vulnhub靶场】-dc2
- Markdown语法学习
- Web17 -- use of El and JSTL
- How to prevent the website from being hacked and tampered with
- Qt绘制图像
- [daily question] chessboard question
- NPDP | how can product managers not be excluded by programmers?
- Jiachen chapter Genesis "inner universe" joint Edition
猜你喜欢
基于卷积神经网络的遥感影像分类识别系统
No idle servers? Import OVF image to quickly experience smartx super fusion community version
Realize several "Postures" in which a box is horizontally and vertically centered in the parent box
实现一个盒子在父盒子中水平垂直居中的几种“姿势”
NPDP | how can product managers not be excluded by programmers?
Redis deployment of cloud native kubesphere
在线计算过往日期天数,计算活了多少天
Object. The disorder of key value array after keys
航芯技术分享 | ACM32 MCU安全特性概述
QT interprocess communication
随机推荐
STM32CubeProgrammer基础使用说明
BaseRecyclerViewAdapterHelper 实现下拉刷新和上拉加载
洛谷P3236 [HNOI2014]画框 题解
[vulnhub range] - DC2
力扣刷题之完全二叉树的节点个数
Redis deployment of cloud native kubesphere
BUUCTF WEB [GXYCTF2019]禁止套娃
SSL certificate refund instructions
Web17 -- use of El and JSTL
消息队列概述
What are the forms of attack and tampering on the home page of the website
Resolve disagrees about version of symbol device_ create
Metalama简介4.使用Fabric操作项目或命名空间
A graphic designer's fantasy world | ones characters
Markdown grammar learning
How does sqlserver insert or update the number of weeks of the day instead of text
Try the server for one month for free, and attach the tutorial
XinChaCha Trust SSL Organization Validated
MySQL函数-递归函数
Qt绘制图像