当前位置:网站首页>CVPR 2022 | QueryDet:使用级联稀疏query加速高分辨率下的小目标检测
CVPR 2022 | QueryDet:使用级联稀疏query加速高分辨率下的小目标检测
2022-04-23 20:04:00 【智源社区】
虽然在过去的几年中,基于深度学习的通用目标检测已经取得了巨大的成功,但在检测小目标的性能和效率方面却远远不能令人满意。推广小目标检测最常见和有效的方法是使用高分辨率图像或特征图。然而,这两种方法都会导致昂贵的计算,因为计算成本会随着图像和特征大小的增加而增加。
我们提出了 QueryDet,它使用一种新颖的查询机制来加快基于特征金字塔的目标检测器的推断速度。该 pipeline 由两个步骤组成:首先在低分辨率特征上预测小目标的粗定位,然后利用这些粗位置稀疏引导的高分辨率特征计算出准确的检测结果。这样既可以获得高分辨率 feature map 的 benefit,又可以避免对背景区域使用较少的计算量。
在 popular COCO 数据集上,该方法将 mAP 提高了 1.0,mAP-small 提高了2.0,将高分辨率的推理速度平均提高到 3.0×。在包含更多小对象的 VisDrone 数据集上,我们获取了新的 SOTA,同时获得了平均 2.3× 高分辨率的加速。
论文标题:QueryDet: Cascaded Sparse Query for Accelerating High-Resolution for Small Object Detection
论文链接:https://arxiv.org/abs/2103.09136
代码链接:https://github.com/ChenhongyiYang/QueryDet-PyTorch
版权声明
本文为[智源社区]所创,转载请带上原文链接,感谢
https://hub.baai.ac.cn/views/16620
边栏推荐
- VeraCrypt文件硬盘加密使用教程
- 山东大学软件学院项目实训-创新实训-网络安全靶场实验平台(七)
- Mysql database - single table query (II)
- 【webrtc】Add x264 encoder for CEF/Chromium
- @MapperScan与@Mapper
- MySQL数据库 - 数据库和表的基本操作(二)
- Speex Wiener filter and rewriting of hypergeometric distribution
- Comment créer un pass BEP - 20 sur la chaîne BNB
- 指针数组与数组指针的区分
- MySQL syntax collation (5) -- functions, stored procedures and triggers
猜你喜欢
[webrtc] add x264 encoder for CEF / Chromium
Openharmony open source developer growth plan, looking for new open source forces that change the world!
JVM的类加载过程
【webrtc】Add x264 encoder for CEF/Chromium
【文本分类案例】(4) RNN、LSTM 电影评价倾向分类,附TensorFlow完整代码
Mfcc: Mel frequency cepstrum coefficient calculation of perceived frequency and actual frequency conversion
Possible root causes include a too low setting for -Xss and illegal cyclic inheritance dependencies
精简CUDA教程——CUDA Driver API
Zero base to build profit taking away CPS platform official account
山东大学软件学院项目实训-创新实训-网络安全靶场实验平台(五)
随机推荐
Kubernetes entry to mastery - bare metal loadbalance 80 443 port exposure precautions
【文本分类案例】(4) RNN、LSTM 电影评价倾向分类,附TensorFlow完整代码
高效的串口循环Buffer接收处理思路及代码2
Thoughts on the optimization of examination papers in the examination system
一个简单的(基于redisson的)分布式同步工具类封装
Grafana 分享带可变参数的链接
Design of warehouse management database system
Use test of FFT and IFFT library functions of TI DSP
The difference between underline and dot of golang import package
FFT物理意义: 1024点FFT就是1024个实数,实际进入fft的输入是1024个复数(虚部为0),输出也是1024个复数,有效的数据是前512个复数
Virtual machine performance monitoring and fault handling tools
php参考手册String(7.2千字)
渤海期货这家公司怎么样。期货开户办理安全?
Introduction to electron tutorial 3 - process communication
[text classification cases] (4) RNN and LSTM film evaluation Tendency Classification, with tensorflow complete code attached
对普通bean进行Autowired字段注入
Is meituan, a profit-making company with zero foundation, hungry? Coupon CPS applet (with source code)
Data analysis learning directory
Easy mock local deployment (you need to experience three times in a crowded time. Li Zao will do the same as me. Love is like a festival mock)
Unity创建超写实三维场景的一般步骤