当前位置:网站首页>CVPR 2022 优质论文分享
CVPR 2022 优质论文分享
2022-04-23 15:32:00 【极链AI云】
CVPR 2022 优质论文分享
A ConvNet for the 2020s
论文:https://arxiv.org/abs/2201.0354
代码:https://github.com/facebookresearch/ConvNeXt

2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可以被用做其他视觉任务的骨干网络,ViT变得更火了。本文探究卷积网络到底输在了哪里,卷积网络的极限在哪里。在本文中,作者逐渐向ResNet中增加结构(或使用trick)来提升卷积模型性能,最终将ImageNet top-1刷到了87.8%。作者认为本文所提出的网络结构是新一代(2020年代)的卷积网络(ConvNeXt),因此将文章命名为“2020年代的卷积网络”。
Incremental Transformer Structure Enhanced Image Inpainting with Masking Positional Encoding
论文:https://arxiv.org/abs/2203.00867
代码:https://github.com/DQiaole/ZITS_inpainting

近年来,图像修复取得了重大进展。然而,恢复具有生动纹理和合理结构的损坏图像仍然具有挑战性。由于卷积神经网络 (CNN) 的感受野有限,一些特定的方法只能处理常规纹理,而会丢失整体结构。另一方面,基于注意力的模型可以更好地学习结构恢复的远程依赖性,但它们受到大图像尺寸推理的大量计算的限制。为了解决这些问题,本文建议利用额外的结构恢复器来逐步促进图像修复。所提出的模型在固定的低分辨率草图空间中使用强大的基于注意力的 Transformer 模型来恢复整体图像结构。
Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
论文:https://arxiv.org/pdf/2203.00962.pdf
代码:https://github.com/zhaozhengChen/ReCAM

本文介绍了一种非常简单高效的方法:使用名为 ReCAM 的 softmax 交叉熵损失 (SCE) 重新激活具有 BCE 的收敛 CAM。给定一张图像,本文使用 CAM 提取每个类的特征像素,并使用它们与类标签一起使用 SCE 学习另一个全连接层(在主干之后)。收敛后,本文以与 CAM 中相同的方式提取 ReCAM。由于 SCE 的对比性质,像素响应被分解为不同的类别,因此预期的掩码模糊性会更小。对 PASCAL VOC 和 MS COCO 的评估表明,ReCAM 不仅可以生成高质量的遮罩,还可以在任何 CAM 变体中以很少的开销支持即插即用。

版权声明 
                        本文为[极链AI云]所创,转载请带上原文链接,感谢
                        https://blog.csdn.net/m0_60673947/article/details/124352826
                    
边栏推荐
- 字节面试 transformer相关问题 整理复盘
- Hj31 word inversion
- Machine learning - logistic regression
- Byte interview programming question: the minimum number of K
- What role does the software performance test report play? How much is the third-party test report charged?
- X509 certificate cer format to PEM format
- 控制结构(一)
- Differential privacy (background)
- Openstack theoretical knowledge
- Precautions for use of dispatching system
猜你喜欢
 - Mysql database explanation (IX) 
 - Have you really learned the operation of sequence table? 
 - Sword finger offer (1) -- for Huawei 
 - Mysql database explanation (10) 
 - Detailed explanation of kubernetes (XI) -- label and label selector 
 - What exactly does the distributed core principle analysis that fascinates Alibaba P8? I was surprised after reading it 
 - 2022年中国数字科技专题分析 
![Detailed explanation of C language knowledge points -- data types and variables [1] - carry counting system](/img/95/3b38a550e78b3467c4a756af073d0a.png) - Detailed explanation of C language knowledge points -- data types and variables [1] - carry counting system 
 - 机器学习——逻辑回归 
 - Sword finger offer (2) -- for Huawei 
随机推荐
- Independent operation smart farm Innovation Forum 
- Advantages, disadvantages and selection of activation function 
- 机器学习——逻辑回归 
- Example of time complexity calculation 
- C语言超全学习路线(收藏让你少走弯路) 
- fatal error: torch/extension.h: No such file or directory 
- cadence SPB17.4 - Active Class and Subclass 
- How to use OCR in 5 minutes 
- T2 icloud calendar cannot be synchronized 
- After time judgment of date 
- php函数 
- 深度学习调参的技巧 
- tcp_ Diag kernel related implementation 1 call hierarchy 
- Functions (Part I) 
- redis-shake 使用中遇到的错误整理 
- Introduction to dynamic programming of leetcode learning plan day3 (198213740) 
- Sword finger offer (1) -- for Huawei 
- 如果conda找不到想要安装的库怎么办PackagesNotFoundError: The following packages are not available from current 
- KNN, kmeans and GMM 
- Nacos程序连接MySQL8.0+ NullPointerException