当前位置:网站首页>CVPR 2022 优质论文分享
CVPR 2022 优质论文分享
2022-04-23 15:32:00 【极链AI云】
CVPR 2022 优质论文分享
A ConvNet for the 2020s
论文:https://arxiv.org/abs/2201.0354
代码:https://github.com/facebookresearch/ConvNeXt
2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可以被用做其他视觉任务的骨干网络,ViT变得更火了。本文探究卷积网络到底输在了哪里,卷积网络的极限在哪里。在本文中,作者逐渐向ResNet中增加结构(或使用trick)来提升卷积模型性能,最终将ImageNet top-1刷到了87.8%。作者认为本文所提出的网络结构是新一代(2020年代)的卷积网络(ConvNeXt),因此将文章命名为“2020年代的卷积网络”。
Incremental Transformer Structure Enhanced Image Inpainting with Masking Positional Encoding
论文:https://arxiv.org/abs/2203.00867
代码:https://github.com/DQiaole/ZITS_inpainting
近年来,图像修复取得了重大进展。然而,恢复具有生动纹理和合理结构的损坏图像仍然具有挑战性。由于卷积神经网络 (CNN) 的感受野有限,一些特定的方法只能处理常规纹理,而会丢失整体结构。另一方面,基于注意力的模型可以更好地学习结构恢复的远程依赖性,但它们受到大图像尺寸推理的大量计算的限制。为了解决这些问题,本文建议利用额外的结构恢复器来逐步促进图像修复。所提出的模型在固定的低分辨率草图空间中使用强大的基于注意力的 Transformer 模型来恢复整体图像结构。
Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
论文:https://arxiv.org/pdf/2203.00962.pdf
代码:https://github.com/zhaozhengChen/ReCAM
本文介绍了一种非常简单高效的方法:使用名为 ReCAM 的 softmax 交叉熵损失 (SCE) 重新激活具有 BCE 的收敛 CAM。给定一张图像,本文使用 CAM 提取每个类的特征像素,并使用它们与类标签一起使用 SCE 学习另一个全连接层(在主干之后)。收敛后,本文以与 CAM 中相同的方式提取 ReCAM。由于 SCE 的对比性质,像素响应被分解为不同的类别,因此预期的掩码模糊性会更小。对 PASCAL VOC 和 MS COCO 的评估表明,ReCAM 不仅可以生成高质量的遮罩,还可以在任何 CAM 变体中以很少的开销支持即插即用。
版权声明
本文为[极链AI云]所创,转载请带上原文链接,感谢
https://blog.csdn.net/m0_60673947/article/details/124352826
边栏推荐
- What exactly does the distributed core principle analysis that fascinates Alibaba P8? I was surprised after reading it
- Precautions for use of dispatching system
- 木木一路走好呀
- PHP PDO ODBC loads files from one folder into the blob column of MySQL database and downloads the blob column to another folder
- Llvm - generate if else and pH
- Detailed explanation of MySQL connection query
- What are the mobile app software testing tools? Sharing of third-party software evaluation
- Nacos程序连接MySQL8.0+ NullPointerException
- T2 icloud calendar cannot be synchronized
- Sword finger offer (1) -- for Huawei
猜你喜欢
Today's sleep quality record 76 points
函数(第一部分)
我的树莓派 Raspberry Pi Zero 2W 折腾笔记,记录一些遇到的问题和解决办法
Kubernetes详解(十一)——标签与标签选择器
The wechat applet optimizes the native request through the promise of ES6
API gateway / API gateway (III) - use of Kong - current limiting rate limiting (redis)
移动金融(自用)
Reptile exercises (1)
setcontext getcontext makecontext swapcontext
Detailed explanation of redirection and request forwarding
随机推荐
自主作业智慧农场创新论坛
电脑怎么重装系统后显示器没有信号了
MySQL installation process (steps for successful installation)
Node. JS ODBC connection PostgreSQL
C language super complete learning route (collection allows you to avoid detours)
Deeply learn the skills of parameter adjustment
Special analysis of China's digital technology in 2022
Detailed explanation of C language knowledge points - data types and variables [2] - integer variables and constants [1]
Byte interview programming question: the minimum number of K
MultiTimer v2 重构版本 | 一款可无限扩展的软件定时器
深度学习——超参数设置
kubernetes之常用Pod控制器的使用
What is CNAs certification? What are the software evaluation centers recognized by CNAs?
Adobe Illustrator menu in Chinese and English
Llvm - generate if else and pH
fatal error: torch/extension. h: No such file or directory
网站某个按钮样式爬取片段
What role does the software performance test report play? How much is the third-party test report charged?
深度学习调参的技巧
Krpano panorama vtour folder and tour