当前位置:网站首页>CVPR 2022 优质论文分享
CVPR 2022 优质论文分享
2022-04-23 15:32:00 【极链AI云】
CVPR 2022 优质论文分享
A ConvNet for the 2020s
论文:https://arxiv.org/abs/2201.0354
代码:https://github.com/facebookresearch/ConvNeXt
2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可以被用做其他视觉任务的骨干网络,ViT变得更火了。本文探究卷积网络到底输在了哪里,卷积网络的极限在哪里。在本文中,作者逐渐向ResNet中增加结构(或使用trick)来提升卷积模型性能,最终将ImageNet top-1刷到了87.8%。作者认为本文所提出的网络结构是新一代(2020年代)的卷积网络(ConvNeXt),因此将文章命名为“2020年代的卷积网络”。
Incremental Transformer Structure Enhanced Image Inpainting with Masking Positional Encoding
论文:https://arxiv.org/abs/2203.00867
代码:https://github.com/DQiaole/ZITS_inpainting
近年来,图像修复取得了重大进展。然而,恢复具有生动纹理和合理结构的损坏图像仍然具有挑战性。由于卷积神经网络 (CNN) 的感受野有限,一些特定的方法只能处理常规纹理,而会丢失整体结构。另一方面,基于注意力的模型可以更好地学习结构恢复的远程依赖性,但它们受到大图像尺寸推理的大量计算的限制。为了解决这些问题,本文建议利用额外的结构恢复器来逐步促进图像修复。所提出的模型在固定的低分辨率草图空间中使用强大的基于注意力的 Transformer 模型来恢复整体图像结构。
Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
论文:https://arxiv.org/pdf/2203.00962.pdf
代码:https://github.com/zhaozhengChen/ReCAM
本文介绍了一种非常简单高效的方法:使用名为 ReCAM 的 softmax 交叉熵损失 (SCE) 重新激活具有 BCE 的收敛 CAM。给定一张图像,本文使用 CAM 提取每个类的特征像素,并使用它们与类标签一起使用 SCE 学习另一个全连接层(在主干之后)。收敛后,本文以与 CAM 中相同的方式提取 ReCAM。由于 SCE 的对比性质,像素响应被分解为不同的类别,因此预期的掩码模糊性会更小。对 PASCAL VOC 和 MS COCO 的评估表明,ReCAM 不仅可以生成高质量的遮罩,还可以在任何 CAM 变体中以很少的开销支持即插即用。
版权声明
本文为[极链AI云]所创,转载请带上原文链接,感谢
https://blog.csdn.net/m0_60673947/article/details/124352826
边栏推荐
- 服务器中毒了怎么办?服务器怎么防止病毒入侵?
- API gateway / API gateway (III) - use of Kong - current limiting rate limiting (redis)
- Nacos program connects to mysql8 0+ NullPointerException
- Connectez PHP à MySQL via aodbc
- API gateway / API gateway (II) - use of Kong - load balancing
- Multitimer V2 reconstruction version | an infinitely scalable software timer
- Squid agent
- 自动化测试框架常见类型▏自动化测试就交给软件测评机构
- The El tree implementation only displays a certain level of check boxes and selects radio
- Sword finger offer (2) -- for Huawei
猜你喜欢
Openstack command operation
Sword finger offer (1) -- for Huawei
激活函数的优缺点和选择
KNN, kmeans and GMM
Have you really learned the operation of sequence table?
Basic operation of sequential stack
asp. Net method of sending mail using mailmessage
Basic operation of circular queue (Experiment)
TLS / SSL protocol details (28) differences between TLS 1.0, TLS 1.1 and TLS 1.2
Analysis of common storage types and FTP active and passive modes
随机推荐
Special analysis of China's digital technology in 2022
API gateway / API gateway (II) - use of Kong - load balancing
网站某个按钮样式爬取片段
Explanation 2 of redis database (redis high availability, persistence and performance management)
Design of digital temperature monitoring and alarm system based on DS18B20 single chip microcomputer [LCD1602 display + Proteus simulation + C program + paper + key setting, etc.]
C language super complete learning route (collection allows you to avoid detours)
重定向和请求转发详解
Educational Codeforces Round 127 A-E题解
Connectez PHP à MySQL via aodbc
Application of skiplist in leveldb
G007-HWY-CC-ESTOR-03 华为 Dorado V6 存储仿真器搭建
Detailed explanation of C language knowledge points - data types and variables [2] - integer variables and constants [1]
Explanation of redis database (III) redis data type
字节面试 transformer相关问题 整理复盘
PSYNC synchronization of redis source code analysis
My raspberry PI zero 2W toss notes to record some problems and solutions
Leetcode学习计划之动态规划入门day3(198,213,740)
深度学习——超参数设置
Detailed explanation of C language knowledge points -- first understanding of C language [1] - vs2022 debugging skills and code practice [1]
Mysql database explanation (VII)