当前位置:网站首页>CVPR 2022 优质论文分享
CVPR 2022 优质论文分享
2022-04-23 15:32:00 【极链AI云】
CVPR 2022 优质论文分享
A ConvNet for the 2020s
论文:https://arxiv.org/abs/2201.0354
代码:https://github.com/facebookresearch/ConvNeXt
2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可以被用做其他视觉任务的骨干网络,ViT变得更火了。本文探究卷积网络到底输在了哪里,卷积网络的极限在哪里。在本文中,作者逐渐向ResNet中增加结构(或使用trick)来提升卷积模型性能,最终将ImageNet top-1刷到了87.8%。作者认为本文所提出的网络结构是新一代(2020年代)的卷积网络(ConvNeXt),因此将文章命名为“2020年代的卷积网络”。
Incremental Transformer Structure Enhanced Image Inpainting with Masking Positional Encoding
论文:https://arxiv.org/abs/2203.00867
代码:https://github.com/DQiaole/ZITS_inpainting
近年来,图像修复取得了重大进展。然而,恢复具有生动纹理和合理结构的损坏图像仍然具有挑战性。由于卷积神经网络 (CNN) 的感受野有限,一些特定的方法只能处理常规纹理,而会丢失整体结构。另一方面,基于注意力的模型可以更好地学习结构恢复的远程依赖性,但它们受到大图像尺寸推理的大量计算的限制。为了解决这些问题,本文建议利用额外的结构恢复器来逐步促进图像修复。所提出的模型在固定的低分辨率草图空间中使用强大的基于注意力的 Transformer 模型来恢复整体图像结构。
Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
论文:https://arxiv.org/pdf/2203.00962.pdf
代码:https://github.com/zhaozhengChen/ReCAM
本文介绍了一种非常简单高效的方法:使用名为 ReCAM 的 softmax 交叉熵损失 (SCE) 重新激活具有 BCE 的收敛 CAM。给定一张图像,本文使用 CAM 提取每个类的特征像素,并使用它们与类标签一起使用 SCE 学习另一个全连接层(在主干之后)。收敛后,本文以与 CAM 中相同的方式提取 ReCAM。由于 SCE 的对比性质,像素响应被分解为不同的类别,因此预期的掩码模糊性会更小。对 PASCAL VOC 和 MS COCO 的评估表明,ReCAM 不仅可以生成高质量的遮罩,还可以在任何 CAM 变体中以很少的开销支持即插即用。
版权声明
本文为[极链AI云]所创,转载请带上原文链接,感谢
https://blog.csdn.net/m0_60673947/article/details/124352826
边栏推荐
- Kubernetes详解(九)——资源配置清单创建Pod实战
- Summary of interfaces for JDBC and servlet to write CRUD
- Adobe Illustrator menu in Chinese and English
- Llvm - generate if else and pH
- MySQL Basics
- Kubernetes详解(十一)——标签与标签选择器
- 自主作业智慧农场创新论坛
- 【backtrader源码解析18】yahoo.py 代码注释及解析(枯燥,对代码感兴趣,可以参考)
- MySQL InnoDB transaction
- 我的树莓派 Raspberry Pi Zero 2W 折腾笔记,记录一些遇到的问题和解决办法
猜你喜欢
服务器中毒了怎么办?服务器怎么防止病毒入侵?
Mysql database explanation (VII)
重定向和请求转发详解
Functions (Part I)
How to use OCR in 5 minutes
[leetcode daily question] install fence
About UDP receiving ICMP port unreachable
Machine learning - logistic regression
Sword finger offer (1) -- for Huawei
Byte interview programming question: the minimum number of K
随机推荐
el-tree实现只显示某一级复选框且单选
Nacos program connects to mysql8 0+ NullPointerException
Common types of automated testing framework ▏ automated testing is handed over to software evaluation institutions
Mysql连接查询详解
adobe illustrator 菜單中英文對照
fatal error: torch/extension.h: No such file or directory
我的树莓派 Raspberry Pi Zero 2W 折腾笔记,记录一些遇到的问题和解决办法
About UDP receiving ICMP port unreachable
Three uses of kprobe
Detailed explanation of C language knowledge points -- first understanding of C language [1] - vs2022 debugging skills and code practice [1]
YML references other variables
Knn,Kmeans和GMM
Advantages, disadvantages and selection of activation function
Comparaison du menu de l'illustrateur Adobe en chinois et en anglais
通過 PDO ODBC 將 PHP 連接到 MySQL
How to design a good API interface?
Llvm - generate for loop
Tun equipment principle
Detailed explanation of C language knowledge points -- data types and variables [1] - carry counting system
Do keyword search, duplicate keyword search, or do not match