当前位置:网站首页>CVPR 2022 优质论文分享
CVPR 2022 优质论文分享
2022-04-23 15:32:00 【极链AI云】
CVPR 2022 优质论文分享
A ConvNet for the 2020s
论文:https://arxiv.org/abs/2201.0354
代码:https://github.com/facebookresearch/ConvNeXt

2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可以被用做其他视觉任务的骨干网络,ViT变得更火了。本文探究卷积网络到底输在了哪里,卷积网络的极限在哪里。在本文中,作者逐渐向ResNet中增加结构(或使用trick)来提升卷积模型性能,最终将ImageNet top-1刷到了87.8%。作者认为本文所提出的网络结构是新一代(2020年代)的卷积网络(ConvNeXt),因此将文章命名为“2020年代的卷积网络”。
Incremental Transformer Structure Enhanced Image Inpainting with Masking Positional Encoding
论文:https://arxiv.org/abs/2203.00867
代码:https://github.com/DQiaole/ZITS_inpainting

近年来,图像修复取得了重大进展。然而,恢复具有生动纹理和合理结构的损坏图像仍然具有挑战性。由于卷积神经网络 (CNN) 的感受野有限,一些特定的方法只能处理常规纹理,而会丢失整体结构。另一方面,基于注意力的模型可以更好地学习结构恢复的远程依赖性,但它们受到大图像尺寸推理的大量计算的限制。为了解决这些问题,本文建议利用额外的结构恢复器来逐步促进图像修复。所提出的模型在固定的低分辨率草图空间中使用强大的基于注意力的 Transformer 模型来恢复整体图像结构。
Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
论文:https://arxiv.org/pdf/2203.00962.pdf
代码:https://github.com/zhaozhengChen/ReCAM

本文介绍了一种非常简单高效的方法:使用名为 ReCAM 的 softmax 交叉熵损失 (SCE) 重新激活具有 BCE 的收敛 CAM。给定一张图像,本文使用 CAM 提取每个类的特征像素,并使用它们与类标签一起使用 SCE 学习另一个全连接层(在主干之后)。收敛后,本文以与 CAM 中相同的方式提取 ReCAM。由于 SCE 的对比性质,像素响应被分解为不同的类别,因此预期的掩码模糊性会更小。对 PASCAL VOC 和 MS COCO 的评估表明,ReCAM 不仅可以生成高质量的遮罩,还可以在任何 CAM 变体中以很少的开销支持即插即用。

版权声明
本文为[极链AI云]所创,转载请带上原文链接,感谢
https://blog.csdn.net/m0_60673947/article/details/124352826
边栏推荐
- Detailed explanation of kubernetes (XI) -- label and label selector
- 我的树莓派 Raspberry Pi Zero 2W 折腾笔记,记录一些遇到的问题和解决办法
- Application of skiplist in leveldb
- 今日睡眠质量记录76分
- Deeply learn the skills of parameter adjustment
- MySQL Basics
- el-tree实现只显示某一级复选框且单选
- Do keyword search, duplicate keyword search, or do not match
- Common types of automated testing framework ▏ automated testing is handed over to software evaluation institutions
- How to design a good API interface?
猜你喜欢

Detailed explanation of kubernetes (IX) -- actual combat of creating pod with resource allocation list

函数(第一部分)
![[leetcode daily question] install fence](/img/4e/3ac23174f2b3ee867b45a2e748b872.png)
[leetcode daily question] install fence

Multitimer V2 reconstruction version | an infinitely scalable software timer

Openstack theoretical knowledge

Mumu, go all the way

机器学习——逻辑回归

Recommended search common evaluation indicators

推荐搜索 常用评价指标

Special analysis of China's digital technology in 2022
随机推荐
Hj31 word inversion
Machine learning - logistic regression
Baidu written test 2022.4.12 + programming topic: simple integer problem
KNN, kmeans and GMM
Mumu, go all the way
GFS distributed file system (Theory)
el-tree实现只显示某一级复选框且单选
The life cycle of key value in redis module programming
kubernetes之常用Pod控制器的使用
adobe illustrator 菜单中英文对照
Mysql database explanation (VII)
PHP PDO ODBC loads files from one folder into the blob column of MySQL database and downloads the blob column to another folder
Krpano panorama vtour folder and tour
PHP PDO ODBC将一个文件夹的文件装载到MySQL数据库BLOB列,并将BLOB列下载到另一个文件夹
After time judgment of date
深度学习——超参数设置
Llvm - generate for loop
Detailed explanation of C language knowledge points - data types and variables [2] - integer variables and constants [1]
MultiTimer v2 重构版本 | 一款可无限扩展的软件定时器
Redis cluster principle