当前位置:网站首页>论文精读 —— 2021 CVPR《Progressive Temporal Feature Alignment Network for Video Inpainting》
论文精读 —— 2021 CVPR《Progressive Temporal Feature Alignment Network for Video Inpainting》
2022-08-10 05:25:00 【clarkjs】
总述
这篇论文首先总结了三种现有的常用的Video Inpainting技术:(1)基于Attention;(2)基于光流扭曲;(3)基于3D卷积;还总结了三种方法分别存在的问题,如果仅仅利用光流技术进行补全,当物体运动过快或者存在遮挡等情况,光流补全并不可靠,这样会导致光流扭曲产生伪影;而仅仅利用3D卷积会导致空间错位(由物体运动等因素引起)。因此,作者提出了“ Progressive Temporal Feature Alignment Network” 渐进式时间特征对齐网络。并在FVI和DAVIS数据集上进行了实验,并使用PSNR、SSIM、VFID指标进行效果的评测。注:3D卷积因此空间错位的原因如下现有的基于3D卷积神经网络进行Video Inpainting的方法不足:虽然获取当前帧的缺失像素一定需要参考相邻帧(不一定是附近的,有的paper会提出遥远帧),但是一般方法仅仅通过获取相邻帧特征的简单堆叠,而忽略了物体运动而导致的空间错位。
注:作者说:光流最大的不足是对错误敏感,即使用光流法进行补全产生的任何错误都会导致细节像素无法精准补全。
一、方法介绍
1. 方法概览
作者使用了渐进式时间特征对齐网络,主要是将3D卷积和光流补全相结合,以提升二者各自的优点并弥补其缺点,3D卷积可以提取相邻帧之间的特征像素进行补全,光流可以实现相邻帧之间的对齐,以弥补仅仅使用3D卷积造成的空间错位。网
边栏推荐
- 线程(下):读写者模型\环形队列\线程池
- flex 相关
- Rpc接口压测
- Consulting cdc 2.0 for mysql does not execute flush with read lock. How to ensure bin
- An article to master the entire JVM, JVM ultra-detailed analysis!!!
- AVL树的插入--旋转笔记
- 一文带你搞懂OAuth2.0
- 在vscode中屏蔽Alt热键
- Become a language that hackers have to learn. Do you think it's okay after reading it?
- How to simulate the background API call scene, very detailed!
猜你喜欢
大咖说·对话生态|当Confluent遇见云:实时流动的数据更有价值
How to simulate the background API call scene, very detailed!
AVL tree insertion--rotation notes
二进制中负数为何要用补码形式来表示——二进制加减法
[Thesis Notes] Prototypical Contrast Adaptation for Domain Adaptive Semantic Segmentation
西门子Step7和TIA软件“交叉引用”的使用
MySQL simple tutorial
Flutter development: error The following assertion was thrown resolving an image codec: Solution for Unable to...
Kubernetes:(十六)Ingress的概念和原理
【LeetCode】41、 缺失的第一个正数
随机推荐
Mysql CDC (2.1.1) inital snapshot database set up five concurrent degree, se
Hezhou ESP32C3 +1.8"tft network clock under Arduino framework
leetcode每天5题-Day11
Stacks and Queues | Valid parentheses, delete all adjacent elements in a string, reverse Polish expression evaluation, maximum sliding window, top K high frequency elements | leecode brush questions
线性代数(四)
Thread.sleep, Thread.yield role explanation
Kubernetes:(十六)Ingress的概念和原理
【论文笔记】Prototypical Contrast Adaptation for Domain Adaptive Semantic Segmentation
西门子Step7和TIA软件“交叉引用”的使用
openGauss源码,在window系统用VSCode维护吗?
flinkcdc 读取pgsql 的时间被放大了 有大佬知道咋回事吗 gmt_create':1
MySQL simple tutorial
SQL Server query optimization
每周推荐短视频:探索AI的应用边界
Guys, is it normal that the oracle archive log grows by 3G in 20 minutes after running cdc?
从GET切换为POST提交数据的方法
Advanced Feature Selection Techniques in Linear Models - Based on R
Become a language that hackers have to learn. Do you think it's okay after reading it?
动手写prometheus的exporter-02-Counter(计数器)
How cursors work in Pulsar