当前位置：网站首页>【3D形状重建系列】Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion

【3D形状重建系列】Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion

2022-04-23 06:11:00 【^_^ 晅菲】

文章目录

1. 概要
2. 动机
3 算法
4. 实验结果
5. 结论及思考

清库存系列，拖了好久啊。

1. 概要

题目：Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion，CVPR 2020
论文：https://virtualhumans.mpi-inf.mpg.de/papers/chibane20ifnet/chibane20ifnet.pdf
代码：https://virtualhumans.mpiinf.mpg.de/ifnets/.

2. 动机

现有重构刚性物体都受限于两点：

不能够代表复杂的物体，例如重构经常失去手臂或腿；
他们不能够保留在输入数据中所呈现的细节。

可能受限的原因：

网络学习了在xyz坐标上过于强大的先验破坏了清晰度的不变形；
形状编码向量缺乏三位编码，导致编码看起来更像是对形状原型的分类，而不是连续回归。因此，当前方法受限于上述2点；

本工作就是基于上面的考虑，提出来隐特征网络，在5个维度进行了改进。
在这里插入图片描述
希望达到的效果：

3 算法

本质上其实是decode的设计，因为encoder就是基础的特征提取部分；而decoder其实就是在预测点是在这个物体里面还是外面，那么两者的边界就是我们所需要的物体表面。最终是要通过其他算法来复现连续曲面的。因为输出的离散值：0或1。
在这里插入图片描述

3.1 背景：隐表面学习

定义occupancy公式。使用隐形表达 $z$ 来编码3D形状。则连续的形状表达可以荣国学习神经函数来获得：
在这里插入图片描述
表面通过[0,1]设定是否属于物体内或外。这样的话表面就是决策边缘。连续表达可以不受像素限制。

后面可以通过构建mesh中marching cubes算法来表达物体限制，但是有两个限制：

不能够表达复杂物体，例如有关节的人物等。
没能保留输入数据的细节。

3.2 隐形特征网络

形状编码 $g$ ：使用了3D卷积，多尺度深度特征网格 $F$ ,如下：
在这里插入图片描述
其实最主要还是用到了occupancy实现多分辨率输出，知识过程中用到了多尺度来保障保留细节。

形状解码 $f$ ：
不同于直接将点云坐标 $\mathbf{p}$ 进行分类，我们通过坐标提取了学习到的特征 $\mathbf{F}_1(\mathbf{p}),..., \mathbf{F}_n(\mathbf{p})$ 。由于特征网格是离散的，因此使用三次线性插值来获得连续的3D点。这里是为了在最前面的小感受野区域内可以编码某个点与其领域的点，笛卡尔坐标表示如下：
在这里插入图片描述
其中 $d$ 是距离中心的点。 $e_i$ 为第 $i$ 个笛卡尔单位向量。
将编码器结果输入给解码器 $f$ ，包括一个全连接层来预测点 $\mathbf{p}$ 是在表面外还是内，如下式所示：

所以与最基本的隐式表达，公式（1）对比，这里的特征包含了局部和全局的特征，而不仅仅只是坐标信息。由于这样的多尺度编码模式，细节也可以很好的被保留。