当前位置:网站首页>【点云系列】FoldingNet:Point Cloud Auto encoder via Deep Grid Deformation
【点云系列】FoldingNet:Point Cloud Auto encoder via Deep Grid Deformation
2022-04-23 06:11:00 【^_^ 晅菲】
清库存系列
1. 概要
题目:FoldingNet: Point Cloud Auto encoder via Deep Grid Deformation (CVPR’18 spotlight)
论文:https://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_FoldingNet_Point_Cloud_CVPR_2018_paper.pdf
补充材料:https://openaccess.thecvf.com/content_cvpr_2018/Supplemental/1129-supp.pdf
代码:https://www.merl.com/research/license#FoldingNet
简述: 基于2D纸折叠的思想产生3D物体
后续延伸:
- FoldingNet++
- Real-time Soft Robot 3D Proprioception via Deep Vision based Sensing
类似工作:
AtlasNet, 其是使用multiple grid块来初始化2D grid。
2. 动机
神经网络能否学习纸的折叠呢?
3D点云数据大部分来源于物体表面小区域可以看成是2D流体,可以通过2D经过一系列变换获取得到。

3. 思想
整体框架:主设计解码器
主要是设计了解码器,Encoder直接使用PointNet部分和简单图思想。

简单来讲,就是把隐码复制了N份,然后与2D的网格进行拼接,形成Nx(D+K)维度的隐码,通过学习获得有位置信息的点云。
其实可以简单理解成为几何当中的一个定义:自然界里的高维数据可以表示为低维非线性的流形。这里就运用这个思想将三维点云认为是二维的流形,那么二维里面就用一个简单的网格来模拟。所以其受限在只可以模拟3D中没有环出现的情况,有环的出现时就不行了。所以才有了后面FoldingNet++的出现用来解决有环出现的情况。

基于图的编码器Encoder

编码器 = 多层感知器 + 基于图的最大池化层,两者拼接在一起形成编码器;
图的构成:16-KNN, 对于每个点,计算器的局部协方差矩阵,使用 3 × 3 3\times3 3×3核计算,然后将其向量化为 1 × 9 1\times9 1×9,所以输入 n × 3 n\times3 n×3–> n × 9 n\times9 n×9。两者拼接起来就是 n × 12 n\times 12 n×12.
假设KNN图的邻接矩阵是A,输入是X。则输出矩阵为公式(2),其中K是特征映射矩阵,每一个输入则是公式(3)。公式(3)计算局部特征表达,一定的拓扑性。


基于Folding的解码器Decoder


解码器:使用2个连续的3层感知器+ 2D grid。
输入: 复制了m份的特征,每份特征512维度来自编码器 + 复制了m份的2D grid,每份2维特征 = m × 514 m \times 514 m×514.
这里的grid使用正方形,m=2025,输入点数n=2048。
那么什么叫做Folding操作呢?
就是整个解码器的这样的操作。也就是,复制了码字与2D grid的拼接经过一个基于点的多层感知器就叫做Folding操作。
使用两个三层感知器的作用?
- 第一个是从2D grid 到3D 空间的Folding操作;
- 第二个是在3D空间仅Folding操作,产生最终的surface。
理论分析:
假定2Dgrid输入是矩阵 U U U,由编码器输出的码字为 θ \theta θ,矩阵每一行为 u i u_i ui
通过拼接与MLP后,可以看成是 f ( [ u i , θ ] ) f([u_i, \theta]) f([ui,θ]),该公式可以看成是通过码字 θ \theta θ对高维函数的重参数化,由于MLP可以接近于非线性,自然可以进行folding操作。
4. 实验结果
训练的可视化结果:

形状插值:


6. 参考
版权声明
本文为[^_^ 晅菲]所创,转载请带上原文链接,感谢
https://blog.csdn.net/weixin_43882112/article/details/111478900
边栏推荐
- Markdown basic grammar notes
- C connection of new world Internet of things cloud platform (simple understanding version)
- 图像分类白盒对抗攻击技术总结
- [dynamic programming] longest increasing subsequence
- Computer shutdown program
- 【2021年新书推荐】Professional Azure SQL Managed Database Administration
- What did you do during the internship
- 树莓派:双色LED灯实验
- MySQL笔记2_数据表
- winform滚动条美化
猜你喜欢
![[2021 book recommendation] Red Hat Certified Engineer (RHCE) Study Guide](/img/36/1c484aec5efbac8ae49851844b7946.png)
[2021 book recommendation] Red Hat Certified Engineer (RHCE) Study Guide
![[recommendation for new books in 2021] professional azure SQL managed database administration](/img/f1/b38cce1dc328a5b534011169909127.png)
[recommendation for new books in 2021] professional azure SQL managed database administration

adb shell top 命令详解

【2021年新书推荐】Red Hat Certified Engineer (RHCE) Study Guide
![[recommendation of new books in 2021] enterprise application development with C 9 and NET 5](/img/1d/cc673ca857fff3c5c48a51883d96c4.png)
[recommendation of new books in 2021] enterprise application development with C 9 and NET 5
![[2021 book recommendation] effortless app development with Oracle visual builder](/img/db/d8802b42d5374e4117db638a0b82b0.png)
[2021 book recommendation] effortless app development with Oracle visual builder

PyMySQL连接数据库

Miscellaneous learning
![Android interview Online Economic encyclopedia [constantly updating...]](/img/48/dd1abec83ec0db7d68812f5fa9dcfc.png)
Android interview Online Economic encyclopedia [constantly updating...]

基于BottomNavigationView实现底部导航栏
随机推荐
【2021年新书推荐】Learn WinUI 3.0
机器学习笔记 一:学习思路
N states of prime number solution
The Cora dataset was trained and tested using the official torch GCN
如何对多维矩阵进行标准化(基于numpy)
微信小程序 使用wxml2canvas插件生成图片部分问题记录
torch.mm() torch.sparse.mm() torch.bmm() torch.mul() torch.matmul()的区别
Pytorch模型保存与加载(示例)
[dynamic programming] Yang Hui triangle
【2021年新书推荐】Enterprise Application Development with C# 9 and .NET 5
【动态规划】杨辉三角
Using queue to realize stack
torch_ Geometric learning 1, messagepassing
C language, a number guessing game
深度学习模型压缩与加速技术(一):参数剪枝
Computer shutdown program
机器学习 二:基于鸢尾花(iris)数据集的逻辑回归分类
adb shell top 命令详解
Android interview Online Economic encyclopedia [constantly updating...]
第5 章 机器学习基础