当前位置:网站首页>【点云系列】Multi-view Neural Human Rendering (NHR)
【点云系列】Multi-view Neural Human Rendering (NHR)
2022-04-23 06:11:00 【^_^ 晅菲】
文章目录
1. 概要
虞晶怡团队作品,CVPR2020,神经渲染系列
论文地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Wu_Multi-View_Neural_Human_Rendering_CVPR_2020_paper.pdf
项目地址:https://wuminye.github.io/NHR/
数据集:https://wuminye.github.io/NHR/datasets.html
2. 动机
专门针对人体渲染端到端框架(NHR):用点云中PointNet++来提取3D特征 +投射到2D的平滑的CNN来处理噪声和残缺。本质上还是引入了点云来指导渲染的方法。
3. 方法
流程图
整体框架
包括三个模块:
- 特征提取(FE)
- 投影与光栅化(PR)
- 渲染(RE)
模块1:特征提取(FE)
Ψ f e \varPsi_{fe} Ψfe: PointNet++特征提取操作,去除分类分支,仅保留分割分支作为FE的分支。
D t D_t Dt:点云的特征描述子
V = v i V={v_i} V=vi:归一化的视角方向, v i = p t i − o ∣ ∣ p t i − o ∣ ∣ 2 v^i = \frac{p^i_t-o}{||p^i_t-o||}_2 vi=∣∣pti−o∣∣pti−o2, 其中 o o o是目标视角相机的投射中心。
{ . } \{.\} {
.}:表示拼接,这里指的是拼接颜色和归一化后的点的视角方向,拼接后的特征作为初始化点属性来进行特征提取。
φ n o r m \varphi_{norm} φnorm表示点坐标经过了归一化。
模块2:投影与光栅化(PR)
S S S: 投射后的2D特征图,其中 S x , y = d t i S_{x,y}=d^i_t Sx,y=dti, d t i d^i_t dti是第 i i i个点的特征描述子。
E E E: 当前视角的深度图
目 标 相 机 参 数 目标相机参数 目标相机参数: K ^ \hat{K} K^、 T ^ \hat{T} T^
可 学 习 的 参 数 可学习的参数 可学习的参数: θ d \theta_d θd
ψ p r \psi_{pr} ψpr:整个投影与光栅化过程
模块3: 渲染(RE)
ψ r e n d e r \psi_{render} ψrender: 改进版的U-Net,输出4通道,前三通道是RGB图像 I ∗ I* I∗,最后一通道是mask是 M ∗ M* M∗,使用sigmoid。
训练损失
L1损失+ 感知损失
n b n_b nb:batch_size大小
I i ∗ I_i* Ii∗、 M i ∗ M_i* Mi∗: 第 i i i个渲染输出的图和mask。
ψ v g g \psi_{vgg} ψvgg:分别提取第2层和第4层VGG-19的特征
几何改进
为了细化几何,渲染了一组密集的新视图,并使用生成的遮罩mask作为轮廓,并给予空间雕刻或轮廓形状进行重建。
由于多视角的立体输入(其实也就是粗糙的点云输入)可能会有空洞的地方或者遮挡的区域。
Mask 与形状生成 :通过训练渲染模型得到类似于RGB抠图,然后在一个统一采样的新视点集合上去渲染mask,每个都有对应的相机参数,大小为800x600。 随后,可以使用shape-from-silhouettes(SfS)来重构人体mesh。
点采样和上色:可以通过在MVS上的点云来计算对应颜色,用最近邻。
洞补全:
补全块机制:对于每个点 u t i ∈ U t u^i_t\in U_t uti∈Ut,其与 P t P_t Pt中的 p t i p^i_t pti点的欧氏距离 ϕ ( u t i , p i ) t ) \phi(u^i_t,p^i)t) ϕ(uti,pi)t)要比 P ^ t − U t \hat{P}_t-U_t P^t−Ut大。于是设置阈值 τ 1 \tau_1 τ1如公式(5):实验当中设置为0.2
接着计算 P t ^ \hat{P_t} Pt^当中到 p t j p^j_t ptj的 欧式距离<阈值的点数,记做 s t i = # { b t i ∣ b t i < τ 1 } s^i_t=\#\{b^i_t|b^i_t<\tau_1\} sti=#{
bti∣bti<τ1}
然后使用15个bins计算 s t i s^i_t sti的所有直方图,通过平分最大距离值得到15个bins。由于观察到在第一个bin当中包含了比第二个更重要的点,因此使用第一个bin的最大距离作为第二个阈值: τ 2 \tau_2 τ2来选择最后的点值:
下图可以说明使用了洞补全后,可以减轻更换视角点时出现的闪烁情况。
注意:最终的集合依然会有伪像,由于其的质量取决于阈值 τ \tau τ
该图更加直观的现实了如何设置阈值,以及距离衡量。
4. 实验
数据集
通过80多个相机系统收集了5个序列。每秒25帧。所有序列在8-24秒。 人物穿不同的衣服来做不同的动作。
每个序列包括:RGB图像、前景mask,RGB点云序列和相机校准。
实验效果:
该实验表明,充分利用点云与图像一起操作的好处。
在5个数据集上的效果对比:
可视化了点云特征图里的颜色部分:
5. 总结
本质上也是采用了粗糙的点云+ 好的图片+ 一些几何小技巧来获得不错的效果。
版权声明
本文为[^_^ 晅菲]所创,转载请带上原文链接,感谢
https://blog.csdn.net/weixin_43882112/article/details/122058290
边栏推荐
- C connection of new world Internet of things cloud platform (simple understanding version)
- 【點雲系列】SG-GAN: Adversarial Self-Attention GCN for Point Cloud Topological Parts Generation
- 去掉状态栏
- DCMTK (dcm4che) works together with dicoogle
- Gobang games
- 【3D形状重建系列】Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion
- Easyui combobox 判断输入项是否存在于下拉列表中
- Ffmpeg common commands
- Android interview Online Economic encyclopedia [constantly updating...]
- adb shell top 命令详解
猜你喜欢
【2021年新书推荐】Red Hat Certified Engineer (RHCE) Study Guide
【点云系列】PnP-3D: A Plug-and-Play for 3D Point Clouds
ArcGIS License Server Administrator 无法启动解决方法
【2021年新书推荐】Learn WinUI 3.0
C connection of new world Internet of things cloud platform (simple understanding version)
【2021年新书推荐】Professional Azure SQL Managed Database Administration
常用UI控件简写名
第2章 Pytorch基础2
C# EF mysql更新datetime字段报错Modifying a column with the ‘Identity‘ pattern is not supported
WebView displays a blank due to a certificate problem
随机推荐
BottomSheetDialogFragment 与 ListView RecyclerView ScrollView 滑动冲突问题
BottomSheetDialogFragment + ViewPager+Fragment+RecyclerView 滑动问题
【2021年新书推荐】Effortless App Development with Oracle Visual Builder
【动态规划】不同路径2
Miscellaneous learning
What did you do during the internship
Fill the network gap
第4章 Pytorch数据处理工具箱
Bottomsheetdialogfragment conflicts with listview recyclerview Scrollview sliding
Exploration of SendMessage principle of advanced handler
Pytorch model pruning example tutorial III. multi parameter and global pruning
Three methods to realize the rotation of ImageView with its own center as the origin
.net加载字体时遇到 Failed to decode downloaded font:
./gradlew: Permission denied
【2021年新书推荐】Red Hat Certified Engineer (RHCE) Study Guide
Android暴露组件——被忽略的组件安全
ProcessBuilder工具类
MySQL notes 2_ data sheet
torch.mm() torch.sparse.mm() torch.bmm() torch.mul() torch.matmul()的区别
PyMySQL连接数据库