当前位置:网站首页>美摄科技受邀LVSon2020大会 分享《AI合成虚拟人物的技术框架与挑战》
美摄科技受邀LVSon2020大会 分享《AI合成虚拟人物的技术框架与挑战》
2022-04-23 06:15:00 【美摄科技】
摘要:作为智能视音频解决方案解决方案的服务商,美摄科技致力于为移动互联网、智能手机、智能硬件、传统广电及通信运营商等行业机构提供最前沿的整体视音频解决方案,为开发者与行业合作伙伴提供高效、稳定的底层技术支撑,助力合作伙伴实现业务创新并创造巨大的用户价值。
2020年10月31日,LiveVideoStackCon 2020 音视频技术大会在北京丽亭华苑酒店举行,会议聚焦音视频技术与全球化、AI与多媒体处理、教育与多媒体、视频编解码、服务端开发优化、教育与多媒体等音视频技术与行业应用相关热点话题。汇集 500多位来自泛娱、教育、视频会议、社交、游戏、电商、金融、物联网等行业资深技术专家与顶尖学者共聚本次多媒体开发领域盛会。

会议中,北京美摄网络科技有限公司AI研究组负责人侯康先生受邀出席并分享主题演讲《AI合成虚拟人物的技术框架与挑战》,演讲内容从AI合成虚拟人物的技术框架出发,介绍了AI合成虚拟人物技术的背景,该技术通过输入一段文字,生成接近真实拍摄的主播视频。进一步详细介绍了AI合成虚拟人物不同技术路径之间的差异和优缺点,表情和口型预测模型的设计和优化思路,3D人脸重建和渲染技术、对抗生成网络,视频帧渲染和融合等关键技术。针对口型抖动和失真,GAN渲染结果中面部细节失真,最终视频的前后帧之间的平滑过渡等难点分享了解决方案。

美摄科技AI合成虚拟主播,将人工智能与计算机图形学相结合。当计算机获取语音或者文本中的内容信息后,即可通过计算机图形学合成技术对虚拟形象的面部进行驱动,渲染及融合,经过海量的面部数据进行生成对抗网络的训练,实现极具逼真感的表情还原,最终实现精细的唇音同步、表情姿态生动与真人无异的虚拟主播。在新闻播报、虚拟客服、互联网教学等领域有丰富的应用场景。

目前美摄科技的产品矩阵包括:视频高清拍摄及深度编辑SDK、智能视频生产服务平台、智能剪辑解决方案、智能手机解决方案、人脸+美颜/贴纸解决方案、云剪辑、虚拟主播、视频包装定制设计等服务。覆盖移动端、PC端、Web端,其从拍摄到编辑的全流程功能,实现当前所有主流视频的玩法。拥有灵活的技术架构,使用多线程和GPU、CPU协同预处理机制、自然语言处理演算法等技术,受到各行业的头部厂商一致认可,现与如小米、OPPO、ViVO、华硕、猎豹移动、哔哩哔哩、新浪、KEEP等各领域头部客户展开深度技术合作。并与国家电网、广电等传统企业合作,推动头条APP、融媒体在政企中的运用。除国内客户外,美摄科技也布局国外市场,在国际上填补海外市场智能视音频解决方案的空白。目前,已在美国、韩国、印度、新加坡等多个国家与当地互联网企业提供深度技术服务,辐射数千万海外用户,助力合作伙伴实现业务创新并创造巨大的用户价值。
版权声明
本文为[美摄科技]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_40228051/article/details/109744326
边栏推荐
- 第3章 Pytorch神经网络工具箱
- 第5 章 机器学习基础
- Gee configuring local development environment
- armv8m(cortex m33) MPU实战
- How to standardize multidimensional matrix (based on numpy)
- 第2章 Pytorch基础1
- Use originpro express for free
- rearrange 和 einsum 真的优雅吗
- Chapter 1 numpy Foundation
- 【点云系列】 A Rotation-Invariant Framework for Deep Point Cloud Analysis
猜你喜欢

第2章 Pytorch基础1

【点云系列】Pointfilter: Point Cloud Filtering via Encoder-Decoder Modeling

Chapter 4 pytoch data processing toolbox

机器学习——PCA与LDA

【点云系列】SO-Net:Self-Organizing Network for Point Cloud Analysis

【无标题】PID控制TT编码器电机

Chapter 1 numpy Foundation

Mysql database installation and configuration details

【指标】Precision、Recall

UEFI学习01-ARM AARCH64编译、ArmPlatformPriPeiCore(SEC)
随机推荐
. net encountered failed to decode downloaded font while loading font:
FATFS FAT32学习小记
EMMC/SD学习小记
ArcGIS license server administrator cannot start the workaround
Thanos. SH kill bully script, easily delete half of the files in the system at random
Pytorch model pruning example tutorial III. multi parameter and global pruning
Infrared sensor control switch
机器学习——PCA与LDA
吴恩达编程作业——Logistic Regression with a Neural Network mindset
PyTorch 20. PyTorch技巧(持续更新)
Visual Studio 2019安装与使用
【点云系列】点云隐式表达相关论文概要
torch.where能否传递梯度
x86架构初探之8086
[point cloud series] a rotation invariant framework for deep point cloud analysis
AUTOSAR从入门到精通100讲(八十一)-AUTOSAR基础篇之FiM
Gephi教程【1】安装
Unwind 栈回溯详解
Chapter 5 fundamentals of machine learning
Machine learning III: classification prediction based on logistic regression