当前位置:网站首页>AI的新故事,藏在李彦宏的《智能交通》音频书里
AI的新故事,藏在李彦宏的《智能交通》音频书里
2022-04-21 23:53:00 【智源社区】
近日,百度董事长兼CEO李彦宏新书《智能交通》的音频版上线喜马拉雅APP,值得一提的是,它是由李彦宏亲自献声。打开音频,只听到一个干净、富有磁性而不失温柔的声音娓娓讲述,这些年来发生在人、车、路之间的无声变化,让人似乎亲眼看见这场或许影响人类未来10-40年的重大变革的场景。
不得不说,虽然不是专业播音,但由作者李彦宏本人亲自讲述,这套有声书已经接近专业播音水平,且更有真情实感。实际上,究其背后制作,这并不是由李彦宏自己在录音棚配音完成,而是来自他的一位助理——人工智能(AI)。AI在对李彦宏的一段不到1小时的录音素材学习后,自动生成了这本超20万字作品的逼真音频版。

你永远可以相信AI在音视频创作上的天赋。此前我们刚刚报道了AI修复张国荣2000年《热·情》演唱会的案例,今天,AI又再次显现出改变音频产业的潜力。那么,AI是怎样合成李彦宏的声音的?背后又有什么样的技术难点?在本文中,我们通过对话这一项目的深度参与者,来解读背后的技术和产业奥秘。
AI学习300句话后
帮李彦宏完成20万字配音
首先,让我们来听几个《智能交通》有声书里的片段,感受一下。2015年,在李彦宏刚刚带领团队做自动驾驶两年时,他就开始关注包括驾驶安全、道路拥堵等更宏大的交通方面的问题。7年后成书之际,他在《智能交通》里坦言,自己看待自动驾驶的维度发生了显著变化:
“随着我对交通问题的关注越来越深,看待自动驾驶的维度也发生了显著的变化。百度的发展方向也从自动驾驶,逐渐延伸到车路协同、智能交通、数字城市运营。在这个过程中,有很多的实践,也踩过很多的坑。但是,我越来越确定以下的事情。”语气恳切,语调自然起伏。
那么李彦宏确定了什么事情呢?他在书中娓娓道来:
“一个智能交通系统,可以大大降低交通事故发生的概率……随着无人驾驶进一步成熟,“聪明的车”、“智能的路”、车路协同、智能的交通管理系统等,都会让交通事故发生的概率降低,无论是骑自行车的人、骑摩托车的人,还是步行的人,出行都更加安全。”
拥堵问题,也可以通过智能交通更好地解决。“通过测算,以车路协同为基础的智能交通,将能够提升15%—30%的通行效率……10年之内,靠交通效率的提升,基本上拥堵问题就可以解决了。”
而在自序的最后,李彦宏还讲述到自己写这本书的初衷——“越来越大的城市、越来越多的汽车、越来越多的人口,让交通问题变得前所未有的迫切、前所未有的严峻。这也是本书出版的初衷,为交通安全、交通拥堵、碳排放等问题,寻找最优解,让我们每个人的出行变得安全、高效、经济和绿色。”
总之,听完这个李彦宏亲自讲述的自序,我已经被成功安利了这本书。因为这就好像李彦宏本人亲自在来到我身边,真诚恳切地述说这些年他的所见、所闻、所想,也邀我一起打开这幅智慧交通变革的大画卷。这本书会探讨智能交通解决三大问题、六大创新理念,以及智能交通7个领域12个案例,作者本人李彦宏的讲述都会陪伴着我去一一解锁它们。而当我知道“配音”工作其实由总裁AI助理完成的时候,更是对背后的技术产生了兴趣。因为它完全不像印象中的AI语音,非常呆板、僵硬,仿佛不这样就不能表现出这是人工智能一样。但本次的《智能交通》有声书,却几乎听不出来机器合成的痕迹。本项目的参与者告诉我们,这次《智能交通》的语音合成项目,只是基于李彦宏参加某访谈节目中的1小时视频内容完成。其中的可用数据只有约300句左右,训练语料少,可以说与此前我们看到的AI合成语音有很大的进步。
版权声明
本文为[智源社区]所创,转载请带上原文链接,感谢
https://hub.baai.ac.cn/views/16599
边栏推荐
- 7.4 thread exit
- 7.10 thread condition variables
- The longitude and latitude tables of major cities across the country are kept for future reference
- 多表创建视图问题:修改视图数据时报1062
- 将node项目部署到云服务器详细教程 原创
- PHP ueditor uploads files (pictures and videos) to OSS
- leetcode:271. Encoding and decoding of strings
- CatBoost如何处理非数值型(Object)数据
- 【接口测试基础】第三篇 | 传统风格接口与RESTful风格接口区别
- Multi table view creation problem: modify view data times 1062
猜你喜欢
![[super detailed explanation plus source code and test results] a series of operation collection of sequence table](/img/a5/dba8aa35554831558c458f46b18d60.png)
[super detailed explanation plus source code and test results] a series of operation collection of sequence table

AVL balanced binary tree and its four rotation modes

1.2V镍氢电池灯太阳能草坪灯升压驱动IC丝印AaTLB封装SOT23-6和SOP8单片机IC

LeetCode_ 509 Fibonacci number

已拿offer,面试必备知识点

【源码篇】LinkedBlockingQueue源码超详细解读

Man machine verification reCAPTCHA V3 complete instructions

JS notes data type judgment

可替换MPS MP2451的高压DCDC芯片FS2451助力智能电表设计40V0.5A降压IC

JMeter association parameters
随机推荐
将node项目部署到云服务器详细教程 原创
山洪灾害监测预警系统解决方案
Click the imported file or click the component to enter the corresponding component page for editing
低成本成FS68001A、FS68003无线充SOC芯片
7.6 线程属性
warning: LF will be replaced by CRLF in composer. json.
iotdb权限管理
GO语言学习——Go语言基础之流程控制二
(Reprinted) MySQL ha
Difference between breadth first notes and breadth first notes
LeetCode_ 70 climb stairs
[fundamentals of interface testing] Part IV - interface testing process and interface document analysis
1.2V镍氢电池灯太阳能草坪灯升压驱动IC丝印AaTLB封装SOT23-6和SOP8单片机IC
DetNet: A Backbone network for Object Detection
leetcode:386. 字典序排数
[transfer] differences and relations between collection set map vector list
leetcode - 329. Longest increasing path in matrix
7-1 object array (100 points)
7.5 thread waiting for termination
运动耳机选择哪种好、什么款式的耳机戴着舒服