AI克隆比尔·盖茨的声音,精准复制,真假难辨

但是现在,研究员们似乎已经取得了进展。如果你听了盖茨的克隆所发出的声音,我想你是会同意的。因为它听起来很像比尔·盖茨,你甚至很难分辨出它和他真实声音的区别。
研究人员展示了他们的研究。在这里,机器模仿着盖茨的腔调发声,“请给你珍爱的朋友发一封充满爱意的短信。”其中最不可思议的是,这台机器在说“珍爱(cherish)”时,准确无误地捕捉到盖茨不断上升的语调变化的。
这项技术被称为MelNet,可以用来复制人类的语调。到目前为止,盖茨和其他许多人的声音都被它完美地再现了。瓦斯奎兹和刘易斯说,克隆的音频取自各类Ted演讲。
两位研究人员还表示,直到最近,文本到语音转换软件还不能很好地工作的原因是它使用了波形图记录声音。这些图显示了声音在几秒钟内的音阶变化。如果你听到过盖茨说“珍爱”这个词,就知道他的语气是变化剧烈的。在试图模仿一个人的时候,深度学习机器必须预测到所有这些细微的变化,这很不容易。
瓦斯奎兹和刘易斯说,他们通过使用一种叫做光谱图的东西来训练机器,成功地克隆了声音。
研究人员说:“光谱图的时间轴比波形图的时间轴紧凑几个数量级,这意味着在波形中跨越数万个时间步长的依赖关系在光谱图中只跨越数百个时间步长。这使得我们的光谱图模型能够在数秒内记录各种语音和音乐样本,并保持它们一致性。”
不过,他们也经历了一些挫折。研究小组表示,对他们来说,几乎完美地复制一个句子并不难,难的是复制那些在长达几十秒或几分钟的时间里,显示了情绪变化的复杂语调”。尽管如此,当涉及到人机交互时,研究小组说,在只涉及简短对话的情境中,这项技术可能会带来革命性的变化。
mediainfo(视频参数检测工具)
行业软件
14.8M
MediaInfo Mac版
行业软件
10.66M
PassFab for Excel(Excel密码恢复工具)
行业软件
33.14M
-
下载思源黑体字体
下载工具 | 96.19M
思源黑体是由Google和Adobe历经3年在2014年7月联合发布推广的一款开源字体。字体共有7种(粗细ExtraLight、Light、Normal、Regular、Medium、Bold 和 Heavy)。而且完全的支持简繁体中文。日文和韩文。
-
下载前程无忧ios版
办公商务 | 369.2M
前程无忧ios版是一款找工作的软件。你只用轻轻一点手机,便可以找到超多的工作类型,总有你喜欢的类型。前程无忧为广大的求职者提供人力资源服务,你可以根据自己的需求进行搜索与投递,从而帮助你找到心仪只为。类似的软件还有很多,比如拉钩、58同城、赶集网、智联等等。
-
下载Bandizip专业版
行业软件 | 8.04M
Bandizip专业版是一款来自韩国开发商Bandisoft为专业用户提供的付费版本。自Bandizipv7 0 开始,Bandizip有三种不同的版本,分别是标准版、企业版、以及小编此次带来的专业版。不同的版本功能都不一样,对于经常需要使用解压缩功能的朋友而言,专业版的功能非常强悍。
- 华为Mate X6宣布618降价3000元 后置5000万像素四摄05-15
- 韩媒试驾极氪9X:辅助驾驶与豪华配置获高度评价05-15
- 曝vivo X500系列搭载高密度电池 容量进入7系列梯队05-15
- 索尼Xperia 1 VIII相机样张引争议 索尼色彩科学遭质疑05-15
- LG Uplus推出50万韩元档Galaxy Buddy5 瞄准中低价市场05-15
- 售价3万元的华为非凡大师手表今日开售 镶嵌99颗钻石05-15
- 华为WATCH FIT 5 Pro上市 轻度使用续航可达10天05-15
- 郭明錤深解析苹果与英特尔代工协议:八成订单来自iPhone05-15
- 小鹏GX全国试驾开启 百公里加速4.98秒 综合续航1585km05-15
- 配备实体键盘!Titan 2 Elite手机开启预订 运行Android05-15
- 岚图汽车CBO首谈逆袭:从每天想怎么熬过去到净利润10.2亿05-15
