除了修图 Adobe还能修你的话

2016-11-10 15:54 电商 来源:思达派 查看原文

VoCo技术能够通过语段解析,编造出你从未说过的话

近日Adobe展示了一项能够编辑录音的黑科技,该技术不仅可以使原话“改口”,还能以相同的“嗓音”创造出新的句子。基于此,这项技术被称为“音频PS”。

这项技术属于混录VoCo(音频转换)。首先,用户界面里有一个文本框。文本框内显示的是最初录入的音频文本。用户能够自由编辑字段,调序增删,或者干脆直接敲进新的词句。键入新词后需略等片刻,待新的语音生成后,便可按播放键收听到编辑后的音频片段。

VoCo施展超能力之前,需要先大剂量“服用”目标人的语音数据(当前版本需要约20分钟左右长度,完善后所需时间应该会有所改善),将其分解成音素(即构成口语的每一个不同的声音元素)。在此基础上VoCo会对目标人的语言特点进行建模,理论上说应该包含目标人的语速、重音分布、怪癖等,对此Adobe方面并没有透露很多。

随后,当编辑目标人的讲话时,VoCo要么从20分钟的音频样本当中找(如果有的话),要么通过原始的音素结合算法生成。

VoCo很容易让人联想起Adobe公司在几个月前发布的一项PS技术:内容感知填充。这项技术也具备“无中生有”的超能力。这项技术一被提出,便引发了许多顾虑,人们担心这种无痕增删细节的技术会被不法分子所利用。因此,在对待VoCo的态度上Adobe相当谨慎,虽说目前还只停留在技术原型阶段,Adobe已经在考虑如何通过“水印和甄别”来防止欺诈。

VoCo首次进入大众视野是在2016年的Adobe Max大会上。该公司通常会在将新技术商业化之前一两年向公众展示。倘若VoCo能够成功走出原型阶段,将很有可能作为Adobe Audition的组件之一。

届时用户可以自由编辑播客和录音,更重要的是,还能够恶搞名人政客的音频发到新闻社交网站Reddit上。此外,用户还能够绕过目前银行所使用的语音识别技术。想想吧,使用黑科技对你的“宿敌”进行恶毒语音留言轰炸,而且这些语音(非常像那么回事的)还是出自他们至亲至爱之人之口,尽管实际上这只是你用家里的电脑捣鼓出来的……

为您推荐: