Adobe 公司創(chuàng)新產(chǎn)品用戶大會(huì) Adobe MAX 2016 上,Adobe 公司的 Zeyu Jin(顯然是個(gè)天朝工程師)宣布了 VoCo,一款可以讓你如同文本一般編輯口語(yǔ)音頻的應(yīng)用程序。
VoCo 是針對(duì)音頻編輯工作的,它可以自動(dòng)識(shí)別出人聲語(yǔ)音里的每個(gè)單詞(目前應(yīng)該還僅限英文),然后你就可以按照需求剪切和粘貼文本從而改變音頻詞匯的順序,而不必去直接編輯波形(請(qǐng)看上面的演示視頻,越到后面越精彩)。關(guān)鍵它還有個(gè)超贊的地方,它還可以作為一個(gè)創(chuàng)作工具,只要 VoCo 對(duì)一個(gè)人 20 分鐘的語(yǔ)音進(jìn)行分析之后,它就可以直截按新的文本合成這個(gè)人聲音。就是說(shuō)你只要被別人捕捉到了至少 20 分鐘的演講,然后這個(gè)軟件就可以生成你從來(lái)沒有說(shuō)過(guò)的話,讓別人聽上去足以以假亂真,以為你真的說(shuō)過(guò)這些話。
雖然還只是在會(huì)上演示,過(guò)渡的地方還有些不完美,還沒有成為正式的產(chǎn)品,但是我們可以想象它的前景,特別是對(duì)于配音等工作來(lái)說(shuō)可以成為又一件神器了。甚至一個(gè)聲優(yōu)只要被識(shí)別出了自己的聲音,視頻編輯人員就可以直接輸入文本讓軟件來(lái)自己說(shuō)話了。
Project VoCo 可以說(shuō)是秉承了 Adobe 公司的理念,可以看到 VoCo 的這種方式有點(diǎn)像 PS(Photoshop) 一般可以將音頻像圖像一樣分割成單獨(dú)的元素,甚至可以用現(xiàn)有元素生成新的內(nèi)容來(lái)完成完整的作品。當(dāng)然如果是單純的分割元素重新拼接可能容易實(shí)現(xiàn),厲害就厲害在它能根據(jù)某人語(yǔ)音進(jìn)行分析之后直截生成新的音頻,也就是直接合成出來(lái)。我們推測(cè)這就牽扯到很多內(nèi)容了,音頻分析(比如頻率,共振峰等),還有機(jī)器學(xué)習(xí)等等。
我們都知道 Yamaha 的 VOCALOID 技術(shù),一提到初音之類的甚至應(yīng)該是很多人都知道?梢韵胂笠幌,如果是 VoCo 這樣的技術(shù)應(yīng)用到這個(gè)上面是不是可以直接快速開發(fā)新的虛擬歌手?甚至個(gè)人在家錄上一些歌聲供分析之后是不是就可以直接做個(gè)自己的定制虛擬歌手呢?
另一,日本人最近也開發(fā)了一個(gè)叫 リアチェンvoice 的產(chǎn)品,它可以實(shí)時(shí)將你的聲音模擬成另?yè)?jù)特點(diǎn)的別人的聲音,有點(diǎn)類似柯南的實(shí)時(shí)變聲器,可以變成任何一個(gè)人的聲音。還有 Krotos Dehumaniser 可以將你的聲音輕松變成怪獸的聲音。這些產(chǎn)品放到一起可能會(huì)帶來(lái)配音行業(yè)空前的變革。原諒我的腦洞,我想著以后會(huì)有公司開發(fā)一個(gè)融合了這些技術(shù)的產(chǎn)品...
期待 VoCo 能夠早日變成成熟產(chǎn)品推向市場(chǎng)。
如今唱歌都可以虛擬歌手直接碼字了,是不是以后配音也可以直接碼字了...
|