0
本文作者: AI研習(xí)社-譯站 | 2017-09-27 10:24 |
本期論文
"VoCo: Text-based Insertion and Replacement in Audio Narration"
音頻編輯技術(shù)VoCo:基于文本的插入和替換
本期介紹文字語音轉(zhuǎn)換技術(shù)。也就是,我們寫下一段文字,計(jì)算機(jī)把文字轉(zhuǎn)化成語音。這在閱讀新聞或者在無官方旁白的情況下,對于創(chuàng)作有聲讀物非常有用。
一般來講,我們可以獲取語音波形,也可以對語音波形進(jìn)行編輯。但手工波形則非常困難,因?yàn)閭鹘y(tǒng)技術(shù)通常無法準(zhǔn)確地找到波形中單詞或字母的分界,更不用說編輯了。
有了這種技術(shù),我們可以剪切、復(fù)制甚至編輯文本。這項(xiàng)工作由普林斯頓大學(xué)和Adobe的研究人員共同完成,被Adobe自詡為配音界的Photoshop。
想看看基于文本的音頻敘述編輯到底怎么操作的?戳下方視頻了解詳情。
? 觀看論文解讀大概需要 3 分鐘
學(xué)霸們還請自行閱讀論文以獲得更多細(xì)節(jié)
論文原址:http://gfx.cs.princeton.edu/pubs/Jin_2017_VTI/
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。