普林斯頓聯(lián)合Adobe 連聲音都能PS了 | 2分鐘讀論文

本文作者： AI研習(xí)社-譯站

2017-09-27 10:24

導(dǎo)語：AI 研習(xí)社出品系列短視頻《 2 分鐘論文》，帶大家用碎片時(shí)間閱覽前沿技術(shù)，了解 AI 領(lǐng)域的最新研究成果。

普林斯頓聯(lián)合Adobe 連聲音都能PS了 | 2分鐘讀論文

本期論文

"VoCo: Text-based Insertion and Replacement in Audio Narration"

音頻編輯技術(shù)VoCo：基于文本的插入和替換

本期介紹文字語音轉(zhuǎn)換技術(shù)。也就是，我們寫下一段文字，計(jì)算機(jī)把文字轉(zhuǎn)化成語音。這在閱讀新聞或者在無官方旁白的情況下，對于創(chuàng)作有聲讀物非常有用。

普林斯頓聯(lián)合Adobe 連聲音都能PS了 | 2分鐘讀論文

一般來講，我們可以獲取語音波形，也可以對語音波形進(jìn)行編輯。但手工波形則非常困難，因?yàn)閭鹘y(tǒng)技術(shù)通常無法準(zhǔn)確地找到波形中單詞或字母的分界，更不用說編輯了。

普林斯頓聯(lián)合Adobe 連聲音都能PS了 | 2分鐘讀論文

有了這種技術(shù)，我們可以剪切、復(fù)制甚至編輯文本。這項(xiàng)工作由普林斯頓大學(xué)和Adobe的研究人員共同完成，被Adobe自詡為配音界的Photoshop。

想看看基于文本的音頻敘述編輯到底怎么操作的？戳下方視頻了解詳情。

? 觀看論文解讀大概需要 3 分鐘

學(xué)霸們還請自行閱讀論文以獲得更多細(xì)節(jié)

普林斯頓聯(lián)合Adobe 連聲音都能PS了 | 2分鐘讀論文

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

AI研習(xí)社-譯站

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道，傳播前沿人工智能知識，讓語言不再成為學(xué)習(xí)知識的門檻。（原雷鋒字幕組）

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章