5
本文作者: 羅比 | 2015-06-08 22:36 |
一名來(lái)自斯坦福大學(xué)的學(xué)生Andrej Karpathy,發(fā)布了一項(xiàng)叫Lua的代碼,它能模仿人類語(yǔ)言。Karpathy的項(xiàng)目頁(yè)面中已經(jīng)有一些點(diǎn)子和例子,而真正需要采樣的是能用來(lái)建立復(fù)發(fā)性神經(jīng)網(wǎng)絡(luò)(RNN)的材料,也就是人類語(yǔ)言的材料。
最近,藝術(shù)家兼新媒體人Samim做了一項(xiàng)測(cè)試,證明用該算法可以很好地模仿奧巴馬演講。奧巴馬的RNN是基于一項(xiàng)Lua代碼,首先,Samim建立了一個(gè)網(wǎng)絡(luò)爬蟲來(lái)收集奧巴馬所有的公共演講,并對(duì)訪談和辯論內(nèi)容進(jìn)行分析,所有的這一切都被送入Karpathy的RNN模型中,然后用一小段話作引子(被稱為種子),算法就能生成一段演講。
奧巴馬的演講并不少,像“希望”和“Yes we can”都是很熟悉的主題了。自2007年以來(lái),奧巴馬的演講稿撰稿人已經(jīng)寫了730895字的文本,然而這還不包括采訪和辯論。
算法生成的奧巴馬語(yǔ)錄如下:
種子:反恐戰(zhàn)爭(zhēng)
大家好,非常感謝,上帝保佑美國(guó)。我們已經(jīng)開(kāi)始在全世界收集醫(yī)療保險(xiǎn)信息。我們辛勤付出卻得不到發(fā)展。
種子:中國(guó)
非常感謝你,請(qǐng)大家坐下;非常感謝你;你們很友善;謝謝。
種子:工作
下午好,上帝保佑;國(guó)家增加預(yù)算來(lái)面對(duì)全新的挑戰(zhàn)——事實(shí)是由我們自己產(chǎn)生的。
從中可以看出,算法的表現(xiàn)并不令人樂(lè)觀。“最搞笑的是奧巴馬的RNN真的很喜歡禮貌地說(shuō):下午好,美好的一天,上帝保佑你,上帝保佑美國(guó),謝謝。”Samim說(shuō)道,不過(guò)他還沒(méi)有完全完成實(shí)驗(yàn)。
不過(guò)總統(tǒng)的演講往往確實(shí)包含不少套話,這也難怪算法會(huì)學(xué)到這一手。而且我們已經(jīng)有了能寫新聞稿和欣賞攝影作品的機(jī)器人了,說(shuō)不定總統(tǒng)的演講稿真的可以用算法來(lái)寫。
via mb
關(guān)注腦洞微信號(hào)(hackmind),帶你領(lǐng)略更多前沿技術(shù)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。