2
本文作者: 溫曉樺 | 2016-03-13 15:14 |
via the verge
"一棵樹爬上了一塊木頭。一只大鳥坐在山頭上。一輛自行車斜靠在另一輛自行車上。"
別驚訝,這是一款新的iOS應(yīng)用——AI Scry描述的世界。人工智能應(yīng)用(AI)AI Scry能夠使用神經(jīng)網(wǎng)絡(luò)來識別手機攝像頭所看到的世界,并把它描述出來。從上述的例子可以看出,應(yīng)用識別的結(jié)果有時是驚人的準(zhǔn)確,有時則是“逗人的玩笑”。不過,讓計算機用一種天馬行空的想象來描繪世界,也是很歡樂的啊。
AI Scry其實也不是一個全新的概念。它最初由一個叫disk cactus的藝術(shù)科技工作室發(fā)明,利用神經(jīng)網(wǎng)絡(luò)技術(shù)Neural Talk來驅(qū)動。斯坦福計算機科學(xué)家Andrej Karpathy最初成立了這個項目,后來開放了其源代碼。據(jù)悉,現(xiàn)在已經(jīng)出現(xiàn)了許多類似的人工智能項目,比如針對Android平臺的應(yīng)用,還有Facebook為方便盲人識別圖片開發(fā)的人工智能程序等等。不過,AI Scry是專注于機器視覺的程序。
disk cactus的Sam Kronick表示,他和他的同事們都希望通過這個應(yīng)用來將AI和機器學(xué)習(xí)的問題和好處介紹給人們。他說:“如論是能夠建立用戶播放清單的Spotify,還是能夠計算用戶信用分的公司,其背后的系統(tǒng)都越來越普遍,但是卻不太為外界所了解。但是,當(dāng)程序不受約束時,我們就能看到它們‘自由的想法’,也能隨之展現(xiàn)出人們對系統(tǒng)所做的設(shè)計、編程和訓(xùn)練。”
根據(jù)介紹,AI Scry可以聰明絕頂,也會愚蠢至極。聰明的時候可以分辨出鉛筆和鋼筆,或者識別出桌子上5美元的賬單。宏觀來說,它可以說出裝滿東西的冰箱和種滿樹的公園之間的區(qū)別,或者是在某個地點上,那么挺著一輛車或是站著一個人。
同時,它也可以是一個“想象力非凡”的程序。比如,當(dāng)描述非常密集的灌木叢時,它會說這是“西蘭花公園的局部特寫”……
然而,這兩種極端的結(jié)果都是可以調(diào)節(jié)的。AI Scry里面有一個Attention Aperture的功能用以調(diào)節(jié)結(jié)果的準(zhǔn)確度,或者說選擇翻譯結(jié)果的“想象自由度”。越往左擰,你得到的答案越穩(wěn)妥;反之,計算機則絕不放過發(fā)揮想象力的機會。
Kronick表示,通過調(diào)節(jié)想象的程度來探測神經(jīng)網(wǎng)絡(luò),這對想要觀察完整AI世界的人們來說,是個有趣的方法。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。