1
本文作者: 薩洛 | 2017-02-08 15:06 |
在觀看島國教育片的時候,往往在不可描述的部位打上了馬賽克,固然呈現(xiàn)了朦朧美,但部分觀眾依然希望變得更加清晰。現(xiàn)在,Google Brain 在提升圖片分辨率方面取得了突破性進展。他們已經(jīng)成功將 8*8(毫米)網(wǎng)格的像素馬賽克轉(zhuǎn)換成為肉眼可辨識的人物圖像。
而真正能夠提升低分辨率照片細節(jié)的最佳突破口就是神經(jīng)網(wǎng)路。當我們被照片中所包含的像素信息難倒的時候,深度學習能通過人類常說的「幻想」來增加細節(jié)。實質(zhì)就是軟件基于從其他圖片中學習到的信息對圖片進行猜測。
Google Brain 的研究團隊已經(jīng)公布了「像素遞歸超分辨率」技術(shù)(Pixel Recursive Super Resolution)的最新進展,盡管結(jié)果看上去有點瘆人,但是整個還原效果令人印象深刻。
下面是他們復原的效果案例之一:
右手邊的圖片,是 32 x 32 網(wǎng)格的真實人物頭像。左手邊的圖片,是已經(jīng)壓縮到 8 x 8 網(wǎng)格的相同頭像,而中間的照片,是 GoogleBrain 基于低分辨率樣片猜測的原圖。
整個復原過程使用了兩種神經(jīng)網(wǎng)絡(luò)。首先介紹的是調(diào)節(jié)網(wǎng)絡(luò)(Conditioning Network),它將低分辨率照片和數(shù)據(jù)庫中的高分辨率照片進行對比。這個過程中迅速降低數(shù)據(jù)庫照片中的分辨率,并根據(jù)像素顏色匹配一堆同類照片。
接下來介紹的是優(yōu)先網(wǎng)絡(luò)(prior network),它就會猜測那些細節(jié)可以作為高分辨率照片的特征。利用 PixelCNN 架構(gòu),該網(wǎng)絡(luò)會篩查該尺寸的同類照片,并根據(jù)概率優(yōu)先對高分辨率照片進行填充。例如,在論文提供的例子中,提供的同類照片是名人和臥室,優(yōu)先網(wǎng)絡(luò)根據(jù)優(yōu)先級最終確認了名人的照片。優(yōu)先網(wǎng)絡(luò)會在低分辨率和高分辨率照片中做出決定,如果發(fā)現(xiàn)鼻子的可能性比較大,就會選擇鼻子。
接下來,兩個神經(jīng)網(wǎng)絡(luò)的最佳猜測就會進行整合,最終形成的圖像如下:
下面也是一些通過超像素技術(shù)變化的樣本:
在你開始思考:「這并不準確,這個人工智能是愚蠢的」,那么請記住人類同樣也是愚蠢的。一名志愿者參與了這樣的測試,同時展示降低分辨率的照片和通過 Google Brain 復原的照片,然后提問「你猜那張照片來自于相機?」,最終結(jié)果是 10% 的名人照片,測試者選擇了 Google Brain 的照片。在 28% 的臥室樣片中,測試者選擇了 Google Brain 的照片。
盡管技術(shù)是純凈的,但是未來可能會有非??膳碌膽?yīng)用。就像是波士頓馬拉松爆炸案一樣,不難聯(lián)想到一些執(zhí)法部門會濫用該軟件來抓取嫌疑犯。更為重要的是,人工智能的多次嘗試已經(jīng)被證明存在種族主義,因為往往會參雜人類的偏見。分析型人工智能和圖像技術(shù)的結(jié)合,在未來必然會經(jīng)歷一段漫長的調(diào)試過程。
via gizmodo
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。