6
本文作者: 知社學(xué)術(shù)圈 | 2016-01-29 11:22 |
【編者按】本文來(lái)自知社學(xué)術(shù)圈士奇。
美國(guó)時(shí)間1月27日,F(xiàn)acebook與Google兩家之間玩了一場(chǎng)沒有硝煙的戰(zhàn)爭(zhēng)。在相隔不到幾個(gè)小時(shí)的時(shí)間里,雙方先后公布了自家人工智能技術(shù)(AI)在圍棋軟件上的進(jìn)展與水平。如此緊張的撕咬,恐怕并非巧合。我們來(lái)看看到底誰(shuí)家的人工智能更強(qiáng)一些......
臉書的聲音
周三早上,F(xiàn)acebook創(chuàng)始人扎克伯格在自己的臉書上敲了這么一段:“……科學(xué)家們已經(jīng)花了20年教電腦兄下圍棋,現(xiàn)在我們馬上要實(shí)現(xiàn)啦 (We’re getting close)。在過(guò)去半年里,我們所創(chuàng)造的AI只用0.1秒就走一步,效果與以前那些幾年才設(shè)計(jì)出來(lái)的系統(tǒng)一樣好……”
背后的故事
Facebook去年11月就在International Conference on Learning Representations (ICLR) 上發(fā)表了論文《Better Computer Go Player with Neural Network and Long-term Prediction》作者為Yuandong Tian和Yan Zhu兩名華人。論文介紹了代號(hào)為黑暗森林的圍棋人工智能系統(tǒng)。幾乎在扎克伯格發(fā)布消息的同一時(shí)間,F(xiàn)acebook人工智能研發(fā)中心發(fā)表了該論文的更新版,中心負(fù)責(zé)人Yann LeCun也在Facebook上作了相關(guān)介紹。
該項(xiàng)目獨(dú)立帶頭人Yuandong Tian表示:“圍棋中極多的分支因子使得傳統(tǒng)的搜索技術(shù)難有建樹,即使在尖端硬件平臺(tái)上運(yùn)行也非常乏力。如果換了黑白方,圍棋的評(píng)估體系也會(huì)有很大變化?!?/p>
(Facebook圍棋程序已達(dá)業(yè)余五段水平)
這一次,他們?cè)谛掳姹鞠到y(tǒng)黑暗森林2上面加入了蒙特卡洛樹搜索,與之前的卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合后,性能有了進(jìn)一步提升。對(duì)戰(zhàn)人類棋手時(shí),黑暗森林2可以達(dá)到業(yè)余三段水平;通過(guò)7.5萬(wàn)次運(yùn)行后,則可以在KGS服務(wù)器上穩(wěn)定保持在業(yè)余五段水平。
谷歌的聲音
同一天,Google在官方博客中表示:“……我們很驕傲地公告天下,我們的科學(xué)家已經(jīng)搞定了圍棋,并攻克了人工智能領(lǐng)域的一項(xiàng)重大挑戰(zhàn) (achieved one of the grand challenges of AI)……”
兩邊的開場(chǎng)白都從介紹中國(guó)古代這項(xiàng)頭腦競(jìng)技開始,Google甚至還提到了孔子和四藝。不過(guò)就后面的用詞來(lái)看,Google的技術(shù)似乎更勝一籌。
背后的故事
Google的圍棋論文可謂來(lái)得早不如來(lái)得巧。
同樣在1月27日,DeepMind團(tuán)隊(duì)發(fā)表的《Mastering the game of Go with deep neural networks and tree search》作為Nature封面論文上線。
DeepMind是一個(gè)位于倫敦的人工智能團(tuán)隊(duì),2014年其公司被Google以4億英鎊的價(jià)格收購(gòu)。團(tuán)隊(duì)創(chuàng)始人Demis Hassabis在周三發(fā)表的官方博客中表示,他們開發(fā)的圍棋程序AlphaGo融合了高級(jí)樹狀查找和深度神經(jīng)網(wǎng)絡(luò)。通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行的3000萬(wàn)步訓(xùn)練 (所有棋譜均來(lái)自人類專業(yè)棋手的比賽),AlphaGo預(yù)測(cè)出人類對(duì)手下一步走法的正確率已經(jīng)達(dá)到了57%,之前的紀(jì)錄是44%。
(AlphaGo 5-0 擊敗樊麾)
談到圍棋戰(zhàn)績(jī),Google明顯應(yīng)該更驕傲一些。AlphaGo在2015年10月5日以五連勝的成績(jī)擊敗了歐洲圍棋冠軍樊麾。這次對(duì)決完全符合比賽規(guī)則,沒有任何讓棋設(shè)定。今年三月,AlphaGo將對(duì)陣世界頂尖棋手——韓國(guó)“飛禽島少年”李世乭。讓我們拭目以待。
(韓國(guó)棋手李世乭)
樊麾,2013-2015年三度歐洲圍棋冠軍
在中國(guó),圍棋不僅是一項(xiàng)比賽,它還是生活的一面鏡子。我們說(shuō),假如你的棋下得有問題,那很可能是你心性的問題——棋如其人。
輸棋確實(shí)很難過(guò)。和AlphaGo對(duì)戰(zhàn)之前,我覺得我能贏。在第一局失利后,我改變了戰(zhàn)術(shù),增強(qiáng)了進(jìn)攻,但還是輸了。問題是人類有時(shí)會(huì)犯致命的錯(cuò)誤,因?yàn)槲覀兪侨?。有時(shí)我們會(huì)疲憊,有時(shí)我們求勝心切,我們總有這樣那樣的壓力。電腦程序不會(huì)這樣,它非常強(qiáng),也非常穩(wěn)定,簡(jiǎn)直就像一堵墻一樣。對(duì)我來(lái)說(shuō)這是很大的差別。我知道AlphaGo是個(gè)電腦,但如果沒人告訴的話,我可能會(huì)覺得它是個(gè)有點(diǎn)陌生卻又非常強(qiáng)大的對(duì)手,是個(gè)真人。
當(dāng)然,輸?shù)舯荣愖屛也惶_心,不過(guò)作為職業(yè)選手,我們輸過(guò)很多比賽。所以,失敗了就從中學(xué)習(xí),也許會(huì)有所收獲??傊畯拈L(zhǎng)遠(yuǎn)來(lái)講這是一件好事。
Toby Manning,英國(guó)圍棋協(xié)會(huì)司庫(kù),樊麾人機(jī)對(duì)戰(zhàn)的裁判
圍棋玩家都知道,人工智能尚未解決圍棋這個(gè)問題。所以我想人們會(huì)希望見到電腦達(dá)到人類專業(yè)水平,但我覺得這可能還要10年的時(shí)間。在這次比賽中,我本來(lái)是看好樊麾的。
很神奇的是,在比賽過(guò)程中你很難分辨誰(shuí)是人類,誰(shuí)是電腦。在很多圍棋軟件的比賽中,你可以看到很多合理的棋路,然后電腦還是會(huì)瞬間崩盤。但這次不一樣,你真的很難分辨誰(shuí)是誰(shuí)。
AlphaGo與人類不同的一大特點(diǎn)是掌控時(shí)間的方式,樊麾下棋所用的時(shí)間比電腦要長(zhǎng)。AlphaGo的路數(shù)看起來(lái)并不像人類那樣具有侵略性。它會(huì)平靜地布局,而非發(fā)起進(jìn)攻或試圖吃掉一片棋子。
我認(rèn)為圍棋界的主要反應(yīng)會(huì)是,就像IBM的深藍(lán)獲得國(guó)際象棋大師地位后一樣,人們希望自己能夠掌控軟件,并在自己的比賽中彌補(bǔ)自己的不足。
Hajin Lee,國(guó)際圍棋聯(lián)合會(huì)秘書長(zhǎng)
當(dāng)我知道那個(gè)電腦要挑戰(zhàn)職業(yè)頂尖棋手李世乭的時(shí)候,真的很吃驚。我當(dāng)時(shí)覺得這個(gè)挑戰(zhàn)者絕對(duì)對(duì)頂級(jí)選手有多強(qiáng)完全沒概念。但實(shí)際上,可能我才是那個(gè)不知道這個(gè)電腦有多強(qiáng)的人?,F(xiàn)在我對(duì)這個(gè)比賽非常興奮。
誰(shuí)會(huì)贏呢?我不知道。李世乭自己也覺得可能那電腦跟他一樣強(qiáng)??赡苁俏衣牭搅颂郃lphaGo的消息,我現(xiàn)在驚訝于它的強(qiáng)大。同時(shí)我也非常了解李世乭的水平,所以我認(rèn)為他們雙方五五開吧。
我覺得圍棋是個(gè)很有內(nèi)涵的競(jìng)技,我不覺得如果電腦AI擊敗了人類會(huì)對(duì)圍棋造成什么傷害。我想人們會(huì)接受自己被電腦技術(shù)超越這件事。
Jonathan Schaeffer,阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)家,Chinook設(shè)計(jì)師
我想這還不是圍棋版的深藍(lán)時(shí)刻。真正的成就是這個(gè)程序能作為選手在頂級(jí)比賽中較量的時(shí)候。深藍(lán)從1989年開始就常常戰(zhàn)勝各路大師,最后登頂則是八年之后的事情。但就目前情況來(lái)看,我認(rèn)為AlphaGo和頂級(jí)人類選手之間的差距被大大縮短了??赡苤恍枰龠M(jìn)行一點(diǎn)努力和改善,再提高一點(diǎn)計(jì)算能力,不出一兩年,它就能打敗人類。
就今年3月份的比賽來(lái)說(shuō),不是打擊AlphaGo團(tuán)隊(duì),我還是看好人類。我們可以把AlphaGo看成是少年天才。它突然學(xué)了一手好棋,進(jìn)步神速,但畢竟還是經(jīng)驗(yàn)有限。從國(guó)際象棋和西洋跳棋來(lái)看,經(jīng)驗(yàn)還是很重要的。
Demis Hassabis,DeepMind創(chuàng)始人
AlphaGo正在突飛猛進(jìn),甚至?xí)阶畎舻娜祟愡x手。能夠看它在圍棋規(guī)則內(nèi)去創(chuàng)造新的東西,感覺很神奇。我們對(duì)自己創(chuàng)造的這個(gè)系統(tǒng)有種很密切的感情,特別是它被創(chuàng)造的方式——它會(huì)學(xué)習(xí),我們也會(huì)教它,它的風(fēng)格就像人一樣。和其他編出來(lái)的程序不同,你不知道它到底都會(huì)什么,因?yàn)樗軌蜃约簩W(xué)習(xí)。
用Facebook人工智能研究中心Yuandong Tian的話說(shuō),兩家公司確實(shí)存在著某種“友好”的競(jìng)爭(zhēng)。是呀,這樣兩家公司之間的較量一定是件好事。腦海里不禁想起了去年Google Chrome團(tuán)隊(duì)送給Microsoft Edge團(tuán)隊(duì)的那個(gè)大蛋糕,不知道這一次是誰(shuí)送給誰(shuí)呢?
參考文獻(xiàn)
1. Nature doi:10.1038/nature.2016.19255
2. http://120.52.73.78/arxiv.org/pdf/1511.06410.pdf
3. Googleblog、Facebook、 Wired
【作者介紹】知社學(xué)術(shù)圈,由清華教授發(fā)起的海歸學(xué)者發(fā)起的公益學(xué)術(shù)交流平臺(tái),旨在分享學(xué)術(shù)信息,整合學(xué)術(shù)資源,加強(qiáng)學(xué)術(shù)交流,促進(jìn)學(xué)術(shù)進(jìn)步。
作者文章推薦閱讀:
1、機(jī)器自學(xué)72小時(shí)堪比國(guó)際大師,深度學(xué)習(xí)到底有多厲害?
2、谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。