Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

本文作者：知社學(xué)術(shù)圈

2016-01-29 11:22

導(dǎo)語(yǔ)：Facebook與Google之間，關(guān)于圍棋人工智能的沒(méi)有硝煙的戰(zhàn)爭(zhēng)。到底誰(shuí)家的人工智能更強(qiáng)一點(diǎn)？

【編者按】本文來(lái)自知社學(xué)術(shù)圈士奇。

美國(guó)時(shí)間1月27日，F(xiàn)acebook與Google兩家之間玩了一場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)。在相隔不到幾個(gè)小時(shí)的時(shí)間里，雙方先后公布了自家人工智能技術(shù)(AI)在圍棋軟件上的進(jìn)展與水平。如此緊張的撕咬，恐怕并非巧合。我們來(lái)看看到底誰(shuí)家的人工智能更強(qiáng)一些......

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

| Facebook

臉書(shū)的聲音

周三早上，F(xiàn)acebook創(chuàng)始人扎克伯格在自己的臉書(shū)上敲了這么一段：“……科學(xué)家們已經(jīng)花了20年教電腦兄下圍棋，現(xiàn)在我們馬上要實(shí)現(xiàn)啦 (We’re getting close)。在過(guò)去半年里，我們所創(chuàng)造的AI只用0.1秒就走一步，效果與以前那些幾年才設(shè)計(jì)出來(lái)的系統(tǒng)一樣好……”

背后的故事

Facebook去年11月就在International Conference on Learning Representations (ICLR) 上發(fā)表了論文《Better Computer Go Player with Neural Network and Long-term Prediction》作者為Yuandong Tian和Yan Zhu兩名華人。論文介紹了代號(hào)為黑暗森林的圍棋人工智能系統(tǒng)。幾乎在扎克伯格發(fā)布消息的同一時(shí)間，F(xiàn)acebook人工智能研發(fā)中心發(fā)表了該論文的更新版，中心負(fù)責(zé)人Yann LeCun也在Facebook上作了相關(guān)介紹。

該項(xiàng)目獨(dú)立帶頭人Yuandong Tian表示：“圍棋中極多的分支因子使得傳統(tǒng)的搜索技術(shù)難有建樹(shù)，即使在尖端硬件平臺(tái)上運(yùn)行也非常乏力。如果換了黑白方，圍棋的評(píng)估體系也會(huì)有很大變化?！?/p>

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

（Facebook圍棋程序已達(dá)業(yè)余五段水平）

這一次，他們?cè)谛掳姹鞠到y(tǒng)黑暗森林2上面加入了蒙特卡洛樹(shù)搜索，與之前的卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合后，性能有了進(jìn)一步提升。對(duì)戰(zhàn)人類(lèi)棋手時(shí)，黑暗森林2可以達(dá)到業(yè)余三段水平；通過(guò)7.5萬(wàn)次運(yùn)行后，則可以在KGS服務(wù)器上穩(wěn)定保持在業(yè)余五段水平。

| Google

谷歌的聲音

同一天，Google在官方博客中表示：“……我們很驕傲地公告天下，我們的科學(xué)家已經(jīng)搞定了圍棋，并攻克了人工智能領(lǐng)域的一項(xiàng)重大挑戰(zhàn) (achieved one of the grand challenges of AI)……”

兩邊的開(kāi)場(chǎng)白都從介紹中國(guó)古代這項(xiàng)頭腦競(jìng)技開(kāi)始，Google甚至還提到了孔子和四藝。不過(guò)就后面的用詞來(lái)看，Google的技術(shù)似乎更勝一籌。

背后的故事

Google的圍棋論文可謂來(lái)得早不如來(lái)得巧。

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

同樣在1月27日，DeepMind團(tuán)隊(duì)發(fā)表的《Mastering the game of Go with deep neural networks and tree search》作為Nature封面論文上線。

DeepMind是一個(gè)位于倫敦的人工智能團(tuán)隊(duì)，2014年其公司被Google以4億英鎊的價(jià)格收購(gòu)。團(tuán)隊(duì)創(chuàng)始人Demis Hassabis在周三發(fā)表的官方博客中表示，他們開(kāi)發(fā)的圍棋程序AlphaGo融合了高級(jí)樹(shù)狀查找和深度神經(jīng)網(wǎng)絡(luò)。通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行的3000萬(wàn)步訓(xùn)練 (所有棋譜均來(lái)自人類(lèi)專(zhuān)業(yè)棋手的比賽)，AlphaGo預(yù)測(cè)出人類(lèi)對(duì)手下一步走法的正確率已經(jīng)達(dá)到了57%，之前的紀(jì)錄是44%。

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

（AlphaGo 5-0 擊敗樊麾）

談到圍棋戰(zhàn)績(jī)，Google明顯應(yīng)該更驕傲一些。AlphaGo在2015年10月5日以五連勝的成績(jī)擊敗了歐洲圍棋冠軍樊麾。這次對(duì)決完全符合比賽規(guī)則，沒(méi)有任何讓棋設(shè)定。今年三月，AlphaGo將對(duì)陣世界頂尖棋手——韓國(guó)“飛禽島少年”李世乭。讓我們拭目以待。

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

（韓國(guó)棋手李世乭）

| 專(zhuān)家怎么看？

樊麾，2013-2015年三度歐洲圍棋冠軍

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

在中國(guó)，圍棋不僅是一項(xiàng)比賽，它還是生活的一面鏡子。我們說(shuō)，假如你的棋下得有問(wèn)題，那很可能是你心性的問(wèn)題——棋如其人。

輸棋確實(shí)很難過(guò)。和AlphaGo對(duì)戰(zhàn)之前，我覺(jué)得我能贏。在第一局失利后，我改變了戰(zhàn)術(shù)，增強(qiáng)了進(jìn)攻，但還是輸了。問(wèn)題是人類(lèi)有時(shí)會(huì)犯致命的錯(cuò)誤，因?yàn)槲覀兪侨?。有時(shí)我們會(huì)疲憊，有時(shí)我們求勝心切，我們總有這樣那樣的壓力。電腦程序不會(huì)這樣，它非常強(qiáng)，也非常穩(wěn)定，簡(jiǎn)直就像一堵墻一樣。對(duì)我來(lái)說(shuō)這是很大的差別。我知道AlphaGo是個(gè)電腦，但如果沒(méi)人告訴的話，我可能會(huì)覺(jué)得它是個(gè)有點(diǎn)陌生卻又非常強(qiáng)大的對(duì)手，是個(gè)真人。

當(dāng)然，輸?shù)舯荣愖屛也惶_(kāi)心，不過(guò)作為職業(yè)選手，我們輸過(guò)很多比賽。所以，失敗了就從中學(xué)習(xí)，也許會(huì)有所收獲?？傊畯拈L(zhǎng)遠(yuǎn)來(lái)講這是一件好事。

Toby Manning，英國(guó)圍棋協(xié)會(huì)司庫(kù)，樊麾人機(jī)對(duì)戰(zhàn)的裁判

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

圍棋玩家都知道，人工智能尚未解決圍棋這個(gè)問(wèn)題。所以我想人們會(huì)希望見(jiàn)到電腦達(dá)到人類(lèi)專(zhuān)業(yè)水平，但我覺(jué)得這可能還要10年的時(shí)間。在這次比賽中，我本來(lái)是看好樊麾的。

很神奇的是，在比賽過(guò)程中你很難分辨誰(shuí)是人類(lèi)，誰(shuí)是電腦。在很多圍棋軟件的比賽中，你可以看到很多合理的棋路，然后電腦還是會(huì)瞬間崩盤(pán)。但這次不一樣，你真的很難分辨誰(shuí)是誰(shuí)。

AlphaGo與人類(lèi)不同的一大特點(diǎn)是掌控時(shí)間的方式，樊麾下棋所用的時(shí)間比電腦要長(zhǎng)。AlphaGo的路數(shù)看起來(lái)并不像人類(lèi)那樣具有侵略性。它會(huì)平靜地布局，而非發(fā)起進(jìn)攻或試圖吃掉一片棋子。

我認(rèn)為圍棋界的主要反應(yīng)會(huì)是，就像IBM的深藍(lán)獲得國(guó)際象棋大師地位后一樣，人們希望自己能夠掌控軟件，并在自己的比賽中彌補(bǔ)自己的不足。

Hajin Lee，國(guó)際圍棋聯(lián)合會(huì)秘書(shū)長(zhǎng)

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

當(dāng)我知道那個(gè)電腦要挑戰(zhàn)職業(yè)頂尖棋手李世乭的時(shí)候，真的很吃驚。我當(dāng)時(shí)覺(jué)得這個(gè)挑戰(zhàn)者絕對(duì)對(duì)頂級(jí)選手有多強(qiáng)完全沒(méi)概念。但實(shí)際上，可能我才是那個(gè)不知道這個(gè)電腦有多強(qiáng)的人?，F(xiàn)在我對(duì)這個(gè)比賽非常興奮。

誰(shuí)會(huì)贏呢？我不知道。李世乭自己也覺(jué)得可能那電腦跟他一樣強(qiáng)?？赡苁俏衣?tīng)到了太多AlphaGo的消息，我現(xiàn)在驚訝于它的強(qiáng)大。同時(shí)我也非常了解李世乭的水平，所以我認(rèn)為他們雙方五五開(kāi)吧。

我覺(jué)得圍棋是個(gè)很有內(nèi)涵的競(jìng)技，我不覺(jué)得如果電腦AI擊敗了人類(lèi)會(huì)對(duì)圍棋造成什么傷害。我想人們會(huì)接受自己被電腦技術(shù)超越這件事。

Jonathan Schaeffer，阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)家，Chinook設(shè)計(jì)師

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

我想這還不是圍棋版的深藍(lán)時(shí)刻。真正的成就是這個(gè)程序能作為選手在頂級(jí)比賽中較量的時(shí)候。深藍(lán)從1989年開(kāi)始就常常戰(zhàn)勝各路大師，最后登頂則是八年之后的事情。但就目前情況來(lái)看，我認(rèn)為AlphaGo和頂級(jí)人類(lèi)選手之間的差距被大大縮短了?？赡苤恍枰龠M(jìn)行一點(diǎn)努力和改善，再提高一點(diǎn)計(jì)算能力，不出一兩年，它就能打敗人類(lèi)。

就今年3月份的比賽來(lái)說(shuō)，不是打擊AlphaGo團(tuán)隊(duì)，我還是看好人類(lèi)。我們可以把AlphaGo看成是少年天才。它突然學(xué)了一手好棋，進(jìn)步神速，但畢竟還是經(jīng)驗(yàn)有限。從國(guó)際象棋和西洋跳棋來(lái)看，經(jīng)驗(yàn)還是很重要的。

Demis Hassabis，DeepMind創(chuàng)始人

Google 和 Facebook：究竟是誰(shuí)搞定了圍棋人工智能？| 深度

AlphaGo正在突飛猛進(jìn)，甚至?xí)阶畎舻娜祟?lèi)選手。能夠看它在圍棋規(guī)則內(nèi)去創(chuàng)造新的東西，感覺(jué)很神奇。我們對(duì)自己創(chuàng)造的這個(gè)系統(tǒng)有種很密切的感情，特別是它被創(chuàng)造的方式——它會(huì)學(xué)習(xí)，我們也會(huì)教它，它的風(fēng)格就像人一樣。和其他編出來(lái)的程序不同，你不知道它到底都會(huì)什么，因?yàn)樗軌蜃约簩W(xué)習(xí)。

| 結(jié)語(yǔ)

用Facebook人工智能研究中心Yuandong Tian的話說(shuō)，兩家公司確實(shí)存在著某種“友好”的競(jìng)爭(zhēng)。是呀，這樣兩家公司之間的較量一定是件好事。腦海里不禁想起了去年Google Chrome團(tuán)隊(duì)送給Microsoft Edge團(tuán)隊(duì)的那個(gè)大蛋糕，不知道這一次是誰(shuí)送給誰(shuí)呢？

參考文獻(xiàn)

1. Nature doi:10.1038/nature.2016.19255

2. http://120.52.73.78/arxiv.org/pdf/1511.06410.pdf

3. Googleblog、Facebook、 Wired

【作者介紹】知社學(xué)術(shù)圈，由清華教授發(fā)起的海歸學(xué)者發(fā)起的公益學(xué)術(shù)交流平臺(tái)，旨在分享學(xué)術(shù)信息，整合學(xué)術(shù)資源，加強(qiáng)學(xué)術(shù)交流，促進(jìn)學(xué)術(shù)進(jìn)步。

2、谷歌AlphaGo的勝利：不是計(jì)算機(jī)打敗了人類(lèi)，而是人類(lèi)打敗了人類(lèi)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。