0
本文作者: 張馳 | 2017-05-23 17:14 | 專題:烏鎮(zhèn)人機(jī)決戰(zhàn):AlphaGo VS 柯潔 |
雷鋒網(wǎng)消息,經(jīng)過(guò)四個(gè)多小時(shí)的對(duì)弈,柯潔以四分之一子之差敗給了AlphaGo。
比賽后,曾參與訓(xùn)練AlphaGo的棋手樊麾,與圍棋九段常昊一同回顧了整個(gè)對(duì)弈過(guò)程??聺嵰才cDeepmind創(chuàng)始人Demis Hassabis,以及AlphaGo的主程序員David Silver一同接受了媒體采訪,談及對(duì)比賽的感想。
樊麾提到,在經(jīng)過(guò)年初Master的60局比賽后,很多棋手也在嘗試用點(diǎn)三三這種下法。而柯潔也模仿了這種開(kāi)局。
常昊在分析中表示,對(duì)整個(gè)棋局印象最深的,是白棋在開(kāi)局后不久第24手的大飛,這顯示出AlphaGo更更注重中央勢(shì)力的發(fā)展,對(duì)厚薄和棋局的發(fā)展有更多注重,因?yàn)檫@一步在未來(lái)棋局中的效率會(huì)更高。
AlphaGo另一個(gè)令人印象深刻的也是在開(kāi)局后不久,在棋局的左上方,采取了一步斷。在斷之前,黑棋(柯潔)看起來(lái)很厚,但之后白棋(AlphaGo)也變得厚了。常昊稱,“這是走的一步后手,但卻留下了很多余味?!?/p>
第24手“大飛”,第54手“斷”
“這一步帶給了我們新的想法,有些棋不是不能下,下了以后還會(huì)有新的思路。它提供了一種思路的創(chuàng)新,我們可以共同去研究,為圍棋的下法帶來(lái)更多發(fā)展。”
雖然被圍棋圍住的4個(gè)字看起來(lái)已經(jīng)沒(méi)救了,但AlphaGo依然會(huì)更多利用這4個(gè)子,它會(huì)想把棋盤(pán)上所有子的價(jià)值都利用起來(lái)。
柯潔在回顧比賽時(shí)也對(duì)第54手的斷,表示了肯定。他稱,“很震驚,這在人類(lèi)的下法中是不能有的”。在斷之后,它把自己的腳步實(shí)地化,變得更厚,一石二鳥(niǎo)。
柯潔感嘆道,“實(shí)在下得太出色了,輸?shù)脹](méi)什么脾氣。”
Demis Hassabis在賽后表示,這是一場(chǎng)非常精彩的比賽,他非常尊敬柯潔,這一戰(zhàn)的表現(xiàn)令人佩服。他認(rèn)為柯潔表現(xiàn)出了頑強(qiáng)與精彩的實(shí)力,在賽前也做了很多戰(zhàn)前的準(zhǔn)備。
“柯潔同時(shí)做了戰(zhàn)略和戰(zhàn)術(shù)的準(zhǔn)備,比如點(diǎn)三三(這種策略),這是他從年初Master的60場(chǎng)比賽中的總結(jié)。他有自己的戰(zhàn)略,有好幾手都是非常漂亮的。第24手是全盤(pán)皆活的一手。接下來(lái)還有很多場(chǎng)比賽,我非常尊敬柯潔,讓AlphaGo也必須用全力以赴對(duì)付你?!?/p>
比賽的結(jié)果雖然有了,但外界對(duì)AlphaGo和柯潔的好奇心沒(méi)有滿足。在采訪中,雙方也回答了很多大家關(guān)心的問(wèn)題。
柯潔稱,這是苦笑,不是很開(kāi)心的笑。
“很早就知道自己會(huì)輸。AlphaGo的每一步棋都是勻速的,到最后時(shí)已經(jīng)知道會(huì)輸多少了?!?/p>
對(duì)于自己的評(píng)價(jià),柯潔稱,“AlphaGo下得很精彩,但我自己也盡了全力。它下得太好了,有很多地方值得棋手去學(xué)習(xí)和探索。它對(duì)圍棋的理念帶來(lái)了沖擊,在改變我們最初對(duì)圍棋的下法,沒(méi)什么棋是不能下的。對(duì)AlphaGo的想法也有改變,我們可以大膽去創(chuàng)新,開(kāi)拓自己的思維,可以自由地去下棋。今天也是大膽地開(kāi)拓了自己的思維?!?/p>
柯潔還曾想用AlphaGo的策略來(lái)對(duì)付它?!拔业挠∠笾蠥lphaGo是會(huì)非常貪戀實(shí)地的,比如點(diǎn)三三的方法,今天我也是在使用這種策略。但這種意圖被AlphaGo打敗了,完全進(jìn)入了它的調(diào)子中。它真的下得非常的好?!?/p>
柯潔認(rèn)為,AlphaGo的棋與去年完全是兩個(gè)人。第一次時(shí)它很接近人的,但現(xiàn)在越來(lái)越像“上帝”。
AlphaGo有弱點(diǎn)嗎?
柯潔認(rèn)為,弱點(diǎn)暫時(shí)沒(méi)有看見(jiàn)。以前還是有弱點(diǎn)的,但現(xiàn)在AlphaGo對(duì)棋的理解與判斷已經(jīng)遠(yuǎn)勝于我們?nèi)祟?lèi)了,贏的話只能找一些bug出來(lái)。
但他同時(shí)說(shuō),“對(duì)自己永遠(yuǎn)要有信心。”
Hassabis稱,在李世石后再次參加比賽,就是希望棋手們能找到AlphaGo的弱點(diǎn),找到它跟自己對(duì)弈時(shí)不知道的缺陷。
“李世石當(dāng)時(shí)在第4局找到了這個(gè)缺口,后來(lái)我們改善了體系。當(dāng)然還會(huì)有新的領(lǐng)域,我們和AlphaGo都不知道,所以才會(huì)參加比賽?!?/p>
David Silver解釋稱,AlphaGo的做法是將它的獲勝的概率最大化,而不是接近式贏得比賽。它會(huì)尋找一些確定的路線,實(shí)現(xiàn)少風(fēng)險(xiǎn)的獲勝機(jī)會(huì)。這也是一個(gè)取舍問(wèn)題,要決定如何擴(kuò)大勝利的比例。當(dāng)然,它還有一些其它目標(biāo),比如將勝利的步伐邁得更大,如果重點(diǎn)只是放在獲勝上,它可能會(huì)降低風(fēng)險(xiǎn),即使很小的風(fēng)險(xiǎn)也會(huì)去關(guān)注。
Hassabis認(rèn)為,圍棋是一個(gè)非常有意思的主題,它有無(wú)限的可能性。通過(guò)比賽,可以改進(jìn)對(duì)于圍棋的理解,這是我們可以用的工具,讓偉大的棋手發(fā)現(xiàn)更多圍棋的奧妙。
David Silver解釋稱,AlphaGo一開(kāi)始就是跟人類(lèi)來(lái)學(xué)習(xí)的,它通過(guò)自身對(duì)弈來(lái)學(xué)習(xí)時(shí),也必須要跟人類(lèi)專家對(duì)弈才行,因?yàn)榕c頂尖的棋手對(duì)決才能改善。新版本是更多與自身對(duì)弈來(lái)學(xué)習(xí),實(shí)現(xiàn)自我的搜索,對(duì)人類(lèi)數(shù)據(jù)的依賴更小了。而DeepMind的目標(biāo)是讓它的規(guī)則超越圍棋,應(yīng)用到其它領(lǐng)域。
對(duì)這一問(wèn)題,Hassabis沒(méi)有正面回應(yīng),只是表示,本周晚些時(shí)候會(huì)宣布下一步怎么做。像第一版在學(xué)術(shù)期刊上發(fā)布了技術(shù)細(xì)節(jié)一樣,他們以后也會(huì)發(fā)布更多新版本的細(xì)節(jié),會(huì)披露更多技術(shù)細(xì)節(jié),讓其它團(tuán)隊(duì)與實(shí)驗(yàn)室做自己的版本。
這次比賽的AlphaGo是新版本,它改善了新的算法,主要進(jìn)步是計(jì)算量少了十倍,自我對(duì)弈更強(qiáng)。
Hassabis稱,在比賽中程序是在一個(gè)單一的機(jī)器上運(yùn)作的,這與去年不一樣,當(dāng)時(shí)是分布式的。這次有更強(qiáng)大的算法,運(yùn)作起來(lái)更簡(jiǎn)單也更好,獲得的速度更快。
Hassabis表示,計(jì)算力可以“在Google云中獲得,用的是TPU,十個(gè)處理單位,少了十倍的計(jì)算量”。簡(jiǎn)單點(diǎn)說(shuō),這次的AlphaGo是單機(jī)版。
賽前,柯潔發(fā)微博表示,這次比賽是最后三場(chǎng)與人工智能的比賽。賽后,他對(duì)這一決定再次做了確認(rèn)。
“考慮了很久,AlphaGo進(jìn)步太快了,每一步都是巨大的進(jìn)步,在以后會(huì)更加完美,而人與它的差距不是靠自己的努力就能去彌補(bǔ)的。我相信科技的力量,未來(lái)是人工智能的。對(duì)圍棋來(lái)說(shuō),我還是喜歡和人來(lái)下,因?yàn)闄C(jī)器與人的差距會(huì)越來(lái)越大,人贏的概率會(huì)越來(lái)越小,這樣下棋太痛苦了,一盤(pán)都贏不了?!?/p>
他表示,以后也不會(huì)去訓(xùn)練機(jī)器了,這是最后的三盤(pán)棋。
“希望以后還是下人類(lèi)的棋,對(duì)軟件把它當(dāng)作一個(gè)老師,一個(gè)學(xué)習(xí)的對(duì)象去看待?!?/p>
他表示,對(duì)自己的表現(xiàn)也有點(diǎn)不滿意,覺(jué)得自己可以做得更好,但有時(shí)候無(wú)論怎么努力都無(wú)法做到。所以這最后一次,他希望不留遺憾,下出讓自己滿意的棋局。
“令A(yù)lphaGo的主機(jī)發(fā)燙也好?!?nbsp;
Hassabis表示,從他們的角度來(lái)說(shuō),想要AlphaGo作為圍棋的工具,能為人類(lèi)所用,所以會(huì)有架構(gòu)知識(shí)的分享,讓大家知道它。也希望它能走進(jìn)尋常百姓家,在醫(yī)學(xué)與科學(xué)找到應(yīng)用場(chǎng)景。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專題其他文章