丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給吳德新
發(fā)送

5

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

導(dǎo)語(yǔ):雷鋒網(wǎng)按:本文來(lái)自 硬創(chuàng)公開(kāi)課 | AlphaGo專(zhuān)場(chǎng)的分享。分享嘉賓:業(yè)余圍棋5段,高飛龍。

雷鋒網(wǎng)按:本文來(lái)自 硬創(chuàng)公開(kāi)課 | AlphaGo專(zhuān)場(chǎng)的分享。

分享嘉賓:業(yè)余圍棋5段,高飛龍。一并感謝業(yè)余圍棋6段,鮑云對(duì)本次分享的友情支持。

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

一、圍棋圈內(nèi)怎么看待前兩場(chǎng)的勝負(fù)

第一局比賽,過(guò)程中大部分棋手很可能出現(xiàn)了相當(dāng)程度的誤判,認(rèn)為李世石一度占優(yōu),而第二局比賽后,職業(yè)高手們對(duì)AI的決策原理了解的越來(lái)越多,判斷也不斷地在改變。

第一局輸?shù)艉?,大家的情緒都很低落,雖然知道這一天早晚會(huì)來(lái),但事前都認(rèn)為沒(méi)這么快,人類(lèi)應(yīng)該還能抵抗一段時(shí)間,但第二局結(jié)束后,大家對(duì)AI的實(shí)力判斷普遍調(diào)高,很多人甚至認(rèn)為柯潔現(xiàn)在上了也未必能贏。當(dāng)晚,大量的職業(yè)高手就進(jìn)行了深度的反思和討論,尤其是李喆六段。

(根據(jù)我得到的信息)AlphaGo在第一局中,對(duì)自身獲勝概率的判斷應(yīng)該始終高于半數(shù),也就是我們說(shuō)的始終優(yōu)勢(shì),而第二局中,它反而在中盤(pán)有一段時(shí)間認(rèn)為獲勝概率為半數(shù),也就是預(yù)測(cè)和棋,這和大部分人類(lèi)高手在解說(shuō)時(shí)的判斷完全不同,是一個(gè)非常有趣的現(xiàn)象。

但賽后經(jīng)過(guò)深入的分析,我聽(tīng)到的聲音越來(lái)越傾向于支持電腦的判斷,也就是說(shuō),第一局棋,李世石的確沒(méi)有優(yōu)勢(shì)過(guò),而我們要重新審視電腦下出的那些“緩手”和“錯(cuò)著”。

二、如何評(píng)價(jià)此前大家認(rèn)為兩局中人和機(jī)器雙方的“失誤”?

首先,正如我前面所說(shuō),我個(gè)人認(rèn)同第一局中,李世石始終沒(méi)有占據(jù)優(yōu)勢(shì),所以,也就沒(méi)有所謂轉(zhuǎn)折點(diǎn)的說(shuō)法。

電腦的確下出了一些從普通棋理來(lái)看有問(wèn)題的下法,并且取得了勝利,但這不一定說(shuō)明棋理完全是錯(cuò)的。

我想重復(fù)一下很多人都已經(jīng)提過(guò)的一點(diǎn),這也是我們審視棋局非常重要的信息:電腦行棋的決策,是依據(jù)對(duì)落點(diǎn)后續(xù)變化的獲勝概率來(lái)判斷的。

這里我想引用一下李喆六段在第一天晚上復(fù)盤(pán)的講解:

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

電腦的這一步長(zhǎng),當(dāng)場(chǎng)被所有人視為緩手。但是復(fù)盤(pán)時(shí)李喆認(rèn)為,這一手棋不一定不好,甚至在電腦的決策中,這已經(jīng)是最好的一手(其實(shí)這是肯定的,因?yàn)殡娔X就是這樣選擇的)。

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

如果電腦不補(bǔ)棋,黑棋在左上的出動(dòng)可能極為嚴(yán)厲,當(dāng)然這不是說(shuō)白棋就一定不能這么下,只是這后面的變化相當(dāng)復(fù)雜,電腦應(yīng)該判斷這樣的獲勝概率不如實(shí)戰(zhàn)的下法,所以選擇了實(shí)戰(zhàn)的“緩手”補(bǔ)棋。

緊接著,還有一個(gè)關(guān)鍵處,當(dāng)時(shí)所有人都認(rèn)為電腦的下法簡(jiǎn)直不可理喻,但我們還是順著電腦的邏輯來(lái)復(fù)盤(pán),就有辦法理解:

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

這步斷,直接將大空送給黑棋,局部來(lái)說(shuō),是嚴(yán)重虧損的下法,但電腦選擇了這個(gè)下法,然后所有人都認(rèn)為黑棋已經(jīng)明顯優(yōu)勢(shì),可局后AG團(tuán)隊(duì)卻說(shuō)AG始終判斷自己優(yōu)勢(shì),為什么?

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

左下白棋損了一大把,然后做了幾個(gè)簡(jiǎn)單的準(zhǔn)備性交換之后,下出了右邊的點(diǎn),這步點(diǎn)被所有人認(rèn)為是精彩的“勝負(fù)手”,局后也認(rèn)為是妙手,但我們可能忽略了一個(gè)可能:電腦早就將這步棋和其導(dǎo)致的后續(xù)變化算在了形勢(shì)判斷中。

也就是說(shuō),電腦知道這以后它將在右邊一代走成后續(xù)的變化,這是它的“權(quán)利”,所以即使左下角白棋嚴(yán)重虧損,但搶到先手之后將右邊的“權(quán)利”兌現(xiàn),白棋仍然是優(yōu)勢(shì)。

而左下局部虧損的下法,可能讓它贏的更少,但卻縮小了棋盤(pán),令盤(pán)上剩余的空間和變化都大大減少了,用人類(lèi)的說(shuō)法,就是縮小了棋盤(pán)并接近終點(diǎn),這和AG的邏輯是一樣的,只不過(guò)AG可以通過(guò)獲勝概率來(lái)更精準(zhǔn)的判斷這一點(diǎn)。

所以AG在選擇左上的緩手補(bǔ)棋,選擇左下的虧損變化搶先手的時(shí)候,已經(jīng)考慮了這所有的變化并將后續(xù)在右邊點(diǎn)入占到的便宜計(jì)入形勢(shì)判斷,所有這些走完之后,棋盤(pán)大幅度減小并且白棋局面領(lǐng)先,從電腦的角度來(lái)看,自己的獲勝概率一直在提高。

(當(dāng)然,這里包含了一些我從他人處看來(lái)的觀點(diǎn),還包含了我個(gè)人的一些猜想式的判斷,可能會(huì)過(guò)于高估電腦,但我認(rèn)為我們應(yīng)該高估而不應(yīng)該低估,更何況從結(jié)果來(lái)看,這種猜想很可能是對(duì)的,AG就是看了這么遠(yuǎn))

二、如何看待外界評(píng)價(jià)對(duì)弈中沒(méi)有“打劫”的問(wèn)題?

打劫包含很多轉(zhuǎn)換的可能,對(duì)電腦來(lái)說(shuō)可能會(huì)降低獲勝概率,哪怕只是從90%降低到80%,所以它不選擇打劫。即使對(duì)人來(lái)說(shuō)也是這樣,在贏棋的局面下,講究簡(jiǎn)化局面減少變化,盡量不選擇復(fù)雜的打劫,增加獲勝的可能。

沒(méi)打劫的棋也多了,沒(méi)什么特別離奇的,打了也輸,就是李沒(méi)拼顯得有點(diǎn)沒(méi)骨氣,很多人覺(jué)得他沒(méi)有表現(xiàn)出人類(lèi)的風(fēng)采。(鮑云觀點(diǎn))

三、AlphaGo與人類(lèi)走子的差異

很多人說(shuō)AG和人類(lèi)棋手下的不是一種圍棋,它是以獲勝概率為指向,而人是以局部賺幾目虧幾目來(lái)判斷,其實(shí)不是這么簡(jiǎn)單。這種說(shuō)法其實(shí)對(duì)人類(lèi)圍棋的高水平段不太了解。

正如我回答前一個(gè)問(wèn)題所說(shuō),人類(lèi)也會(huì)在逼近終局的時(shí)候,選擇虧損但是縮小棋盤(pán)減少變化的方式,來(lái)逼近終點(diǎn)。這就是典型的以減少獲勝目數(shù)來(lái)提高獲勝概率的決策。只不過(guò)人類(lèi)對(duì)概率的判斷基于經(jīng)驗(yàn)和直覺(jué),應(yīng)該比不上成熟之后的電腦的判斷準(zhǔn)確度。

但如果是最優(yōu)解,也就是我們說(shuō)的“圍棋上帝”,很可能于此不同。我們現(xiàn)在的對(duì)局,是單一的全局獲勝就全部獲勝,輸贏的目數(shù)多少其實(shí)沒(méi)有意義。而人會(huì)失誤,所以出現(xiàn)了我前述所言的目數(shù)換概率的決策方式。但如果現(xiàn)在有一個(gè)“神”,它窮盡了圍棋所有的變化,根本不會(huì)失誤,那當(dāng)他跟李世石下的時(shí)候,會(huì)這樣嗎?

當(dāng)然,無(wú)論如何他都能贏,那么從追求圍棋最優(yōu)解的角度來(lái)說(shuō),他就可能不使用目數(shù)換概率的決策,因?yàn)樗@勝的概率一定是百分之百,那么對(duì)他來(lái)說(shuō),最優(yōu)解就應(yīng)該是盡量提高獲勝目數(shù)。

這里我想舉兩個(gè)例子。

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

白棋136,按照最優(yōu)解應(yīng)該下在A位,在這樣的相對(duì)封閉空間里,電腦應(yīng)該不會(huì)在手段和目數(shù)的計(jì)算上出現(xiàn)失誤。

但它這樣決策,就說(shuō)明它認(rèn)為,雖然虧了一目,但這樣的下法后續(xù)更不容易出現(xiàn)失誤(或者類(lèi)似),所以獲勝概率提高了。還有一個(gè)讓所有人頭疼的例子:

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

如果說(shuō)電腦前半盤(pán)的“緩手”當(dāng)天還可以很快解釋?zhuān)敲从蚁陆堑倪@個(gè)“失誤”就讓很多人難以理解,只能認(rèn)為電腦確實(shí)算錯(cuò)了,或者判斷錯(cuò)了~由此認(rèn)為電腦不是無(wú)懈可擊。

這步棋按照人的思路,只需要跳在一四,黑棋將輸?shù)母臁?/span>

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

黑2是我隨便擺的,意思是脫先。白1跳在這里,黑棋如果脫先,則白棋保留這樣救出上方三子的手段,黑棋輸?shù)母鼞K。如果黑棋補(bǔ)棋,則丟掉先手,一樣比實(shí)戰(zhàn)慘。

可電腦為什么沒(méi)有這么下?看過(guò)第二盤(pán)之后,我們對(duì)電腦的計(jì)算力有了新的認(rèn)識(shí),更多的人認(rèn)為,電腦的計(jì)算水平應(yīng)該不至于算不到這個(gè)變化,而是認(rèn)為這個(gè)變化獲勝的概率不如實(shí)戰(zhàn)。

這同樣是一個(gè)封閉空間,人類(lèi)提出的下法是最優(yōu)下法,這沒(méi)有疑問(wèn),因?yàn)樵谶@個(gè)空間里,人類(lèi)可以窮盡所有變化。但是AG呢?它肯定也能。

我第一天晚上始終對(duì)這個(gè)局部想不明白,認(rèn)為是電腦的失誤,但第二日后慢慢覺(jué)得,它的決策模型,雖然我不知道怎么判斷的概率,一定認(rèn)為這些后續(xù)變化降低了獲勝概率。

四、如何預(yù)測(cè)下一場(chǎng)比賽的勝負(fù)?

不知道。如果按照以上這些分析的判斷,我會(huì)高估電腦一些。

也就是電腦很可能全勝,但出于感情,我支持李世石贏一盤(pán)。

我們看到電腦有些局部可能不選擇最優(yōu)解,這種“失誤”到底是不是“失誤”,在于有沒(méi)有“人”能利用其獲勝。

我有一個(gè)大膽的猜想,如果想要打敗這一代的AI,很可能會(huì)是下一代的AI,而不是人類(lèi)高手。

五、AlphaGo的圍棋觀和人類(lèi)的不同

電腦從開(kāi)始到最后,一直是獲勝概率導(dǎo)向的,而人因?yàn)楹茈y準(zhǔn)確的判斷概率,會(huì)以大量的棋理和判斷來(lái)進(jìn)行決策,但這些本身就包含獲勝的概率。人類(lèi)總結(jié)出的棋理,本就是獲勝概率最高(人的判斷)的下法。至于目數(shù)的賺和損,只是一些同質(zhì)化的判斷方式。

如果棋理的獲勝概率被證明不夠高,說(shuō)明棋理不夠好,人家的棋理本身就是在不斷革新,逼近最優(yōu)解的,所以一些所謂電腦不看棋理的說(shuō)法其實(shí)沒(méi)有意義,選擇最優(yōu)的規(guī)律,本身就是理,人將之用人類(lèi)可以理解的方式解釋出來(lái),就成了棋理。只不過(guò)人類(lèi)對(duì)圍棋規(guī)律的發(fā)掘還不夠深,我們并不是所有的一切認(rèn)識(shí)都是對(duì)的。

簡(jiǎn)單一句話吧,不同地方太多了,但客觀講,程序下的有道理,人應(yīng)該好好分析學(xué)習(xí),當(dāng)然,程序下的還不是完美的圍棋,批判著學(xué)吧。(鮑云觀點(diǎn))

讀者提問(wèn):

“人們一直覺(jué)得圍棋太復(fù)雜,計(jì)算機(jī)無(wú)法駕馭,結(jié)果忽然發(fā)現(xiàn)自己才是那個(gè)無(wú)法駕馭它的?!痹趺纯??

李理:我覺(jué)得是有一定道理的,其實(shí)以后人類(lèi)也可以利用計(jì)算機(jī)來(lái)幫助訓(xùn)練棋感,從而離最優(yōu)走法更近一步。現(xiàn)在中國(guó)象棋很多職業(yè)選手就利用了計(jì)算機(jī)來(lái)”做功課“,開(kāi)發(fā)一些之前認(rèn)為”不好“的走法。

我覺(jué)得人類(lèi)應(yīng)該要勇敢的承認(rèn)自己的不足,然后利用自己的優(yōu)勢(shì)。而不是一定要跟機(jī)器比計(jì)算。用中國(guó)古代的觀點(diǎn),就是天人合一,人本身也是宇宙的一部分。

高飛龍:我一直以來(lái)的觀點(diǎn)都可以解釋。遠(yuǎn)在AlphaGo面試之前:

圍棋的規(guī)律是客觀存在的,人類(lèi)更像是“發(fā)現(xiàn)”了圍棋而不是“創(chuàng)造”了圍棋,所以人類(lèi)圍棋的發(fā)展史就是不斷逼近最優(yōu)解,不斷發(fā)現(xiàn)逼近最優(yōu)解的“規(guī)律”的歷史。

一代又一代頂尖棋手,不斷的提高人類(lèi)圍棋水平的峰值,就是這么一個(gè)過(guò)程。

也因此,很多外行問(wèn)棋手,歷史上的某某和某某誰(shuí)更強(qiáng)的類(lèi)似問(wèn)題,大家都會(huì)回答,后面的更強(qiáng)(一般都是)。

現(xiàn)在我們的計(jì)算工具已經(jīng)如此發(fā)達(dá),達(dá)到或超過(guò)了人類(lèi)頂峰的水平,將來(lái)我們可以借助工具,更好的探索圍棋規(guī)律,也因此,我個(gè)人很希望將來(lái)可以有一兩臺(tái)訓(xùn)練好的圍棋程序供大家來(lái)學(xué)習(xí)(雖然我知道谷歌和臉書(shū)都是降維打擊,志在人工智能而非志在圍棋)。

高飛龍:至于一些各個(gè)角度進(jìn)行嘲諷的聲音,我認(rèn)為口水終將湮沒(méi)在歷史的塵埃中。

AlphaGo雖然贏了,但是它又有什么弱點(diǎn)呢?

高飛龍:概率導(dǎo)向?qū)е滤赡懿贿x擇最優(yōu),所以局部變化可能出“錯(cuò)”,當(dāng)然這兩盤(pán)棋里,ag出現(xiàn)這種下法都是在贏定的情況下才下的,所以對(duì)人類(lèi)來(lái)說(shuō)沒(méi)有意義,人類(lèi)無(wú)法利用這些“錯(cuò)”獲勝。

這種類(lèi)似人類(lèi)的“損目換縮小棋盤(pán)”的下法,需要強(qiáng)大的控制力,而它正顯示了自己的控制力。

而前半盤(pán),它的概率判斷也同樣可能有問(wèn)題,但現(xiàn)在來(lái)看,似乎不見(jiàn)得比人類(lèi)頂峰差,甚至更好~所以我想它的弱點(diǎn),可能就在于它還不是“圍棋上帝”。

(這對(duì)于被甩在身后的我們來(lái)說(shuō),似乎不像是弱點(diǎn))隨著它的變強(qiáng),人類(lèi)頂峰利用這些縫隙獲勝的機(jī)會(huì)或越來(lái)越小,大致如此。 

題圖來(lái)自:wordpress.com

歡迎掃描二維碼,加入硬創(chuàng)公開(kāi)課的公開(kāi)分享群,我們也期待在后續(xù)的直播中繼續(xù)切磋交流。也歡迎推薦和自薦分享嘉賓。

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

棋手眼中,AlphaGo對(duì)抗李世石用了哪些奇招 | 雷鋒網(wǎng)公開(kāi)課

分享:
相關(guān)文章

叢林獵手

新智駕頻道,專(zhuān)注自動(dòng)駕駛產(chǎn)業(yè)鏈和汽車(chē)智能化技術(shù)的第一線報(bào)道,試圖理解汽車(chē)行業(yè)的未來(lái)。歡迎加微信foolwdx交流,公眾號(hào)(Ai-Drive)。
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)