丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
新鮮 正文
發(fā)私信給金紅
發(fā)送

3

王小川斷言AlphaGo將完勝李世石 他會被打臉嗎?

導語:前不久還在極客公園論壇上表示人工智能在今天與人腦有很大距離,甚至不如一個1歲小孩,這次在面對人工智能與專業(yè)棋手對弈的時候,卻直接斷言贏得一方一定會是AI。

上周,谷歌AI在圍棋上以5比0戰(zhàn)勝了歐洲冠軍樊麾的消息引起極大關(guān)注。而更為大家津津樂道的,是谷歌還向韓國圍棋九段高手李世石公開發(fā)起挑戰(zhàn),要在下個月進行AI與圍棋高手的較量。作為圍棋界最高水平的代表,如果李世石輸了,代表的是人類輸了。

谷歌使用的人工智能軟件是AlphaGo,由谷歌去年收購的人工智能公司DeepMind研發(fā)。關(guān)于AlphaGo與李世石之間的這場較量,外界有著不同的看法,但總體而言,覺得贏得可能性低的人會更多些,因為樊麾僅為二段棋手,二段棋手與九段棋手之間,差得可不是一星半點。

雖然AlphaGo與李世石的對弈還有差不多兩個月時間,但關(guān)于其輸贏的討論在持續(xù)發(fā)酵中,有專業(yè)棋手從下棋手法上進行分析,有人工智能專業(yè)者從科技角度,也有像搜狗CEO王小川這樣的技術(shù)大咖忍不住參與討論。

作為技術(shù)熱衷者,王小川對于人工智能的發(fā)展一直都比較關(guān)注,不過,前不久還在極客公園論壇上發(fā)表演講表示人工智能在今天與人腦有很大距離,甚至不如一個1歲小孩兒,這次在面對人工智能與專業(yè)棋手對弈的時候,卻直接斷言贏得一方一定會是人工智能。這,又是為什么?

王小川斷言AlphaGo將完勝李世石 他會被打臉嗎?

王小川知乎全文:

AlphaGo的發(fā)布,是一個偉大的里程碑,又一次讓我興奮地需要說一說。

先說我的斷言一:AlphaGo在兩個月后,將會完勝李世石。

留個關(guān)子,本文最后再說斷言二。

從中學開始,我就著迷用算法來解決游戲的博弈問題,用搜索方法創(chuàng)新性完成過一些題目。這幾年深度學習出現(xiàn)后,就感覺有機會能夠突破圍棋,和清華的聯(lián)合實驗室做過幾次探討,都認為這個方向可行,可惜限于氣場和能力不足,沒能組織進行這方面的投入。

而此次出手的,是Google旗下的DeepMind團隊,在深度學習方面是最頂尖的,資源、能力、氣場都沒有問題,突破性的技術(shù)是基于深度學習進行估值和走棋。

看知乎里好多討論,是從之前AlphaGo完成的棋局來判斷其下棋風格,倒推這個算法的威力,有點刻舟求劍的感覺。我們核心還是要回到對這次AlphaGo用到的技術(shù)的深刻理解。為了便于討論,我們對比以搜索剪枝為核心的深藍下國際象棋,和以搜索剪枝+深度學習為核心的AlphaGo的三個區(qū)別:

1. 圍棋相對象棋,最大的區(qū)別是棋局的評價函數(shù)極難定義。象棋可以找到各種“特征”來計分,比如丟一個馬扣多少分,兵往前拱到離底線近了加多少分,而圍棋做不到,密密麻麻的黑白子挨著,互相之前又有關(guān)聯(lián),變化多,規(guī)律難以總結(jié)。這也是傳統(tǒng)算法相對人最弱的幾個問題之一。就像是我們?nèi)俗鋈四樧R別,看一眼就知道是張三李四,而機器算法難以下手。這個問題恰恰是最近幾年深度學習最大的突破之處,深度學習不需要人來設(shè)計算法“找特征”,通過大量原始數(shù)據(jù)和標簽的對于,機器就能夠自動找特征,并且并不比人差。在幾年前還有很多人認為機器在圖像處理方面舉步維艱,怎么定義和抽象鼻子?耳朵?眼睛?可就在這一兩年深度學習突飛猛進,一舉超過了人類。就在2015年,人臉識別方面,機器的識別能力已經(jīng)超過了人了,這可是人進化了數(shù)千萬年的核心能力之一呀。一個圍棋棋局,可以理解為一張19*19的圖片,其他的走棋規(guī)則和非常簡單(很容易翻譯成計算機規(guī)則),正好落入了深度學習擅長的事情。搜索+深度學習,這個算法完全可以覆蓋圍棋的規(guī)則,人下棋的思維過程和模式,只是AlphaGo的一個子集。這就決定了這個算法沒有天花板,有機會在圍棋領(lǐng)域“打通關(guān)”。

2. 深藍相對AlphaGo,AlphaGo最大的優(yōu)勢是“學習能力”。深藍的開局更多依靠數(shù)據(jù)庫棋譜的建立,但沒有泛化能力(不懂得舉一反三),對于沒有見過的走棋方法就可能犯傻。而之后的核心能力是計算力,通過暴力的搜索(當然也有最優(yōu)秀的剪枝,但還是暴力),力圖走出10-20步棋來選擇最優(yōu)的路徑。這個復雜度是指數(shù)級的,變成一個NP問題,受限于計算力。這個系統(tǒng)的算法是寫死的,固定的參數(shù)下,就會有固定的表現(xiàn)。而調(diào)整參數(shù)和改變算法,都是工程師的事情。這個系統(tǒng)的天花板是計算機有多強,以及工程師有多聰明。而AlphaGo更多是數(shù)據(jù)驅(qū)動的,喂給他更多的棋局數(shù)據(jù),他就能夠優(yōu)化“神經(jīng)元網(wǎng)絡(luò)”,同樣的運算資源下變得更聰明,并且具有舉一反三的能力,這一點非常接近于人(或者說本身就是模擬人的方式來設(shè)計的)。而且我們知道,機器處理數(shù)據(jù)的能力足夠地快,以及沒有情緒不會出錯,這就決定了這個系統(tǒng)如果把今天互聯(lián)網(wǎng)上能收集到的棋局都學一遍,就成為頂尖高手了。

3. 最最最可怕的還不只是前面這兩點,對于下棋博弈問題,AlphaGo還不只是從互聯(lián)網(wǎng)上去收集數(shù)據(jù)進行學習,更可以自己和自己下,實現(xiàn)“自學習”??催^電影“超驗駭客”沒有?人工智能可以做到隨著時間的推移就能更加聰明。金庸小說中老頑童讓自己左手和右手打架“左右互搏”,成為天下無敵的武功,那個只是故事,在下棋這個領(lǐng)域,而AlphaGo有這樣的設(shè)計,讓這種武功成真了!往下還有兩個月的時間,AlphaGo這樣一臺算法上沒有天花板的機器,很有機會在“左右互搏”下登峰造極,成為不可超越的圍棋高手。

AlphaGo的技術(shù)問題講完了。怎么來看Google背后的完整動作呢?有人覺得是過度解讀了,實際系統(tǒng)挺糙的 -- 選的都是“歐洲冠軍” -- 說明系統(tǒng)并不行,這是一種錯誤的理解。更有可能的原因是Google和Facebook在競爭下圍棋,F(xiàn)acebook的員工缺心眼提前放了好多消息出來泄密了,結(jié)果Google就趕緊把Nature的文章發(fā)了搶了個先,然后賣個期貨兩個月后和人類對決,那會兒系統(tǒng)就足夠好了,這是在競爭環(huán)境下合適的做法。

事實上Google和Facebook兩家都認識到了AI的重要性,以及就在最近幾年會有大的突破。Google 4億美金收購了DeepMind,當時只有20人,現(xiàn)在已經(jīng)突破200人了,并且是不計代價的瘋狂投入。下圍棋只是體現(xiàn)人工智能進步絕佳的宣傳點和切入點,從公開的文獻可以看到,DeepMind做圍棋研發(fā)是基于通用的技術(shù)進行,領(lǐng)域無關(guān)的(Domain independent)。這樣的技術(shù)未來可以用到合適的其他領(lǐng)域里去。深度學習的魅力在于,只要一個領(lǐng)域里能夠建模,能夠有充足的數(shù)據(jù),就能夠在這個領(lǐng)域里做到超越人、取代人,短時間能從0分做到99分。如果我們依然是老觀念,用漸進的方式來理解機器智能,比如之前某位大佬宣傳他家的XX大腦做到了X歲的智力,這是很誤(che)導(dan)的。我們同樣也會錯誤地估計下圍棋方面機器的能力,按照人類的理解1D-9D來評價它。一句話,不要用評價人的方法來評價機器的人工智能的能力,完全是不同的模式。

老羅曾經(jīng)評價過人工智能的一句話:“人工智能就像一列火車,它臨近時你聽到了轟隆隆的聲音,你在不斷期待著它的到來。他終于到了,一閃而過,隨后便遠遠地把你拋在身后”。

如果給這句話打上一個補丁,把人工智能的應用局限到一個一個的具體的封閉領(lǐng)域,這是一個很貼切的描述。我們不要過度自大,例如我們?nèi)菀自谧晕覂?yōu)越感的驅(qū)使下,說動物不如人,比如人會直立行走、會說話、會實用工具,以區(qū)別于其他動物。事實證明,動物也會。面對機器也一樣,就在幾個月前還有人叫囂機器十年內(nèi)不能夠玩轉(zhuǎn)圍棋,理由也都是人一眼就能看明白,機器只會計算。這些自大會讓我們誤判。也不用過于自卑,覺得圍棋上機器上勝利了人類整個智力就被碾壓了,到今天機器還是有很多領(lǐng)域完全無能,只能在局部領(lǐng)域。

到結(jié)尾,再說斷言二:除了圍棋,人工智能在其他博弈類的封閉游戲里,也會橫掃一切,完勝人類。

雖然王小川的論點過于武斷,不過AlphaGo贏的可能性其實也并不低,它的真實圍棋水平可能遠遠不止現(xiàn)在所呈現(xiàn)的。首先,AlphaGo與樊麾的對弈其實發(fā)生在去年10月,只不過最近才被曝光,在這之后的幾個月中,AlphaGo有多大的提高,我們不得而知。其次,此事被報道后,在高手云集的弈城圍棋網(wǎng)上,出現(xiàn)了疑似AlphaGo的身影,而且從它的對戰(zhàn)數(shù)量和戰(zhàn)績上看,它已經(jīng)和人類進行了大量的交手。甚至,最好的成績達到過9D(段)。由此可見,AlphaGo一直在掩蓋其鋒芒,就像王小川所言,谷歌選擇在這個時候讓AlphaGo挑戰(zhàn)李世石,一定是建立在足夠的自信上的。

當然,AlphaGo是否能在下個月底的比賽中贏得勝利,現(xiàn)在來說都為時過早。不過,這絕對不會是一場壓倒性的比賽,而是高手與高手之間的巔峰對決。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,專注新技術(shù)和商業(yè)故事報道,創(chuàng)業(yè)者或行業(yè)交流可加微信號Duras0820
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說