2
本文作者: 三川 | 2016-11-21 18:43 |
作為 Facebook 人工智能部門主管, Yann LeCun 是 AI 領(lǐng)域成績斐然的大牛,也是行業(yè)內(nèi)最有影響力的專家之一。
近日,LeCun在卡內(nèi)基梅隆大學(xué)機(jī)器人研究所進(jìn)行了一場 AI 技術(shù)核心問題與發(fā)展前景的演講。他在演講中提到三點(diǎn)干貨:
1. 無監(jiān)督學(xué)習(xí)代表了 AI 技術(shù)的未來。
2. 當(dāng)前 AI 應(yīng)用的熱點(diǎn)集中在卷積神經(jīng)網(wǎng)絡(luò)。
3. 用模擬器提高無監(jiān)督學(xué)習(xí)的效率是大勢所趨。
演講完整視頻如下。該視頻長 75 分鐘,并包含大量專業(yè)術(shù)語,因此雷鋒網(wǎng)節(jié)選關(guān)鍵內(nèi)容做了視頻摘要,以供讀者瀏覽。
以下為視頻摘要:
AI 技術(shù)的飛速進(jìn)步很大程度上是由于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)領(lǐng)域的突破,還得益于大型數(shù)據(jù)庫的建立和更快的 GPU。我們現(xiàn)在已有了圖像識(shí)別能力可與人類相比的 AI 系統(tǒng) (例如下文中 Facebook 的識(shí)別系統(tǒng))。這會(huì)導(dǎo)致自動(dòng)化交通,醫(yī)療圖像解析在內(nèi)的多個(gè)領(lǐng)域的革命。但這些系統(tǒng)現(xiàn)在用的都是監(jiān)督學(xué)習(xí)(supervised learning),輸入的數(shù)據(jù)被人為加上標(biāo)簽。
接下來的挑戰(zhàn)在于,怎么讓機(jī)器從未經(jīng)處理的、無標(biāo)簽無類別的數(shù)據(jù)中進(jìn)行學(xué)習(xí),比方說視頻和文字。而這就是無監(jiān)督學(xué)習(xí)(unsupervised learning)。
傳統(tǒng)的思想認(rèn)為,如果你沒有大量的數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)應(yīng)該控制在較小的規(guī)模。Yann LeCun 指出這完全是錯(cuò)誤的。他的團(tuán)隊(duì)在數(shù)據(jù)不變的情況下擴(kuò)展了神經(jīng)網(wǎng)絡(luò),得到了更好的結(jié)果。他說,神經(jīng)網(wǎng)絡(luò)越大,效果就越好(當(dāng)然前提是數(shù)據(jù)庫大小達(dá)到了臨界值)。至于為什么會(huì)這樣,目前仍是一個(gè)謎,相關(guān)理論研究正在開展。
Yann LeCun 特別強(qiáng)調(diào)了卷積神經(jīng)網(wǎng)絡(luò)的重要性和應(yīng)用:”我們很早就認(rèn)識(shí)到,卷積神經(jīng)網(wǎng)絡(luò)可以被用來處理多種任務(wù)——不單單是識(shí)別單個(gè)物體(比如字母數(shù)字),還可以識(shí)別多個(gè)物體,同時(shí)進(jìn)行物體識(shí)別、分組和解釋。比方說,可以用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練 AI 系統(tǒng)識(shí)別并標(biāo)注(攝像頭所拍攝)圖像中的每一個(gè)像素,以此分析前方路徑是否可通過。在英偉達(dá)最近的自動(dòng)駕駛項(xiàng)目中,他們就使用了卷積神經(jīng)網(wǎng)絡(luò)來訓(xùn)練自動(dòng)駕駛系統(tǒng)。系統(tǒng)分析攝像頭提供的圖像,據(jù)此模仿人類的轉(zhuǎn)向角度。“
他還介紹了卷積神經(jīng)網(wǎng)絡(luò)在 Facebook 圖像識(shí)別系統(tǒng)中的應(yīng)用?!?strong>有了它之后,F(xiàn)acebook 的系統(tǒng)不僅能識(shí)別圖像,還能繪制出圖像的輪廓,并根據(jù)輪廓影像對(duì)物體進(jìn)行分類。該系統(tǒng)甚至可以挑出中國菜里面的西蘭花(如下圖)?!?/strong>
下面是對(duì)同一幅圖像識(shí)別前后的對(duì)比:
Yann LeCun 表示這是一個(gè)巨大的進(jìn)步,如果你在幾年前問一個(gè) AI 專家:”我們什么時(shí)候才能做到這樣?”,答案會(huì)是“不清楚”。
“ 想讓 AI 技術(shù)繼續(xù)進(jìn)步,我們就必須要讓機(jī)器能夠分析、推理、記憶,把現(xiàn)象和文字轉(zhuǎn)化為運(yùn)行知識(shí)。”
他接著作出預(yù)測,下一個(gè)將會(huì)十分流行的技術(shù)是記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)。它可被理解為用記憶增強(qiáng)的遞歸神經(jīng)網(wǎng)絡(luò),其中,記憶本身是一個(gè)能被區(qū)分的回路,并可以作為學(xué)習(xí)中的一部分用于訓(xùn)練。Yann LeCun 接下來對(duì)該技術(shù)進(jìn)行了深入探討,這里不贅述,詳情請(qǐng)見視頻。
進(jìn)行強(qiáng)化學(xué)習(xí)、監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)的所需數(shù)據(jù)規(guī)模相差數(shù)個(gè)數(shù)量級(jí)。強(qiáng)化學(xué)習(xí)每次驗(yàn)證(trial)所需的信息可能只有幾比特,監(jiān)督學(xué)習(xí)是十到一萬比特的信息量,而無監(jiān)督學(xué)習(xí)則需要數(shù)百萬比特。所以,Yann LeCun 做了一個(gè)比喻:假設(shè)機(jī)器學(xué)習(xí)是一個(gè)蛋糕,強(qiáng)化學(xué)習(xí)是蛋糕上的一粒櫻桃,監(jiān)督學(xué)習(xí)是外面的一層糖衣,無監(jiān)督學(xué)習(xí)則是蛋糕糕體。無監(jiān)督學(xué)習(xí)的重要性不言而喻。為了讓強(qiáng)化學(xué)習(xí)奏效,也離不開無監(jiān)督學(xué)習(xí)的支持。
當(dāng)下的主要問題是,AI 系統(tǒng)沒有“常識(shí)”。人類和動(dòng)物通過觀察世界、行動(dòng)和理解自然規(guī)律來獲得常識(shí),機(jī)器也需要學(xué)會(huì)這么做。包括 Yann LeCun 在內(nèi)的許多專家,把無監(jiān)督學(xué)習(xí)作為賦予機(jī)器常識(shí)的關(guān)鍵,該過程如下:
AI 系統(tǒng)由兩部分組成:代理和目標(biāo)(agent and objective)。代理做出行動(dòng),觀察該行動(dòng)對(duì)現(xiàn)實(shí)的影響產(chǎn)生認(rèn)知,然后再通過該認(rèn)知來預(yù)測現(xiàn)實(shí)情況。代理進(jìn)行這一系列活動(dòng)的動(dòng)機(jī)來自于實(shí)現(xiàn)目標(biāo),而最終的目的則是:以最高的效率達(dá)到該目標(biāo)。在強(qiáng)化學(xué)習(xí)中,對(duì)代理行為的獎(jiǎng)勵(lì)(reward)來自于外部,無監(jiān)督學(xué)習(xí)的獎(jiǎng)勵(lì)則來自內(nèi)部(對(duì)接近該目標(biāo)的滿意)。
但這個(gè)過程存在一個(gè)很大的問題:代理進(jìn)行無監(jiān)督學(xué)習(xí)的方法是在現(xiàn)實(shí)生活中進(jìn)行各種嘗試,這存在危險(xiǎn)并且效率很低。比如,無人駕駛車不能嘗試所有可能的駕駛方法,會(huì)帶來安全隱患。這種嘗試又受到時(shí)間的限制,不能像計(jì)算機(jī)程序那樣每秒運(yùn)行數(shù)千次。所以,Yann LeCun 解釋道,為了提高機(jī)器學(xué)習(xí)的效率,我們需要基于模型的強(qiáng)化學(xué)習(xí)(model based reinforcement learning )。它由三部分組成:現(xiàn)實(shí)模擬器(world simulator),行動(dòng)器(actor)和反饋裝置(critic)?,F(xiàn)實(shí)模擬器對(duì)現(xiàn)實(shí)情況進(jìn)行模擬,行動(dòng)器生成行動(dòng)預(yù)案(action proposals),然后反饋裝置對(duì)該行動(dòng)的效果進(jìn)行預(yù)測。這樣,AI 系統(tǒng)就可以對(duì)行動(dòng)反復(fù)推演,進(jìn)行優(yōu)化,而不受到現(xiàn)實(shí)中時(shí)間和成本的限制。
小結(jié): 作為業(yè)內(nèi)大牛,Yann LeCun 的一舉一動(dòng)都受到關(guān)注。他之前就發(fā)表過對(duì) AI 前景和無監(jiān)督學(xué)習(xí)的若干講話,這一次在卡內(nèi)基梅隆的研究人員面前再次強(qiáng)調(diào)了他的觀點(diǎn)。雖然這不是我們第一次聽到專家強(qiáng)調(diào)無監(jiān)督學(xué)習(xí)、甚至是卷積神經(jīng)網(wǎng)絡(luò)的重要性;但此次演講中, Yann LeCun 借用許多技術(shù)細(xì)節(jié)和各大公司、研究院正在從事的研究作為示例,為無監(jiān)督學(xué)習(xí)將來會(huì)怎樣發(fā)展作了全面的注解。正因如此,雷鋒網(wǎng)建議關(guān)注 AI 領(lǐng)域未來發(fā)展方向的讀者,不妨抽出一個(gè)下午仔細(xì)聽一下演講,必定會(huì)有收獲。
【招聘】雷鋒網(wǎng)堅(jiān)持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領(lǐng)域第一時(shí)間提供海外科技動(dòng)態(tài)與資訊。我們需要若干關(guān)注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。工作地點(diǎn)深圳。簡歷投遞至 guoyixin@leiphone.com 。兼職及實(shí)習(xí)均可。
推薦閱讀:
大神 Yann LeCun:我們的使命是終結(jié)“填鴨式” AI
深度學(xué)習(xí)元老Yann Lecun詳解卷積神經(jīng)網(wǎng)絡(luò)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。