2
本文作者: 三川 | 2016-11-21 18:43 |
作為 Facebook 人工智能部門主管, Yann LeCun 是 AI 領域成績斐然的大牛,也是行業(yè)內最有影響力的專家之一。
近日,LeCun在卡內基梅隆大學機器人研究所進行了一場 AI 技術核心問題與發(fā)展前景的演講。他在演講中提到三點干貨:
1. 無監(jiān)督學習代表了 AI 技術的未來。
2. 當前 AI 應用的熱點集中在卷積神經(jīng)網(wǎng)絡。
3. 用模擬器提高無監(jiān)督學習的效率是大勢所趨。
演講完整視頻如下。該視頻長 75 分鐘,并包含大量專業(yè)術語,因此雷鋒網(wǎng)節(jié)選關鍵內容做了視頻摘要,以供讀者瀏覽。
以下為視頻摘要:
AI 技術的飛速進步很大程度上是由于深度學習和神經(jīng)網(wǎng)絡領域的突破,還得益于大型數(shù)據(jù)庫的建立和更快的 GPU。我們現(xiàn)在已有了圖像識別能力可與人類相比的 AI 系統(tǒng) (例如下文中 Facebook 的識別系統(tǒng))。這會導致自動化交通,醫(yī)療圖像解析在內的多個領域的革命。但這些系統(tǒng)現(xiàn)在用的都是監(jiān)督學習(supervised learning),輸入的數(shù)據(jù)被人為加上標簽。
接下來的挑戰(zhàn)在于,怎么讓機器從未經(jīng)處理的、無標簽無類別的數(shù)據(jù)中進行學習,比方說視頻和文字。而這就是無監(jiān)督學習(unsupervised learning)。
傳統(tǒng)的思想認為,如果你沒有大量的數(shù)據(jù),神經(jīng)網(wǎng)絡應該控制在較小的規(guī)模。Yann LeCun 指出這完全是錯誤的。他的團隊在數(shù)據(jù)不變的情況下擴展了神經(jīng)網(wǎng)絡,得到了更好的結果。他說,神經(jīng)網(wǎng)絡越大,效果就越好(當然前提是數(shù)據(jù)庫大小達到了臨界值)。至于為什么會這樣,目前仍是一個謎,相關理論研究正在開展。
Yann LeCun 特別強調了卷積神經(jīng)網(wǎng)絡的重要性和應用:”我們很早就認識到,卷積神經(jīng)網(wǎng)絡可以被用來處理多種任務——不單單是識別單個物體(比如字母數(shù)字),還可以識別多個物體,同時進行物體識別、分組和解釋。比方說,可以用卷積神經(jīng)網(wǎng)絡訓練 AI 系統(tǒng)識別并標注(攝像頭所拍攝)圖像中的每一個像素,以此分析前方路徑是否可通過。在英偉達最近的自動駕駛項目中,他們就使用了卷積神經(jīng)網(wǎng)絡來訓練自動駕駛系統(tǒng)。系統(tǒng)分析攝像頭提供的圖像,據(jù)此模仿人類的轉向角度?!?/p>
他還介紹了卷積神經(jīng)網(wǎng)絡在 Facebook 圖像識別系統(tǒng)中的應用。“有了它之后,F(xiàn)acebook 的系統(tǒng)不僅能識別圖像,還能繪制出圖像的輪廓,并根據(jù)輪廓影像對物體進行分類。該系統(tǒng)甚至可以挑出中國菜里面的西蘭花(如下圖)?!?/strong>
下面是對同一幅圖像識別前后的對比:
Yann LeCun 表示這是一個巨大的進步,如果你在幾年前問一個 AI 專家:”我們什么時候才能做到這樣?”,答案會是“不清楚”。
“ 想讓 AI 技術繼續(xù)進步,我們就必須要讓機器能夠分析、推理、記憶,把現(xiàn)象和文字轉化為運行知識?!?/p>
他接著作出預測,下一個將會十分流行的技術是記憶增強神經(jīng)網(wǎng)絡。它可被理解為用記憶增強的遞歸神經(jīng)網(wǎng)絡,其中,記憶本身是一個能被區(qū)分的回路,并可以作為學習中的一部分用于訓練。Yann LeCun 接下來對該技術進行了深入探討,這里不贅述,詳情請見視頻。
進行強化學習、監(jiān)督學習、無監(jiān)督學習的所需數(shù)據(jù)規(guī)模相差數(shù)個數(shù)量級。強化學習每次驗證(trial)所需的信息可能只有幾比特,監(jiān)督學習是十到一萬比特的信息量,而無監(jiān)督學習則需要數(shù)百萬比特。所以,Yann LeCun 做了一個比喻:假設機器學習是一個蛋糕,強化學習是蛋糕上的一粒櫻桃,監(jiān)督學習是外面的一層糖衣,無監(jiān)督學習則是蛋糕糕體。無監(jiān)督學習的重要性不言而喻。為了讓強化學習奏效,也離不開無監(jiān)督學習的支持。
當下的主要問題是,AI 系統(tǒng)沒有“常識”。人類和動物通過觀察世界、行動和理解自然規(guī)律來獲得常識,機器也需要學會這么做。包括 Yann LeCun 在內的許多專家,把無監(jiān)督學習作為賦予機器常識的關鍵,該過程如下:
AI 系統(tǒng)由兩部分組成:代理和目標(agent and objective)。代理做出行動,觀察該行動對現(xiàn)實的影響產(chǎn)生認知,然后再通過該認知來預測現(xiàn)實情況。代理進行這一系列活動的動機來自于實現(xiàn)目標,而最終的目的則是:以最高的效率達到該目標。在強化學習中,對代理行為的獎勵(reward)來自于外部,無監(jiān)督學習的獎勵則來自內部(對接近該目標的滿意)。
但這個過程存在一個很大的問題:代理進行無監(jiān)督學習的方法是在現(xiàn)實生活中進行各種嘗試,這存在危險并且效率很低。比如,無人駕駛車不能嘗試所有可能的駕駛方法,會帶來安全隱患。這種嘗試又受到時間的限制,不能像計算機程序那樣每秒運行數(shù)千次。所以,Yann LeCun 解釋道,為了提高機器學習的效率,我們需要基于模型的強化學習(model based reinforcement learning )。它由三部分組成:現(xiàn)實模擬器(world simulator),行動器(actor)和反饋裝置(critic)。現(xiàn)實模擬器對現(xiàn)實情況進行模擬,行動器生成行動預案(action proposals),然后反饋裝置對該行動的效果進行預測。這樣,AI 系統(tǒng)就可以對行動反復推演,進行優(yōu)化,而不受到現(xiàn)實中時間和成本的限制。
小結: 作為業(yè)內大牛,Yann LeCun 的一舉一動都受到關注。他之前就發(fā)表過對 AI 前景和無監(jiān)督學習的若干講話,這一次在卡內基梅隆的研究人員面前再次強調了他的觀點。雖然這不是我們第一次聽到專家強調無監(jiān)督學習、甚至是卷積神經(jīng)網(wǎng)絡的重要性;但此次演講中, Yann LeCun 借用許多技術細節(jié)和各大公司、研究院正在從事的研究作為示例,為無監(jiān)督學習將來會怎樣發(fā)展作了全面的注解。正因如此,雷鋒網(wǎng)建議關注 AI 領域未來發(fā)展方向的讀者,不妨抽出一個下午仔細聽一下演講,必定會有收獲。
【招聘】雷鋒網(wǎng)堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領域第一時間提供海外科技動態(tài)與資訊。我們需要若干關注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。工作地點深圳。簡歷投遞至 guoyixin@leiphone.com 。兼職及實習均可。
推薦閱讀:
大神 Yann LeCun:我們的使命是終結“填鴨式” AI
深度學習元老Yann Lecun詳解卷積神經(jīng)網(wǎng)絡
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。