4
近日,吳恩達接受了Strategy+Business的采訪,由于Strategy+Business主要是一家關注公司的管理和經營策略的雜志,因此采訪也主要偏向于人工智能的商業(yè)化應用。不過這也給了我們一個很好的機會從另一個角度來看待AI,尤其是發(fā)現(xiàn)AI在實用性、商業(yè)化等方面的種種可能性。在采訪中吳恩達解釋了百度目前對深度學習在商業(yè)化方面的應用情況、深度學習在整個商業(yè)中的應用前景,對未來的展望,尤其是無人駕駛方面的應用的期望,他表示語音識別將給我們的生活帶來巨大的變化,并分析了人工智能對社會可能造成的影響和應對的方式,讓我們來看看Strategy+Business的采訪原文:
在人工智能領域,“深度學習”這個詞意味著這個軟件可以通過實踐經驗改善算法模型的表現(xiàn)。比如谷歌在2012年發(fā)起的一個項目,讓一個運行在16000個處理器上的神經網絡瀏覽了1000萬個Youtube上的視頻后,算法自己學會了識別貓臉。
這個項目的領導者:吳恩達,現(xiàn)在已經加入了百度的百度研究院并成為了其首席科學家,百度和谷歌、微軟等搜索服務商一樣對機器學習有著天然的興趣。所以百度2014年在加州森尼維爾市成立了百度研究院,負責AI領域的研究。其包含三個部分:大數(shù)據實驗室、深度學習實驗室和硅谷AI實驗室。
促進人類和機器智能的合作是吳恩達研究的一個主線,在2008年的時候他作為斯坦福大學的計算機科學教授,在網上開設了一門在線機器學習課程。這門課程最終發(fā)展成為了該校廣受贊譽的MOOC在線教育平臺的旗艦課程。這門課的學生數(shù)在幾年內迅速發(fā)展到了10萬人以上。2012年,吳恩達和斯坦福大學的同事Daphne Koller建立了Coursea,一個給學生免費提供一流大學教育水平的在線課程的技術教育公司。吳恩達在成為它的董事長的同時,也保留了他在斯坦福的職位。
吳恩達是技術發(fā)展的領軍人物之一,經常公開敘述在日常生活中智能設備會給我們帶來的便利。在三月的舊金山數(shù)據大會的演講后,吳恩達接受了商業(yè)戰(zhàn)略(Strategy+business)的采訪。在采訪中,他再次強調了他在大會上表達的觀點。在這個為更高的回報價值而優(yōu)化的端對端戰(zhàn)略中,公司的受益會是最大的,對無論是對個體還是對企業(yè),而最終全世界都會受益。
S+B:深度學習是什么,它能給一個公司帶來什么價值?
吳恩達:深度學習是一個已經發(fā)展了數(shù)十年的想法的新呈現(xiàn)方式。在最開始的時候,人們先是開始用從大腦的結構中獲得了某些靈感的智能神經網絡進行試驗。但直到最近我們的電腦發(fā)展出了這樣的計算能力,也擁有了如此龐大的數(shù)據,以及擁有了能幫我們構建能夠在沒有人類的程序員的設計和指引下自主學習到一些有層次的概念的神經網絡的專業(yè)知識之后。(這些神經網絡)才開始能夠幫助提取、組織和處理現(xiàn)代公司中這些復雜的數(shù)據。
在幾年前,我們發(fā)現(xiàn)深度學習終于開始表現(xiàn)得比傳統(tǒng)的AI實現(xiàn)方法要好了。以前的那些AI是完全不會知道如何處理我們現(xiàn)在處理的這種規(guī)模的數(shù)據的。
在過去的五年里,我們終于擁有了足以建立龐大到能處理我們從互聯(lián)網和移動設備中收集到的這么大規(guī)模數(shù)據的神經網絡的計算能力。通過建立這種大規(guī)模神經網絡,我們可以檢驗我們深度學習算法的表現(xiàn)情況。而隨著我們給算法輸入越來越多的數(shù)據,它們的表現(xiàn)也會越來越好。這意味著我們能做出遠比現(xiàn)在更精確的模型和預測,并且用我們收集到的這些數(shù)據來發(fā)現(xiàn)公司中的問題。
對于少數(shù)企業(yè)來說,深度學習可以為其帶來驚人的收入增長。搜索引擎和在線廣告可能是短期來看AI最重要的應用了。搜索結果能更貼近用戶的需要的話,無論是對廣告商、對用戶還是對我們來說都是件好事。
S+B:你覺得接下來的十年內深度學習會如何演化?
吳恩達:我發(fā)現(xiàn)深度學習的前沿在同高性能計算產生越來越密切的關系。我和我們的團隊建起了非常強大的超級計算機來充分發(fā)揮我們所擁有的海量數(shù)據帶來的優(yōu)勢。
短期內深度學習帶來的大部分商業(yè)價值都是來自于我們稱之為監(jiān)督式學習的算法。比如:我們給算法看一個Email,算法就能判斷它是不是垃圾郵件?;蛘呶覀兘o出一個廣告,它就能預測用戶什么時候會點擊這個廣告。我們已經從監(jiān)督式學習中創(chuàng)造了巨大的商業(yè)價值。而且我們認為在將來的幾年中我們還能在這其中順利的創(chuàng)造出更大更驚人的附加價值。
但是往更長遠一點的方向看的話,我覺得很多項目,比如像圖像識別和語音識別這樣深度學習已經在其上取得了巨大進展的項目。它們不僅會為公司創(chuàng)造巨大的經濟價值,也會讓我們的世界變成一個更好的地方。
就單看自動駕駛汽車這一項上的發(fā)展,深度學習就能為我們帶來比現(xiàn)在安全和方便得多的出行體驗,不管是從增加人們的預期壽命還是幫人們節(jié)省很多時間來看,它實際上都給我們每個人的人生憑空增加了幾年的可用時間。有數(shù)據表示,汽車事故可能平均減少了孩子們三年的預期壽命,美國人一生中平均也差不多有三年是在車上度過的。所以,在某種程度上我們可以說我們讓每個人的人生中都多了六年有意義的時間。這聽起來真的很不錯。
S+B:你提到了自動駕駛汽車,這東西真的那么快就能實現(xiàn)了嗎?
吳恩達:是的,我們希望在三年內做出能商業(yè)化應用的自動駕駛汽車,并在五年內實現(xiàn)大規(guī)模量產。最終過程的時間段其實很難預測,但這個時間是我們覺得最有可能實現(xiàn)的時間了。
對目前自動駕駛汽車的狀態(tài)來說,似乎有一個與手動駕駛的類比是合適的。當你的車開入一片工地的時候,它表現(xiàn)得必須和在普通的街道上行駛的時候不一樣。它必須要開得慢一些,還要注意建筑工人。
我現(xiàn)在還不覺得近期計算機視覺能可靠的分辨出建筑工人打的手勢(比如停,走和減速)的含義。但是我們可以通過適當改變基礎設施的設計來解決這個問題。比如給建筑工人一個無線信標。同時適當調整一下道路的設計和建造方式以及社會期望。我們可以使無人駕駛汽車成為現(xiàn)實,并且讓它比人類駕駛的汽車安全得多。
我想用AI,通過嵌入環(huán)境中的那些智能設備來創(chuàng)造一個更好的社會?,F(xiàn)在的語音控制就像2000年初的觸屏設備那樣。太初級了以至于很難具備什么實用價值。但隨著iPhone的發(fā)明,喬布斯和蘋果發(fā)現(xiàn)了讓觸摸屏變得有效率的方法。語音控制也會經歷類似的變革的。他們會影響社會的方方面面。想象會遵守我們語音指令的機器人和機器人警衛(wèi)。我希望將來我的子孫們會奇怪,為什么我們這個時代想要調空調的溫度的時候還需要去轉刻度盤,而不是直接告訴房子“我們覺得有點冷”。
S+B:你曾經在四個大型組織中工作:斯坦福,Coursera,谷歌和現(xiàn)在的百度。作為一個一直想要促進深度學習發(fā)展的人,你覺得我們應該怎樣合作來創(chuàng)造一個更好的算法?
吳恩達:我花了很多時間來試圖建立一個目的就在于確保我們研究的所有成果都確實能幫助到足夠多的人的組織。因此我們參考了百度研究所這樣端對端研究組織的架構。比如說,如果有人發(fā)明了深度神經網絡,那我們就負責搞清楚他需要的數(shù)據來自哪里以及他怎樣把這個成果應用到他的產品中去,以及,這個東西在最后怎么提高我們的生活質量。
在Coursera,我最驕傲的那些時候是當高層面臨一些艱難的抉擇的時候,會有除我以外的其它人站出來,說,“讓我們回歸本質去思考,搞清楚到底什么是對學習者最好的選擇然后先做那個?!?br/>
我真的很欣賞這種回歸本源的思考方式。有太多人陷入一件事不能自拔,只是因為他一直在做那件事或者其他人一直在做那件事。他們做事的結果可能看起來比較有效,但很可能算不上什么真正的成就。
S+B:如果想讓AI和科技為人們更好的服務,人們需要信任體制。但人們對龐大的體制的信任正在削弱。你怎么解決這個問題?
吳恩達:我覺得我們需要與政府和社會更緊密的合作來解決一些與AI相關的問題。比如,一個非常大的可能的問題是裁員。作為技術人員我們應該對這個問題坦誠一些。美國有350萬卡車司機。當自動駕駛系統(tǒng)發(fā)展成熟了,他們怎么辦?類似的是,AI會對醫(yī)學影像科的那些專家造成怎樣的影響?有些人可能需要開始規(guī)劃將來的出路了。
一般來說,新的技術都會給人創(chuàng)造新的,更有意義的角色,這次可能也會。不過在這個過程中可能會出現(xiàn)一些問題。這就是我支持為那些找不到工作的人確保一個最低(福利)收入的原因。但是我們應該要求那些獲得這些福利的人保持學習。如果我們能給那些無業(yè)人員獲得技能的報酬,對他們和社會都是件好事。世界正在以前所未有的速度變化,為了跟上它的步伐,我們必須保持不斷的學習。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。