0
本文作者: AI科技評論 | 2016-05-09 16:25 |
圖片來源:Wired
深度神經(jīng)網(wǎng)絡(luò)正在改變我們的互聯(lián)網(wǎng)。這些人工智能(AI)系統(tǒng)可以通過分析大量數(shù)據(jù)來學習人類能做的事情,這項技術(shù)正為各種線上服務(wù)注入過去無法想象的能量:以識別照片中的人臉、識別說給智能手機聽的命令、完成人類各種語言之間的翻譯。甚至,這些智能系統(tǒng)在幫助谷歌選擇搜索結(jié)果。這些我們都聽說過,但是我們只知道臺前、不知幕后——這些巨頭是如何打造人工智能引擎的。
我們聽說過谷歌和Facebook等公司都給世界頂尖的人才支付世界頂尖的薪酬。地球上只有這么幾百個人,具備推動人工智能技術(shù)前進的才華與資質(zhì),業(yè)界一直將他們的天價薪酬比作球隊里的明星球員。這對于人工智能技術(shù)的進展是一個瓶頸。除此以外,即便是頂尖的研究員,也必須經(jīng)過無數(shù)次的試錯才能推出成功的產(chǎn)品。要打造一個推出下一個“爆款”AI的深度神經(jīng)網(wǎng)絡(luò),研究員必須首先經(jīng)過無數(shù)次試錯,每一次試錯都得跑幾十個、甚至幾百個機器。
“與其說是在當明星球員,還不如說是在當教練,”DeepMind聯(lián)合創(chuàng)始人Demis Hassabis說,他參與打造了上一個AI“爆款”、打敗世界圍棋冠軍的AlphaGo?!澳銢]法直接告訴機器該做什么,只能哄著騙著他們。”
所以現(xiàn)在,科技巨頭們打算將開發(fā)AI的試錯過程也自動化——至少,自動化一部分。其中的思路是,如果你將一部分體力活自動化了,至少可以讓更快地將最帥氣的機器學習技術(shù)交到工程師手中——然后,你可以讓那些頂尖人才們?nèi)ニ伎几?、更難的問題。這反過來又會加快開發(fā)AI的進程。
換句話說,為了讓電腦變得更聰明,電腦自己得搞定更多的體力活?;ヂ?lián)網(wǎng)巨頭們在打造可以代替工程師去測試無數(shù)機器學習算法的計算系統(tǒng),可以自己循環(huán),創(chuàng)造無數(shù)可能。更帥氣的是,他們在打造人工智能算法來打造人工智能算法。對,你沒看錯。在Facebook,工程師設(shè)計了他們稱為“自動化機器學習工程師”的人工智能系統(tǒng),幫助打造更多的人工智能系統(tǒng)。雖然還不完美,但是系統(tǒng)希望打造AI模型的過程中,利用的人力越少越好。
隨著2012年Facebook完成一千零四百億美元的IPO,Hussein Mehanna和其他Facebook廣告團隊的工程師感受到了壓力——要進一步提升公司的廣告目標、更精準地將廣告匹配給幾百萬Facebook用戶。這意味著打造深度神經(jīng)網(wǎng)絡(luò)和其他機器學習算法,好好利用Facebook所獲得的關(guān)于用戶行為特征的海量信息。
據(jù)Mehanna說,F(xiàn)acebook的工程師有足夠的腦洞提出新想法,但是沒有足夠精力進行測試。因此他和團隊打造了一個名叫Flow的工具。“我們希望打造一個所有Facebook工程師都能使用的機器學習生產(chǎn)線?!?/strong>Mehanna說,F(xiàn)low設(shè)計用于讓工程師們能夠大規(guī)模打造、測試和執(zhí)行機器學習算法,這基本上包括了任何形式的機器學習——廣義上來說,這項技術(shù)可以包括所有能夠自主學習任務(wù)的服務(wù)。
大致來說,工程師們可以用現(xiàn)成的系統(tǒng)來測試無數(shù)的概念,利用公司巨大的計算機數(shù)據(jù)中心網(wǎng)絡(luò)。他們可以運行各種算法可能——不只是深度學習,還有其他形式的AI,包括logistic回歸分析(編者注:一種常應(yīng)用于探索流行病學危險因素的分析模型)以及提高決策樹(編者注:一種用于分類回歸的決策樹模型)——這些測試結(jié)果可以化作春泥,滋生更多的新概念誕生?!澳銣y試的概念越多越好,”Mehanna說,“你試用的數(shù)據(jù)越多越好。”這也意味著,工程可以使用別人打造的現(xiàn)成算法,來應(yīng)用到其他任務(wù)中去。
很快,Mehanna和團隊將Flow的應(yīng)用擴展到了全公司。在其他團隊中,它可以幫助制造算法,選擇你的Facebook新聞流(News Feed)的連接,識別社交網(wǎng)絡(luò)上照片里是誰,或者為盲人生成有聲標題來理解照片內(nèi)容。它甚至還能幫助公司決定,幫助全球哪些地方連接互聯(lián)網(wǎng)。
Mehanna說,F(xiàn)acebook有了Flow就能每月訓練、測試大約30萬個機器學習模型。以前,公司每2個月(60天左右)在社交媒體上發(fā)布一個新的AI模型,現(xiàn)在有了Flow,公司可以每周都發(fā)布好幾個新模型。好強大。
這個概念比Facebook本身更強大。這是深度學習領(lǐng)域的通用做法。去年,Twitter收購了初創(chuàng)公司W(wǎng)hetLab,就是專門做這的。最近,微軟描述了自己的工程師如何使用一個系統(tǒng)來測試海量的潛在AI模型。微軟研究員Jian Sun稱其為“人類協(xié)助的搜索”。
Mehanna和Facebook想為這一潮流加大馬力。公司計劃最終將Flow開源,與全世界分享。據(jù)Mehanna稱,類似Linkedin、Uber和Twitter等公司已經(jīng)對Flow興趣濃厚。Mehanna和團隊還開發(fā)了一個稱謂“AutoML”(意為“自動機器學習”)的工具,開源進一步減輕人類工程師的負擔。在Flow上運行的AutoML開源自動“清除“訓練神經(jīng)網(wǎng)絡(luò)和其他機器學習算法的數(shù)據(jù)——不需要任何人類介入,就準備好進行測試——Mehanna還構(gòu)想了一個可以自動收集數(shù)據(jù)的版本。不過,更加引人遐想的是,AutoML使用人工智能來幫助人工智能。
正如Mehana所說,F(xiàn)acebook每月訓練、測試大約30萬個機器學習模型。AutoML可以使用這些機器學習測試來訓練另一個機器學習模型,該模型可以將機器學習的訓練過程最優(yōu)化。暈了嗎?不暈才怪。Mehanna將其比作《盜夢空間》,只不過這是真的。系統(tǒng)真的可以自動選擇最有可能成功的算法和參數(shù)?!八踔量梢栽谟柧氈熬统晒︻A(yù)測結(jié)果。”Mehanna補充道。
在Facebook廣告團隊內(nèi)部,工程師甚至打造了“自動化機器學習工程師”,這也傳遍了全公司。它名作Asimo,據(jù)Facebook稱它還曾自動生成了現(xiàn)有模型的增強和改善版本,人類工程師可以立刻應(yīng)用到網(wǎng)絡(luò)上?!八€沒辦法發(fā)明一個新的AI算法,”Mehanna說,“那是一直發(fā)展下去的話,誰知道呢……”
又是個超級引發(fā)遐想的新腦洞——確實,這個腦洞已經(jīng)在科幻小說里扮演了幾十年主角:一個可以自己建造自己的智能機器。Asimo還沒有天網(wǎng)那么高(驚)級(悚)。但是這是通往未來的一步臺階,未來培養(yǎng)AI大軍的不只是頂尖的人類頭腦了。未來,還會有一支專門培養(yǎng)AI大軍的AI大軍。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。