0
本文作者: 逸炫 | 2016-05-04 17:17 |
Adam Berenzweig(左二)在斯坦福人的一場人工智能專家論壇上。圖片來源:Forbes。
Adam Berenzweig獲得哥倫比亞大學(xué)博士學(xué)位后,在谷歌工作了超過十年的時間,建造了最早的谷歌音樂推薦系統(tǒng),并參與了谷歌新聞、Goggles(Google的圖像搜索應(yīng)用)和實時搜索等項目工作。在Goggles,他開發(fā)移動應(yīng)用,讓用戶可以將攝像頭對準(zhǔn)世界上的任意物體,人工智能會識別物體并提供相關(guān)信息。要知道在當(dāng)時,深度學(xué)習(xí)和復(fù)雜物體識別技術(shù)八字都還沒有一撇。
“我們可以做局部特征提取和指紋識別,這對標(biāo)識、藝術(shù)作品和海報還不錯。所以人工智能可以識別街對面的電影海報,但是搞不懂貓和狗有什么區(qū)別,或者椅子和桌子有什么區(qū)別?!盇dam說。大概2012年左右,神經(jīng)網(wǎng)絡(luò)可以識別圖片中的物體了。
“我職業(yè)生涯的大部分都在使用機器學(xué)習(xí)打造產(chǎn)品。我喜歡利用最新的研究突破,研究如何將其應(yīng)用在實用性強、影響廣泛的項目中?!?/p>
在谷歌工作十年之后,Adam受到Matt Zeiler的邀請創(chuàng)建機器學(xué)習(xí)公司Clarifai,目標(biāo)“將大規(guī)模深度學(xué)習(xí)帶入日常生活?!弊鳛楣綜TO,Adam打造了大部分的機器架構(gòu),還涉及了產(chǎn)品。“Matt Zeiler在2013年贏得了ImageNet國際計算機視覺挑戰(zhàn)賽(編者注:ImageNet有“計算機視覺的奧林匹克”之稱,是斯坦福計算機專家模擬人類識別系統(tǒng)建立的計算機視覺系統(tǒng)識別項目。2015年大賽中微軟獲勝、百度因作弊未入榜。)當(dāng)時,這些模型逐漸顯示出它們的實力?!盇dam說。
“他在這個領(lǐng)域內(nèi)工作了一段時間,他看到了這些系統(tǒng)正在穩(wěn)步、緩慢、逐步積累地成長。他給我展示了他的早期演示,這在系統(tǒng)性能方面是一個明顯提升,很明顯,這種性能提升為很多新應(yīng)用打開了空間。”在Clarifai工作了兩年后,Adam于幾周前剛剛離開,回歸自己最初對于個人化推薦的熱情。
“現(xiàn)在,每個人擁有和不斷創(chuàng)造的數(shù)據(jù)跨越了很多不同的服務(wù)。如果我們可以將數(shù)據(jù)集中在一個地方,讓用戶可以更好地直接接觸到這種科技巨頭們在做的個人模型,我們將大有可為?!盇dam說。這是他職業(yè)生涯的下一個目標(biāo)。“如何建造機器驅(qū)動的產(chǎn)品,實現(xiàn)以數(shù)字為中心,并將機器學(xué)習(xí)的結(jié)果以不讓人混亂的方式呈現(xiàn)出來?!?/strong>
Adam Berenzweig。圖片來源Linkedin。
Adam在Hacker Unit的線上課程中,分享了他從事機器學(xué)習(xí)13年的心得:
你用來打造試驗的系統(tǒng)萬分重要:你能夠多快地通過不同參數(shù)和配置帶來新的試驗?在沒有很大工程量的前提下,你能多快地設(shè)計新試驗并建造模型?接下來的問題就是將結(jié)果視覺化,可以快速看到什么結(jié)果行、什么結(jié)果不行,從而決定接下來專注做什么、不做什么。在我的經(jīng)驗中,我經(jīng)常從零開始,但是貌似現(xiàn)在有很多人都在研究這些東西,所以開源工具越來越好了。
從實驗室獲得訓(xùn)練數(shù)據(jù)時,思考一下你將如何在頁面上呈現(xiàn)它。要細(xì)化到這種程度:用多大的字體、一頁上有多少個物件。這看起來有點傻,不像開發(fā)智能硬件的“硬派風(fēng)格”,但是實際上這些都對訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量有很大影響。
現(xiàn)在,有許多產(chǎn)品在某種程度上都包含了機器學(xué)習(xí)技術(shù)。所以,在打造產(chǎn)品的時候腦子里要記住這一點:這個產(chǎn)品里出來的數(shù)據(jù),會是好的訓(xùn)練數(shù)據(jù)嗎?這是我認(rèn)為必須一直關(guān)注的點。正確的做法可以是,當(dāng)錯誤發(fā)生的時候給用戶改正錯誤的機會,確保這在產(chǎn)品的使用流程之內(nèi)。給用戶呈現(xiàn)的感覺應(yīng)該是,這是對我有價值的東西,因為這會幫助改正產(chǎn)品中的錯誤,這對用戶自己也有好處。
關(guān)于亞馬遜土耳其機器人(譯者注:一個Web服務(wù)應(yīng)用程序接口(API),開發(fā)商可以遠(yuǎn)程調(diào)用人的智能來完成一些對計算機來說很難的“簡單”任務(wù),例如撰寫產(chǎn)品描述或選擇某一主題的最佳照片等),我的個人經(jīng)驗是很難找到好的標(biāo)識員,因為這上面人們的流動性很快。實際上,很多標(biāo)識任務(wù)得讓人花時間適應(yīng),基本上要接受一定訓(xùn)練。我們最終使用了其他的系統(tǒng),獲得了一些可以保持長期關(guān)系的人。那非常重要。
我們建立Clarifai的時候,我們沒有很多的收入。我們有產(chǎn)品,我們在API上有用戶,剩下的,就只有一個“這是一個好機會”的信念。關(guān)于Clarifai的另一點是,圖像很容易用來作為演示,所以我們從早期開始在網(wǎng)站上就一直有一個演示,讓人們直接地看到產(chǎn)品的可能性,抓住了他們的想象力。在其他領(lǐng)域,要不是數(shù)據(jù)非常具體——例如某個公司的企業(yè)數(shù)據(jù)——要不就是不太容易進行視覺呈現(xiàn)。我想這是一個很大的挑戰(zhàn)。
單單用一個GPU就能實現(xiàn)很多東西。也許在未來的一兩年會改變,但是多GPU系統(tǒng)——如何在多個GPU上將訓(xùn)練最優(yōu)化——這個問題我覺得還沒有解決。因此,大部分人還不用考慮這個問題。我認(rèn)為你用同一個GPU就能得到很多,可擴展性只是能不能在訓(xùn)練中將數(shù)據(jù)輕松轉(zhuǎn)移的問題,而且這會有一個長期的服務(wù)。
開源系統(tǒng)有非常強的社區(qū),并且在快速提升。你可以去了解一下,看看是不是值得轉(zhuǎn)移去開源社區(qū)。我認(rèn)為得看領(lǐng)域。其他很重要的因素是團隊的技能如何、人們習(xí)慣使用的語言是什么、他們是否真的熟悉這些框架。我認(rèn)為他們挺好的。
我們一直會使用我們自己喜歡的方法。如果那本來就是我們自己也想深入的方向,或者,如果我們出于其他理由覺得,這對別人來說也會非常有用,我們就會愿意為客戶定制化。當(dāng)我們心里想到“這是個很好的領(lǐng)域,我們該做?!蹦敲矗覀兙蜁プ?。有時候,我們會為定制化收費,因為我們投入了額外的工程時間,有其合理性。有時候我們不會收費,這通常是洽談過程的一部分。主要這得看客戶的體量。
可行的東西有很多,你只需要幾個就夠。也許是一支有成功案例的隊伍,也許是一種別人都沒有的技術(shù),也許是產(chǎn)品演示中很好的產(chǎn)品感覺,或者很好的執(zhí)行能力、公司愿景與想象力,或者是發(fā)現(xiàn)一種還沒有人實踐的新機會。Clarifai最初有很多可行的點,但是我們聽到了一種評論,就是我們同時想做到的事情太多了。我們在建造API,我們還有圖片應(yīng)用。我們成功了,但是有一些投資人因為這一點轉(zhuǎn)身離去。這其中的關(guān)鍵就是,找到對你來說可行的點,然后去找到相應(yīng)的投資人。
Via BeMyApp
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。