離開OpenAI和導(dǎo)師一起創(chuàng)業(yè)，他們要讓機(jī)器人不編程也能像人一樣干活

本文作者：金紅

2017-11-19 10:10

導(dǎo)語(yǔ)：三個(gè)年輕的華人，成為硅谷冉冉升起的新星。

兩個(gè)月前，陳曦離開工作了一年半的OpenAI，和同事段巖、張?zhí)旌埔黄饎?chuàng)立了Embodied Intelligence。

上周， Embodied Intelligence 宣布獲700萬(wàn)美元種子投資，本輪融資由Amplify Partners領(lǐng)投，峰瑞資本（FreeS)、Lux Capital、SV Angels、11.2 Capital以及A.Capital跟投。

三個(gè)年輕的華人，成為硅谷冉冉升起的新星。

離開OpenAI和導(dǎo)師一起創(chuàng)業(yè)，他們要讓機(jī)器人不編程也能像人一樣干活

從左到右分別為陳曦（首席執(zhí)行官）、Pieter Abbeel（總裁及首席科學(xué)家）、段巖（首席技術(shù)官）、張?zhí)旌疲ㄑ芯靠茖W(xué)家）

拉上導(dǎo)師一起創(chuàng)業(yè)

Embodied Intelligence 之所以成為投資人爭(zhēng)相的寵兒，離不開三個(gè)創(chuàng)始人的背景。

創(chuàng)業(yè)前，三人是OpenAI Pieter Abbeel 教授實(shí)驗(yàn)室的同事，從事前沿領(lǐng)域如模仿學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及元學(xué)習(xí)的研究工作。

OpenAI 是由特斯拉CEO Elon Musk 于2015年12月聯(lián)合諸多硅谷大亨建立的人工智能非營(yíng)利組織，希望能夠預(yù)防人工智能的災(zāi)難性影響，推動(dòng)人工智能發(fā)揮積極作用。

2016年6月21日，OpenAI 宣布了其主要目標(biāo)，包括制造“通用”機(jī)器人和使用自然語(yǔ)言的聊天機(jī)器人。OpenAI研發(fā)主管Ilya Sutskever、OpenAI CTO Greg Brockman 硅谷知名創(chuàng)業(yè)加速器Y Combinator總裁 Sam Altman 以及連續(xù)創(chuàng)業(yè)家 Elon Musk 等人聯(lián)合發(fā)表博文稱：“我們正致力于利用物理機(jī)器人（現(xiàn)有而非OpenAI開發(fā)）完成基本家務(wù)。

OpenAI 聚集了世界級(jí)的工程師和科學(xué)家，其中就包括Pieter Abbeel。Pieter Abbeel 在人工智能領(lǐng)域非常有名，其在伯克利的實(shí)驗(yàn)室引領(lǐng)了諸多近期機(jī)器人學(xué)習(xí)領(lǐng)域的突破性進(jìn)展，包括讓機(jī)器人學(xué)會(huì)整理衣物，行走（仿真環(huán)境），以及通過(guò)反復(fù)試錯(cuò)或者VR示范數(shù)據(jù)來(lái)學(xué)習(xí)視覺驅(qū)動(dòng)的操縱物體的技能。

離開OpenAI和導(dǎo)師一起創(chuàng)業(yè)，他們要讓機(jī)器人不編程也能像人一樣干活

Pieter Abbeel

CEO陳曦向雷鋒網(wǎng)表示，最近五年學(xué)術(shù)圈有非常多突破，主要?dú)w結(jié)到深度學(xué)習(xí)的成功，和深度學(xué)習(xí)跟像強(qiáng)化學(xué)習(xí)領(lǐng)域的結(jié)合。于是，在完成自己的博士項(xiàng)目后，便拉上同事段巖、張?zhí)旌埔黄饎?chuàng)立了Embodied Intelligence，而導(dǎo)師Pieter Abbeel 也加盟了這個(gè)新團(tuán)隊(duì)任總裁和首席科學(xué)家。

無(wú)需編程，機(jī)器人可自然學(xué)習(xí)新技能

基于創(chuàng)始人們?cè)谀７聦W(xué)習(xí)、強(qiáng)化學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及元學(xué)習(xí)等領(lǐng)域的研究成果，Embodied Intelligence 開發(fā)了一款軟件，可讓任何人通過(guò)在虛擬現(xiàn)實(shí)（VR）設(shè)備里示范教學(xué)來(lái)讓機(jī)器人獲得新的技能。這些示范數(shù)據(jù)會(huì)被用來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)，而訓(xùn)練完畢的智能控制器使用強(qiáng)化學(xué)習(xí)進(jìn)一步改進(jìn)。通過(guò)這套流程，機(jī)器人可以輕松地學(xué)會(huì)廣泛的技能。

傳統(tǒng)的機(jī)器人編程非常耗費(fèi)時(shí)間，只有專業(yè)人員才能進(jìn)行。Embodied Intelligence 提供的智能模塊可以接入任何市面上的機(jī)器人，讓它們可以自然地學(xué)習(xí)新的技能，無(wú)需編寫晦澀難懂的代碼。

CEO陳曦向雷鋒網(wǎng)進(jìn)一步解釋這項(xiàng)技術(shù)：

第一步是通過(guò)人類的演示進(jìn)行學(xué)習(xí)，但這個(gè)要比簡(jiǎn)單的復(fù)制要復(fù)雜，因?yàn)槿祟愌菔臼呛茈y把所有的變化都覆蓋到，所以學(xué)習(xí)的結(jié)果是需要泛化的能力，就算是人類示教沒有演示到的情況下也能完成任務(wù)。

第二步是機(jī)器人可以進(jìn)行自我學(xué)習(xí)，具體的學(xué)習(xí)方法叫做深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning), 這個(gè)是通過(guò)機(jī)器人自己試錯(cuò)來(lái)進(jìn)行，可以找到比示教更優(yōu)的方案。不過(guò)不是所有場(chǎng)景都需要這一步，對(duì)于不少場(chǎng)景來(lái)講，做到跟人的示教一樣快，一樣好就可以了。

在他們發(fā)布在youtube的視頻中，他們使用這種方法訓(xùn)練一個(gè)兩臂機(jī)器人從桌上拾起球或者打繩結(jié)。Embodied Intelligence 團(tuán)隊(duì)們戴著 VR 頭顯，拿著動(dòng)作追蹤器，不斷地在數(shù)字世界中向機(jī)器人展示如何完成任務(wù)。然后，機(jī)器人可以從這些數(shù)據(jù)中學(xué)習(xí)。

技術(shù)太前沿短時(shí)間無(wú)法落地？

一般來(lái)說(shuō)，學(xué)術(shù)圈和工業(yè)圈的技術(shù)差距在5年左右。對(duì)于深度強(qiáng)化學(xué)習(xí)落地到工業(yè)圈，雷鋒網(wǎng)咨詢了幾位機(jī)器人領(lǐng)域創(chuàng)業(yè)者，他們均表示目前確實(shí)有很大進(jìn)展，尤其是Pieter Abbeel 在這個(gè)領(lǐng)域更是領(lǐng)軍人物做出了突出貢獻(xiàn)，不過(guò)要落地到工業(yè)圈，需要8到10年。

對(duì)此，陳曦向雷鋒網(wǎng)回應(yīng)了一句哈哈。對(duì)于是否有落地困難的問(wèn)題，陳曦表現(xiàn)地很樂觀，表示如果從硬件上面來(lái)講，其實(shí)這個(gè)公司早兩年還真做不了，運(yùn)算能力(GPU)最近兩年翻了好幾倍，然后消費(fèi)級(jí)的VR設(shè)備也是最近才開始普及。而工業(yè)機(jī)器人方面，則是已經(jīng)成熟很久了；而從難度來(lái)講，之所以選這個(gè)就是因?yàn)閳F(tuán)隊(duì)有能力可以做出來(lái)。

離開OpenAI和導(dǎo)師一起創(chuàng)業(yè)，他們要讓機(jī)器人不編程也能像人一樣干活

從左到右分別為Pieter Abbeel（總裁及首席科學(xué)家）、陳曦（首席執(zhí)行官）、段巖（首席技術(shù)官）、張?zhí)旌疲ㄑ芯靠茖W(xué)家）

“第一，我們做的東西真的跟產(chǎn)業(yè)中所有看到過(guò)的解決方案，不過(guò)是市面上的還是在研發(fā)的都完全不一樣。我們應(yīng)該是極少數(shù)使用端到端學(xué)習(xí)(end-to-end learning)的公司，這個(gè)應(yīng)該解釋了為什么會(huì)有人說(shuō)我們做的很學(xué)術(shù)。

第二是看這個(gè)技術(shù)本身，最主要的落地門檻在于實(shí)際應(yīng)用中的可靠性。在學(xué)術(shù)界中端到端學(xué)習(xí)出來(lái)的算法一般是70-90%的成功率左右，這個(gè)離工業(yè)應(yīng)用肯定是有一定距離的。但我們團(tuán)隊(duì)最近的研究成果顯示只用30分鐘的示教數(shù)據(jù)，就可以在很多場(chǎng)景里面達(dá)到90%的成功率。那么我們認(rèn)為，運(yùn)用更多示教數(shù)據(jù)和進(jìn)一步的算法優(yōu)化，我們是可以達(dá)到工業(yè)的要求的?！?/p>

作為唯一的國(guó)內(nèi)投資方，峰瑞資本創(chuàng)始人李豐對(duì)于這個(gè)項(xiàng)目給予了高度評(píng)價(jià)，

“人工智能發(fā)展到今天，真正用到?jīng)Q策智能的人工智能項(xiàng)目是很少見的。Embodied Intelligence做的機(jī)械臂的控制包括通過(guò)有監(jiān)督學(xué)習(xí)做無(wú)序抓取，是一項(xiàng)有挑戰(zhàn)的事業(yè)。不過(guò)，Embodied Intelligence的創(chuàng)業(yè)團(tuán)隊(duì)，包括 Peter Abbeel，是行業(yè)中做人工智能最頂級(jí)的研究者和創(chuàng)業(yè)者。且這件事是適合中美制造業(yè)國(guó)情的，應(yīng)用潛力巨大?！?/p>

陳曦向雷鋒網(wǎng)表示目前已有跟數(shù)個(gè)工廠和系統(tǒng)集成商合作，已經(jīng)確認(rèn)了一些具體場(chǎng)景，接觸下來(lái)是發(fā)現(xiàn)能夠應(yīng)用的地方很多，接下來(lái)希望挑一些有代表性的，能體現(xiàn)他們方案不一樣的地方。

“pick and place（抓?。┦潜容^大的一塊，但是比較簡(jiǎn)單的環(huán)境下面的pick and place就不是我們關(guān)注的了，因?yàn)槠渌鉀Q方案也能做到。我們主要關(guān)注一些傳統(tǒng)方法難以解決的問(wèn)題，例如抓取的原料是deformable （可變形的），像電線，數(shù)據(jù)線之類的wire bundle （導(dǎo)線束）。

除去抓取之外，我們也會(huì)看需要很多contact （物體間接觸）的場(chǎng)景，例如說(shuō)assembly（裝配）。這也是傳統(tǒng)來(lái)講很難解決的問(wèn)題。例如kitting（物料配送），從物料倉(cāng)庫(kù)撿取原件到一個(gè)kit（套件）里面，然后會(huì)被運(yùn)到總裝線上。這個(gè)kitting的步驟，如果是剛體的抓取是比較簡(jiǎn)單的。有很多現(xiàn)成的方案只需要一個(gè)CAD模型，然后會(huì)match（匹配）到3D攝像機(jī)里面的point cloud（點(diǎn)云數(shù)據(jù)），然后計(jì)算抓取點(diǎn)。但是像電線這樣會(huì)變形的東西，這樣的現(xiàn)有方法就不足夠了，因?yàn)殡娋€有太多種變形的可能，match 3d point cloud to fixed model（匹配3d點(diǎn)云到固定模型）的方法就很難完成了。

定性來(lái)講的話，是任何通過(guò)手動(dòng)編程難以完成的場(chǎng)景都會(huì)是很好的candidates（候選者），比較有代表性的有剛剛說(shuō)的deformable objects picking（可變形的物體抓?。??；蛘遖ssembly 類型的場(chǎng)景。但是我們沒有講太具體的場(chǎng)景，因?yàn)槭莡nder NDA（保密）。抽象來(lái)講的話，只要是人可以遙控機(jī)械臂完成的工作，我們都可以從示教中學(xué)習(xí)。也就是說(shuō)如果是需要硬件上的創(chuàng)新（就算由人來(lái)控制一個(gè)機(jī)械臂，也是不能完成的）的場(chǎng)景，就不是我們的關(guān)注范疇。

對(duì)于我們方案來(lái)講，不管是剛體的抓取還是柔性物體的抓取，學(xué)習(xí)方法是完全一樣的。唯一的不一樣可能是因?yàn)槲矬w是柔性的，有更多的variations（變化），而需要更多的訓(xùn)練數(shù)據(jù)?！?/p>

陳曦向雷鋒網(wǎng)表示，目前項(xiàng)目都在朝著預(yù)期進(jìn)展，“如果說(shuō)有什么意外的話，那應(yīng)該是應(yīng)用場(chǎng)景比想象中要多，這些是很多在學(xué)術(shù)界比較難接觸到的。”

接下來(lái)，陳曦希望在國(guó)內(nèi)也找一些早期應(yīng)用場(chǎng)景。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

8人收藏

相關(guān)文章