1
本文作者: 亞萌 | 2016-08-13 13:41 | 專題:CCF-GAIR | 全球人工智能與機(jī)器人峰會(huì) |
在8月13日的CCF-GAIR峰會(huì)“機(jī)器人與未來”專場(chǎng)中,南佛羅里達(dá)大學(xué)計(jì)算機(jī)系的孫宇教授,發(fā)表了關(guān)于靈巧機(jī)器人手的演講。
孫宇同時(shí)是斯坦福大學(xué)訪問教授、IEEE RAS機(jī)器臂抓取和操作技術(shù)委員會(huì)的始創(chuàng)主席,目前還擔(dān)任美國(guó)總統(tǒng)國(guó)情咨詢委員會(huì)機(jī)器人方向的顧問。
在演講中,孫宇教授表示類人機(jī)器手十分精密炫酷,但是普遍存在的特點(diǎn)是造價(jià)高昂,最便宜的3萬英鎊,最貴的要十幾萬美元。然而,如果機(jī)器手要應(yīng)用到普通人的生活中,實(shí)現(xiàn)工業(yè)化和商業(yè)化,那么就需要另辟蹊徑了。
孫宇教授接著介紹了一些并不像人手的“機(jī)器手”,外形各異,但是能真正應(yīng)用到各種人類生活的場(chǎng)景中。
孫宇教授以他的學(xué)術(shù)啟蒙電影《終結(jié)者》舉例,“終結(jié)者機(jī)器人”的核心部件包括兩個(gè):機(jī)器手和智能芯片。他所在的南佛羅里達(dá)大學(xué)RPAL實(shí)驗(yàn)室另一個(gè)主要的任務(wù)就是利用深度學(xué)習(xí)建造一個(gè)名為“面向?qū)ο蠊δ艿木W(wǎng)絡(luò)”(Functional Object-Oriented Network,F(xiàn)OON)的知識(shí)庫,這個(gè)知識(shí)庫主要是由計(jì)算機(jī)通過在線視頻學(xué)習(xí)得來。通過這個(gè)知識(shí)庫,機(jī)器手學(xué)習(xí)如何在面臨日常生活中不同的物品時(shí),判斷使用不同的功能。
最后,孫宇教授借特朗普名言做結(jié)尾,鼓勵(lì)大家“使抓取再度偉大”(Make Grasping Great Again)。
以下是孫宇教授演講實(shí)錄,為了給讀者奉上最快的新鮮資訊,以下講稿未經(jīng)精編,稍后雷鋒網(wǎng)將奉上更為精細(xì)的內(nèi)容。
孫宇:
很高興在這里跟大家討論一下機(jī)器人手的發(fā)展。在座的各位有誰能在國(guó)際象棋中贏得IBM深藍(lán)的計(jì)算?有誰能在圍棋中贏得谷歌的阿爾法狗?機(jī)器人在某些領(lǐng)域很大方面已經(jīng)超過了人,但是機(jī)器人還沒有一雙靈巧的手?,F(xiàn)在的問題是,我們?cè)趺茨芙o機(jī)器人一雙靈巧的手。
在19世紀(jì)初文藝復(fù)興時(shí)期,很多科學(xué)家和藝術(shù)家都開始研究人體自身,包括赫赫有名的達(dá)芬奇開始研究人體的解剖結(jié)構(gòu),達(dá)芬奇對(duì)人手也非常感興趣。達(dá)芬奇在研究人手之后,為人手的復(fù)雜功能所震驚。因?yàn)槲覀兊碾p手只占我們體重的百分之一,但是我們?nèi)梭w206個(gè)骨骼中,1/4的骨骼都在我們雙手里面。我們的雙手是非常復(fù)雜的機(jī)械結(jié)構(gòu),可能是人體當(dāng)中機(jī)械結(jié)構(gòu)最復(fù)雜的器官。
1993年的時(shí)候我看過一個(gè)電影《終結(jié)者2》,當(dāng)時(shí)對(duì)電影里面的機(jī)器人可以做的事情感到非常驚訝。在這個(gè)電影里面,機(jī)器手和智能芯片被認(rèn)為是最重要的兩個(gè)技術(shù),用來產(chǎn)生“終結(jié)者機(jī)器人”。在影片當(dāng)中,英雄角色和他的母親要?dú)У暨@兩項(xiàng)核心技術(shù)(機(jī)器手和智能芯片),同時(shí)要?dú)⒌粞邪l(fā)這兩項(xiàng)技術(shù)的教授。
看完這部電影,我并沒有對(duì)人類的未來充滿擔(dān)憂,反而腦子里覺得機(jī)器人非常的好,尤其對(duì)機(jī)器人手的靈巧性非常感興趣。那個(gè)時(shí)候決定了我的夢(mèng)想,我的夢(mèng)想是要像電影里面的教授一樣創(chuàng)造出第一個(gè)類似終結(jié)者的機(jī)器人。于是我?guī)е@個(gè)夢(mèng)想到美國(guó)學(xué)習(xí),進(jìn)入麻省理工大學(xué)實(shí)驗(yàn)室,在進(jìn)入實(shí)驗(yàn)室的第一天我的夢(mèng)想就毀滅了,為什么呢?因?yàn)槲铱吹搅诉@個(gè)名叫“Utah/MIT”的機(jī)器手,我的老師在很久以前就把我的夢(mèng)想實(shí)現(xiàn)了,比我看《終結(jié)者2》電影的時(shí)候還早10年。慢慢的我了解了一下它的歷史,它其實(shí)是由兩位天才制造出來的。
1983年以后,有各式各樣的非常多的類人機(jī)器手,這里我列了四項(xiàng),都是非常有代表性的,第一個(gè)是德國(guó)的DNR和哈工大合作的類人機(jī)器手,第二個(gè)是NASA的機(jī)器手,第三個(gè)是最新出來的,第四個(gè)是比較炫酷的。這些機(jī)器手都像瑞士手表一樣,設(shè)計(jì)地非常精致,機(jī)械部件都精準(zhǔn)咬合,每一個(gè)都有十幾個(gè)自由度,很多關(guān)節(jié)。同時(shí),他們還有一個(gè)共同的特點(diǎn),他們的造價(jià)非常昂貴,最貴的十幾萬美元。這些機(jī)器手在很多實(shí)驗(yàn)室當(dāng)中已經(jīng)演示了,他們可以做很多的事情,剛才大家也看到了一些機(jī)器人的錄像。他們可以做很多類似人手的事情,可以做飯,可以做家務(wù),日常生活無所不能。
其實(shí),所有這些你們從視頻中看到的機(jī)器手,大部分都是通過仔仔細(xì)細(xì)的編排和導(dǎo)演,通過很復(fù)雜的編程,花了很長(zhǎng)時(shí)間使這些演示能在特定的環(huán)境和運(yùn)動(dòng)當(dāng)中能實(shí)現(xiàn)。他們現(xiàn)在還遠(yuǎn)不能在復(fù)雜的環(huán)境當(dāng)中得以應(yīng)用。
剛才大家看到的機(jī)器手都非常的酷,但是在實(shí)際生活中很少見到這些機(jī)器手大規(guī)模的應(yīng)用,不僅是因?yàn)樵靸r(jià)昂貴,還是因?yàn)閼?yīng)用環(huán)境非常復(fù)雜。我們用工程的方法來解決工程的問題,我們有一些需要可以簡(jiǎn)化成工程的需要,通過這些需要可以找到工程的解決辦法。好萊塢都認(rèn)為我們的理念是可行的,他們有一個(gè)電影叫WALL-E,這個(gè)電影里面機(jī)器人的手跟人手沒有什么相像的,它有三個(gè)手指頭,跟人的手指頭非常的不同。WALL-E可以做很多事情,至少可以在動(dòng)畫片里面換燈泡。其實(shí),第一步復(fù)雜的編程并不是類人手的機(jī)器手,而是一個(gè)具有三個(gè)手指的機(jī)器手,以這個(gè)領(lǐng)域開始,因?yàn)楦鞣N各樣的工程原因,以及各種各樣的問題,我們可以看到有很多不同的工程解決方案。
其實(shí)在工業(yè)當(dāng)中我們已經(jīng)有很多的解決辦法,并沒有必要用機(jī)器手進(jìn)行抓取。這是上一年的機(jī)器人大賽冠軍并沒有用機(jī)器手,用真空吸取技術(shù)打敗了其他的團(tuán)隊(duì)。在這種環(huán)境下,美國(guó)的學(xué)者認(rèn)為“抓取物件”這個(gè)問題已經(jīng)解決了,但是“抓取工具并使用工具”,這個(gè)問題還沒有解決。所以,剩下的最大的問題就是機(jī)器智能,我們?nèi)鄙僦悄苄酒?/p>
隨著科技發(fā)展,好萊塢也跟進(jìn)了,在它的電影里面有一個(gè)智能中心,我們現(xiàn)在其實(shí)也有很多這樣的智能中心,包括谷歌的智能中心。在我們實(shí)驗(yàn)室,我們發(fā)明了一個(gè)“面向?qū)ο蠊δ艿木W(wǎng)絡(luò)”(Functional Object-Oriented Network,F(xiàn)OON),這是用各種物體和它的功能及所用到的操作結(jié)合起來建了一個(gè)網(wǎng)絡(luò)知識(shí)庫。我會(huì)演示一下這個(gè)網(wǎng)絡(luò)怎么建起來,這個(gè)網(wǎng)絡(luò)通過看在線的視頻,比如知道怎么做一樣?xùn)|西,把這個(gè)演示出來放到網(wǎng)上,通過處理,根據(jù)這個(gè)視頻得出這個(gè)事情是怎么做的,用了什么東西,用了什么動(dòng)作建了一個(gè)網(wǎng)絡(luò),相當(dāng)于一個(gè)知識(shí)網(wǎng)絡(luò)。這個(gè)知識(shí)網(wǎng)絡(luò)合起來之后會(huì)建立一個(gè)很大的知識(shí)庫,我們通過搜索知識(shí)庫就可以得到想要的信息。比如說今天你晚上想吃烤牛排,跟機(jī)器人說,機(jī)器人就到這個(gè)網(wǎng)絡(luò)里面查詢,查詢之后會(huì)得到一幅圖,這幅圖包括需要什么原料,需要什么步驟,整個(gè)畫面的基本元素包括物體和運(yùn)動(dòng)。
當(dāng)機(jī)器人做具體的任務(wù)的時(shí)候,很多的操作與其他的物體有實(shí)實(shí)在在的接觸,比如說擰螺絲的事情,跟螺絲刀接觸(在擰的過程中機(jī)器手受到不同的作用力)。同樣的物體,做不同的運(yùn)動(dòng),也需要有不同的力和部位,抓的時(shí)候需要用不同的手抓姿勢(shì)。
我們做的是根據(jù)不同的任務(wù)總結(jié)出不同的要求,根據(jù)這個(gè)要求得到最優(yōu)的手抓解決方案。比如說做錘子,軌跡是定下來了,需要做的是如何讓機(jī)器手運(yùn)動(dòng)地較少。這幅圖里,抓的時(shí)候機(jī)械手在運(yùn)動(dòng)期間要保證鼠標(biāo)不掉出去,另外一個(gè)擰燈泡的例子,在擰燈泡的時(shí)候,這個(gè)燈泡跟燈座實(shí)實(shí)在在的接觸(過程中產(chǎn)生不同作用力)。
我個(gè)人認(rèn)為,機(jī)器人智能和計(jì)算機(jī)智能是兩個(gè)不太一樣的概念。
因?yàn)闄C(jī)器人要和自然環(huán)境有實(shí)實(shí)在在的接觸,這是非常大的問題,是一般的計(jì)算機(jī)智能還沒有涉及到的問題。我們今年10月份將在韓國(guó)舉辦一個(gè)抓取的競(jìng)賽,這里有很多的獎(jiǎng)品,希望大家組隊(duì)去參加。這里面我們發(fā)表了9個(gè)任務(wù),都是要機(jī)器人實(shí)實(shí)在在與實(shí)體環(huán)境接觸的任務(wù)。最后借特朗普的這句“名言”--Make Grasping Great Again,希望大家更好地來關(guān)心機(jī)器人靈巧手抓取。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章