0
| 本文作者: 高秀松 | 2023-10-08 11:11 |
1950年,英國數(shù)學(xué)家艾倫·圖靈提出,當(dāng)一個(gè)測試者與一個(gè)計(jì)算機(jī)程序進(jìn)行對話,如果測試者無法區(qū)分程序的回答是由人類還是計(jì)算機(jī)生成的,那么該計(jì)算機(jī)程序被認(rèn)為具備與人類智能相當(dāng)?shù)哪芰Α?/p>
這便是AI領(lǐng)域赫赫有名的圖靈測試。在通用足式機(jī)器人領(lǐng)域,也有類似的測試:如果機(jī)器人能夠在任意情況下抓取任意的杯子,那么該機(jī)器人便具備了真正的運(yùn)動智能。
要通過這個(gè)測試非常困難,其中,機(jī)器人必須具備極強(qiáng)的感知能力,與環(huán)境進(jìn)行實(shí)時(shí)交互,不斷調(diào)整運(yùn)動控制,才有可能完成任務(wù),整個(gè)“感知到控制”的閉環(huán)是完全實(shí)時(shí)、動態(tài)、無法預(yù)先設(shè)定的。
通用足式機(jī)器人公司逐際動力創(chuàng)始人張巍直言,機(jī)器人要通過類似測試,“比自動駕駛還難”。原因在于,自動駕駛僅解決移動(mobility)的問題,即從A點(diǎn)到B點(diǎn),只需要位置關(guān)系的感知;足式機(jī)器人在此基礎(chǔ)上,還增加了接觸關(guān)系感知,比如地形感知、觸覺感知。機(jī)器人必須要通過這兩種感知做實(shí)時(shí)交互,實(shí)現(xiàn)移動,然后執(zhí)行操作(manipulation),才能被稱之為運(yùn)動智能。
現(xiàn)階段四足機(jī)器人的窘境在于,多數(shù)機(jī)器人處于「弱感知」階段,只有微弱的感知或者用了少量數(shù)據(jù),甚至是沒有感知,行動能力十分受限,效率不高且通過復(fù)雜場景的魯棒性較低。
張巍表示,機(jī)器人的核心是運(yùn)動,包括“腿”的移動和“手”的操作。而運(yùn)動智能化的核心來源于感知,這類感知指的是基于復(fù)雜場景的實(shí)時(shí)感知。機(jī)器人基于實(shí)時(shí)感知進(jìn)行決策、控制,完成整個(gè)運(yùn)動的閉環(huán)。
移動機(jī)器人按照移動結(jié)構(gòu)可大致分為兩類:以底盤為重心的輪式,與動物和人類相似的足式(四足、雙足)。
輪式機(jī)器人主要在結(jié)構(gòu)化道路上進(jìn)行運(yùn)動,典型的如酒店配送機(jī)器人。這類機(jī)器人技術(shù)已經(jīng)非常成熟,各大細(xì)分賽道已經(jīng)出現(xiàn)了許多明星公司。但輪式機(jī)器人的不足之處在于,地形的適應(yīng)能力較差,很難克服樓梯、凹凸不平的路面、野外等非結(jié)構(gòu)化的場景;并且,輪式機(jī)器人有一個(gè)比較重的底盤,來支撐機(jī)身保持穩(wěn)定,但這個(gè)底盤除了承重和搭載傳感器以外,能夠執(zhí)行的任務(wù)比較有限。
張巍告訴雷峰網(wǎng),如果機(jī)器人要像“人”一樣提供各種服務(wù),腿的結(jié)構(gòu)至關(guān)重要,因?yàn)椤坝型鹊臋C(jī)器人末端自由度更高”。而且機(jī)器人必須具備實(shí)時(shí)調(diào)整重心的能力,保持平衡,提高負(fù)載自重比,才具備復(fù)雜場景運(yùn)動的基本能力,這是輪式機(jī)器人沒辦法做到的。
基于此,張巍認(rèn)為,未來的機(jī)器人會往兩個(gè)方向發(fā)展。一個(gè)是「專用機(jī)器人」,即單一或者簡單場景下,機(jī)器人能夠根據(jù)人設(shè)定的流程代替人高效地執(zhí)行任務(wù),比如工廠的AGV/AMR、配送機(jī)器人等等。另一個(gè)則是「通(多)用機(jī)器人」,即機(jī)器人要滿足復(fù)雜地形、場景,執(zhí)行多種任務(wù)。
現(xiàn)階段,「專用機(jī)器人」已經(jīng)殺成一片紅海,不論是送餐、酒店,還是工廠,都已經(jīng)出現(xiàn)了許多機(jī)器人公司,從拼技術(shù)到卷價(jià)格,最終到渠道和服務(wù),已經(jīng)漸漸跑通商業(yè)閉環(huán)。而足式機(jī)器人才剛剛起步,即便四足、雙足機(jī)器人已不是新鮮事物,但市面上還沒有一款真正具備智能的足式機(jī)器人產(chǎn)品。
這一現(xiàn)象的本質(zhì)原因,在于當(dāng)前的足式機(jī)器人缺少「感知」。
“機(jī)器人本質(zhì)上是理解用戶指令,然后根據(jù)機(jī)器人收集的環(huán)境信息,讓電機(jī)轉(zhuǎn)起來,實(shí)現(xiàn)運(yùn)動控制。”張巍表示,要實(shí)現(xiàn)精準(zhǔn)高效的控制,這與環(huán)境感知密不可分。
舉個(gè)例子,足式機(jī)器人要上下樓梯,需要知道樓梯與自身的相對位置(實(shí)時(shí))、什么地形、踩哪兒、用多少力...在這些感知信息的基礎(chǔ)上,自主規(guī)劃路線、姿態(tài)等等,整個(gè)過程都是動態(tài)的,而非預(yù)先設(shè)定的運(yùn)動控制。
機(jī)器人實(shí)際上是通過感知來理解環(huán)境,再通過關(guān)節(jié)來產(chǎn)生作用力,實(shí)現(xiàn)控制運(yùn)動,所有的運(yùn)動都會有環(huán)境反饋。這里面既有位置關(guān)系的感知,也有接觸式感知,將二者完美融合起來的難度非常之大。并且,機(jī)器人與環(huán)境交互需求越大,根據(jù)實(shí)時(shí)感知環(huán)境來重新規(guī)劃動作(而不是按照事先預(yù)設(shè)流程)就越難,本身的控制和穩(wěn)定性問題會更難。
簡單而言,足式機(jī)器人必然要與環(huán)境產(chǎn)生感知交互,對應(yīng)的任務(wù)不是提前設(shè)置好的動作流程,直接進(jìn)行replay,而是根據(jù)現(xiàn)場情況進(jìn)行動態(tài)感知,并實(shí)時(shí)規(guī)劃動作。
張巍表示,機(jī)器人要“類人”,一定要跟環(huán)境交互,否則就沒有智能而只是一個(gè)機(jī)器,很難產(chǎn)生真正的價(jià)值,實(shí)現(xiàn)商業(yè)閉環(huán)。但是,從環(huán)境感知到運(yùn)動控制,這又是一件非常難的事情。
相當(dāng)一段時(shí)間里,足式機(jī)器人都默默無聞。直到來自MIT的 Patrick Wensing 和Benjamin Katz 分別開源了兩套影響深遠(yuǎn)的方案之后,越來越多的玩家躬身入局,越來越多的機(jī)器狗從實(shí)驗(yàn)室走向公眾視野,這個(gè)行業(yè)才漸漸被看到,接著有了資本助力,產(chǎn)品開始落地到具體場景。
雖然現(xiàn)在不少機(jī)器狗可以行走、爬樓梯甚至跳舞、翻跟斗,但從做一個(gè)demo展示到實(shí)際量產(chǎn)甚至落地到具體、復(fù)雜的業(yè)務(wù)場景,仍然會遇到兩個(gè)問題:效率低,以及穩(wěn)定性弱。
比如,機(jī)器狗在通過非結(jié)構(gòu)化地面時(shí),速度不高,而且缺乏穩(wěn)定性,容易“趴窩”。
張巍認(rèn)為,這一問題的本質(zhì),甚至是足式機(jī)器人還沒有很好的商業(yè)化落地的原因之一就在于,這些機(jī)器人缺少 Perceptive Locomotion(基于感知的運(yùn)動控制)。沒有感知,意味著機(jī)器人的運(yùn)動失去了“眼睛“,只能靠盲走,就像閉上眼睛的人直立行走,一定會走得歪歪斜斜,因?yàn)槿鄙俑兄獊韺?shí)時(shí)調(diào)整路線。
當(dāng)前,機(jī)器人的控制主要有兩種方法,一種是基于模型(Model)的控制,一種是基于學(xué)習(xí)(Learning)的控制。這兩種方法都是為了解決同一個(gè)「最優(yōu)控制」的問題,控制機(jī)器人的本體以最好的姿態(tài)高效、高質(zhì)量地完成動作,卻也有不同之處。
“Model是用解析模型做推演、設(shè)計(jì)控制;Learning是減少使用Model的顯性表達(dá),用仿真器來預(yù)測控制的效果。實(shí)際上,Learning本質(zhì)上也是基于模型的,仿真器都是基于模型設(shè)計(jì),但是更側(cè)重于強(qiáng)化學(xué)習(xí),需要機(jī)器人反復(fù)迭代、試錯(cuò)來改進(jìn)其控制器?!?/p>
打個(gè)比方,在高空飛行的飛機(jī),從A點(diǎn)到B點(diǎn),可以用一個(gè)固定的模型來解決;但如果機(jī)器在低空環(huán)境中飛行,會遇到建筑物、動植物、飛行物等復(fù)雜場景,機(jī)器人需要自己辨別障礙物是什么、怎么避開、怎么實(shí)現(xiàn)控制等,就需要Learning。
換句話說,復(fù)雜場景的感知交互,一定要用到Learning。機(jī)器人需要把各種傳感器(攝像頭、IMU、雷達(dá))的數(shù)據(jù)融合起來,先構(gòu)建一個(gè)高精度地形圖,然后定位、規(guī)劃行走,行走過程中不斷進(jìn)行感知,實(shí)時(shí)調(diào)整運(yùn)動控制。
現(xiàn)階段,機(jī)器人行業(yè)專注于基于感知的運(yùn)動控制的有Boston Dynamics、Anybotics、逐際動力LimX Dynamics等。Boston Dynamics 是業(yè)內(nèi)最領(lǐng)先的足式機(jī)器人公司,而逐際動力也正在進(jìn)行追趕,并走了一條差異化路線。
張巍告訴雷峰網(wǎng),逐際動力既有Model-based的控制,也有Learning-based的控制,這兩種方法有各自適合的任務(wù),通過模型數(shù)據(jù)混合的方式來做迭代。
在足式機(jī)器人的功能方面,逐際動力的路線是,首先完成腿部的基本功能,例如高效穩(wěn)定地上下樓梯、穿越復(fù)雜地形;然后攻克全身運(yùn)動的問題,即運(yùn)動+操作;最后將產(chǎn)品打磨足夠穩(wěn)定之后,針對細(xì)分場景進(jìn)行作業(yè)。
目前,逐際動力已經(jīng)可以實(shí)現(xiàn)帶感知的運(yùn)動控制,雖然成熟度上相對于Boston Dynamics還有待提高,但能力已經(jīng)接近。在陡峭的、真實(shí)的鏤空的工業(yè)場景下,逐際動力的機(jī)器人已經(jīng)可以實(shí)現(xiàn)穩(wěn)定的上下樓梯,以及克服草地石板路、斜坡等各類場景。
張巍本科畢業(yè)于中國科技大學(xué)自動化系, 2005年開始在美國普渡大學(xué)攻讀博士學(xué)位,研究基于模型的混雜動態(tài)系統(tǒng)的控制(Hybrid Dynamical System)。
博士后期間,張巍加入了加州伯克利分校的Hybrid System 實(shí)驗(yàn)室,導(dǎo)師為美國工程院院士Claire Tomlin和Shanker Sastry ,該實(shí)驗(yàn)室的著名人物還包括李澤湘、馬毅等。
2011年9月,張巍加入俄亥俄州立大學(xué),在電氣與計(jì)算機(jī)工程系先后擔(dān)任助理教授和長聘教授,繼續(xù)從事混雜動態(tài)系統(tǒng)控制的研究和教學(xué)。值得一提的是,MIT開源方案核心人物之一的Patrick Wensing,彼時(shí)也還在俄亥俄州立大學(xué)學(xué)習(xí)機(jī)器人與控制理論。直到2014年,Patrick Wensing才前往MIT仿生機(jī)器人實(shí)驗(yàn)室,負(fù)責(zé)足式機(jī)器人的控制算法。
張巍認(rèn)為,機(jī)器人的足在踩踏地面時(shí),是一個(gè)離散事件,并且速度和系統(tǒng)狀態(tài)會發(fā)生跳變,本質(zhì)上就是Hybrid Dynamical System。如何系統(tǒng)地控制這類運(yùn)動,是張巍一直在研究的課題。
2019年5月,張巍回國加入南方科技大學(xué),擔(dān)任機(jī)械與能源工程系教授,創(chuàng)辦了機(jī)器人控制與學(xué)習(xí)實(shí)驗(yàn)室(CLEAR LAB),并指導(dǎo)學(xué)生開始以強(qiáng)化學(xué)習(xí)的方式訓(xùn)練足式機(jī)器人,并于三年后下場創(chuàng)業(yè),成立了逐際動力。
張巍告訴雷峰網(wǎng),逐際動力是通用足式機(jī)器人公司,先要解決機(jī)器人的核心痛點(diǎn):全地形移動能力,即像人一樣移動,人能去的地方,機(jī)器人都能去。
鑒于當(dāng)前四足機(jī)器人欠缺復(fù)雜場景移動能力、效率低能耗高的等問題,逐際動力對機(jī)器人進(jìn)行了「系統(tǒng)升級」,包含兩方面,一是以感知為核心的運(yùn)動控制,二是將足式和輪式的優(yōu)點(diǎn)結(jié)合,形成輪足式。
“逐際動力要解決的是復(fù)雜場景下,四足機(jī)器人從A點(diǎn)穩(wěn)定快速地到B點(diǎn)。至于機(jī)器人的使用場景,是巡檢、配送,還是裝了機(jī)械臂做更復(fù)雜的工作,將結(jié)合客戶本身的業(yè)務(wù)去做落地?!?/p>
就像大疆的無人機(jī),在天空上飛來飛去,客戶可以用來拍照、撒農(nóng)藥,也可以用來巡檢、表演,而逐際動力打造的是“地面的大疆”——全地形移動底盤,并推出了首款四輪足產(chǎn)品W1。
W1 基于逐際動力「運(yùn)動智能Motion Intelligence」研發(fā),將腿式和輪式結(jié)構(gòu)相結(jié)合,具備實(shí)時(shí)地形感知與全地形移動能力,在效率上比單純的足式機(jī)器人更高效,適用場景也更加豐富、復(fù)雜,可以實(shí)現(xiàn)上下樓梯、斜坡、伏地穿越、過草地石板路等功能。
張巍表示,四足機(jī)器人已經(jīng)有足夠的技術(shù)積累,基礎(chǔ)研究與商業(yè)化的交集業(yè)已出現(xiàn)。現(xiàn)階段能落地并產(chǎn)生價(jià)值的,首先是封閉場景,例如危險(xiǎn)、復(fù)雜的工業(yè)環(huán)境,代替人的工作,這類環(huán)境比較可控,機(jī)器人能很快適應(yīng);開放場景存在的不可控因素太多,比如人為干擾、突發(fā)事件等,不太容易落地。
因此,逐際動力計(jì)劃首先將W1在固定路線上落地,如工業(yè)巡檢、物流配送、特種作業(yè)等場景,并持續(xù)打磨產(chǎn)品;在固定路線跑通后,再逐步嘗試開放場景,循序漸進(jìn),最終打通四足機(jī)器人的廣泛應(yīng)用。
從世界第一臺機(jī)器人誕生至今,機(jī)器人的發(fā)展已接近百年歷史。每一次技術(shù)革命都將給機(jī)器人的發(fā)展帶來強(qiáng)大的助推力:能源、信息、大數(shù)據(jù)、芯片、人工智能...都推動了機(jī)器人持續(xù)進(jìn)化,從簡單的模仿到惟妙惟肖,從實(shí)驗(yàn)室走向生產(chǎn)生活,從不能行動到穩(wěn)定行走,從輪式到四足再到雙足。
如今,機(jī)器人已經(jīng)以各種形態(tài)融入人們的生產(chǎn)生活,比如掃地機(jī)器人、工業(yè)機(jī)器人。雖然現(xiàn)階段的機(jī)器人還比較“笨”,距離通過“圖靈測試”還有很長一段距離。不過,技術(shù)本身是「涌現(xiàn)」出的,誰也無法預(yù)測這個(gè)「奇點(diǎn)」。
但無可爭議的是,正如人的進(jìn)化史一樣,機(jī)器人也在慢慢進(jìn)化,且終將迎來一個(gè)新的時(shí)代。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))長期關(guān)注機(jī)器人行業(yè)報(bào)道,即將推出《中國足式機(jī)器人簡史》。讀者若有一手信息、觀點(diǎn)、故事、項(xiàng)目,歡迎添加作者微信 nanshu0126 交流。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。