0
本文作者: 高秀松 | 2023-10-08 11:11 |
1950年,英國數(shù)學家艾倫·圖靈提出,當一個測試者與一個計算機程序進行對話,如果測試者無法區(qū)分程序的回答是由人類還是計算機生成的,那么該計算機程序被認為具備與人類智能相當?shù)哪芰Α?/p>
這便是AI領(lǐng)域赫赫有名的圖靈測試。在通用足式機器人領(lǐng)域,也有類似的測試:如果機器人能夠在任意情況下抓取任意的杯子,那么該機器人便具備了真正的運動智能。
要通過這個測試非常困難,其中,機器人必須具備極強的感知能力,與環(huán)境進行實時交互,不斷調(diào)整運動控制,才有可能完成任務,整個“感知到控制”的閉環(huán)是完全實時、動態(tài)、無法預先設(shè)定的。
通用足式機器人公司逐際動力創(chuàng)始人張巍直言,機器人要通過類似測試,“比自動駕駛還難”。原因在于,自動駕駛僅解決移動(mobility)的問題,即從A點到B點,只需要位置關(guān)系的感知;足式機器人在此基礎(chǔ)上,還增加了接觸關(guān)系感知,比如地形感知、觸覺感知。機器人必須要通過這兩種感知做實時交互,實現(xiàn)移動,然后執(zhí)行操作(manipulation),才能被稱之為運動智能。
現(xiàn)階段四足機器人的窘境在于,多數(shù)機器人處于「弱感知」階段,只有微弱的感知或者用了少量數(shù)據(jù),甚至是沒有感知,行動能力十分受限,效率不高且通過復雜場景的魯棒性較低。
張巍表示,機器人的核心是運動,包括“腿”的移動和“手”的操作。而運動智能化的核心來源于感知,這類感知指的是基于復雜場景的實時感知。機器人基于實時感知進行決策、控制,完成整個運動的閉環(huán)。
移動機器人按照移動結(jié)構(gòu)可大致分為兩類:以底盤為重心的輪式,與動物和人類相似的足式(四足、雙足)。
輪式機器人主要在結(jié)構(gòu)化道路上進行運動,典型的如酒店配送機器人。這類機器人技術(shù)已經(jīng)非常成熟,各大細分賽道已經(jīng)出現(xiàn)了許多明星公司。但輪式機器人的不足之處在于,地形的適應能力較差,很難克服樓梯、凹凸不平的路面、野外等非結(jié)構(gòu)化的場景;并且,輪式機器人有一個比較重的底盤,來支撐機身保持穩(wěn)定,但這個底盤除了承重和搭載傳感器以外,能夠執(zhí)行的任務比較有限。
張巍告訴雷峰網(wǎng),如果機器人要像“人”一樣提供各種服務,腿的結(jié)構(gòu)至關(guān)重要,因為“有腿的機器人末端自由度更高”。而且機器人必須具備實時調(diào)整重心的能力,保持平衡,提高負載自重比,才具備復雜場景運動的基本能力,這是輪式機器人沒辦法做到的。
基于此,張巍認為,未來的機器人會往兩個方向發(fā)展。一個是「專用機器人」,即單一或者簡單場景下,機器人能夠根據(jù)人設(shè)定的流程代替人高效地執(zhí)行任務,比如工廠的AGV/AMR、配送機器人等等。另一個則是「通(多)用機器人」,即機器人要滿足復雜地形、場景,執(zhí)行多種任務。
現(xiàn)階段,「專用機器人」已經(jīng)殺成一片紅海,不論是送餐、酒店,還是工廠,都已經(jīng)出現(xiàn)了許多機器人公司,從拼技術(shù)到卷價格,最終到渠道和服務,已經(jīng)漸漸跑通商業(yè)閉環(huán)。而足式機器人才剛剛起步,即便四足、雙足機器人已不是新鮮事物,但市面上還沒有一款真正具備智能的足式機器人產(chǎn)品。
這一現(xiàn)象的本質(zhì)原因,在于當前的足式機器人缺少「感知」。
“機器人本質(zhì)上是理解用戶指令,然后根據(jù)機器人收集的環(huán)境信息,讓電機轉(zhuǎn)起來,實現(xiàn)運動控制?!睆埼”硎荆獙崿F(xiàn)精準高效的控制,這與環(huán)境感知密不可分。
舉個例子,足式機器人要上下樓梯,需要知道樓梯與自身的相對位置(實時)、什么地形、踩哪兒、用多少力...在這些感知信息的基礎(chǔ)上,自主規(guī)劃路線、姿態(tài)等等,整個過程都是動態(tài)的,而非預先設(shè)定的運動控制。
機器人實際上是通過感知來理解環(huán)境,再通過關(guān)節(jié)來產(chǎn)生作用力,實現(xiàn)控制運動,所有的運動都會有環(huán)境反饋。這里面既有位置關(guān)系的感知,也有接觸式感知,將二者完美融合起來的難度非常之大。并且,機器人與環(huán)境交互需求越大,根據(jù)實時感知環(huán)境來重新規(guī)劃動作(而不是按照事先預設(shè)流程)就越難,本身的控制和穩(wěn)定性問題會更難。
簡單而言,足式機器人必然要與環(huán)境產(chǎn)生感知交互,對應的任務不是提前設(shè)置好的動作流程,直接進行replay,而是根據(jù)現(xiàn)場情況進行動態(tài)感知,并實時規(guī)劃動作。
張巍表示,機器人要“類人”,一定要跟環(huán)境交互,否則就沒有智能而只是一個機器,很難產(chǎn)生真正的價值,實現(xiàn)商業(yè)閉環(huán)。但是,從環(huán)境感知到運動控制,這又是一件非常難的事情。
相當一段時間里,足式機器人都默默無聞。直到來自MIT的 Patrick Wensing 和Benjamin Katz 分別開源了兩套影響深遠的方案之后,越來越多的玩家躬身入局,越來越多的機器狗從實驗室走向公眾視野,這個行業(yè)才漸漸被看到,接著有了資本助力,產(chǎn)品開始落地到具體場景。
雖然現(xiàn)在不少機器狗可以行走、爬樓梯甚至跳舞、翻跟斗,但從做一個demo展示到實際量產(chǎn)甚至落地到具體、復雜的業(yè)務場景,仍然會遇到兩個問題:效率低,以及穩(wěn)定性弱。
比如,機器狗在通過非結(jié)構(gòu)化地面時,速度不高,而且缺乏穩(wěn)定性,容易“趴窩”。
張巍認為,這一問題的本質(zhì),甚至是足式機器人還沒有很好的商業(yè)化落地的原因之一就在于,這些機器人缺少 Perceptive Locomotion(基于感知的運動控制)。沒有感知,意味著機器人的運動失去了“眼睛“,只能靠盲走,就像閉上眼睛的人直立行走,一定會走得歪歪斜斜,因為缺少感知來實時調(diào)整路線。
當前,機器人的控制主要有兩種方法,一種是基于模型(Model)的控制,一種是基于學習(Learning)的控制。這兩種方法都是為了解決同一個「最優(yōu)控制」的問題,控制機器人的本體以最好的姿態(tài)高效、高質(zhì)量地完成動作,卻也有不同之處。
“Model是用解析模型做推演、設(shè)計控制;Learning是減少使用Model的顯性表達,用仿真器來預測控制的效果。實際上,Learning本質(zhì)上也是基于模型的,仿真器都是基于模型設(shè)計,但是更側(cè)重于強化學習,需要機器人反復迭代、試錯來改進其控制器?!?/p>
打個比方,在高空飛行的飛機,從A點到B點,可以用一個固定的模型來解決;但如果機器在低空環(huán)境中飛行,會遇到建筑物、動植物、飛行物等復雜場景,機器人需要自己辨別障礙物是什么、怎么避開、怎么實現(xiàn)控制等,就需要Learning。
換句話說,復雜場景的感知交互,一定要用到Learning。機器人需要把各種傳感器(攝像頭、IMU、雷達)的數(shù)據(jù)融合起來,先構(gòu)建一個高精度地形圖,然后定位、規(guī)劃行走,行走過程中不斷進行感知,實時調(diào)整運動控制。
現(xiàn)階段,機器人行業(yè)專注于基于感知的運動控制的有Boston Dynamics、Anybotics、逐際動力LimX Dynamics等。Boston Dynamics 是業(yè)內(nèi)最領(lǐng)先的足式機器人公司,而逐際動力也正在進行追趕,并走了一條差異化路線。
張巍告訴雷峰網(wǎng),逐際動力既有Model-based的控制,也有Learning-based的控制,這兩種方法有各自適合的任務,通過模型數(shù)據(jù)混合的方式來做迭代。
在足式機器人的功能方面,逐際動力的路線是,首先完成腿部的基本功能,例如高效穩(wěn)定地上下樓梯、穿越復雜地形;然后攻克全身運動的問題,即運動+操作;最后將產(chǎn)品打磨足夠穩(wěn)定之后,針對細分場景進行作業(yè)。
目前,逐際動力已經(jīng)可以實現(xiàn)帶感知的運動控制,雖然成熟度上相對于Boston Dynamics還有待提高,但能力已經(jīng)接近。在陡峭的、真實的鏤空的工業(yè)場景下,逐際動力的機器人已經(jīng)可以實現(xiàn)穩(wěn)定的上下樓梯,以及克服草地石板路、斜坡等各類場景。
張巍本科畢業(yè)于中國科技大學自動化系, 2005年開始在美國普渡大學攻讀博士學位,研究基于模型的混雜動態(tài)系統(tǒng)的控制(Hybrid Dynamical System)。
博士后期間,張巍加入了加州伯克利分校的Hybrid System 實驗室,導師為美國工程院院士Claire Tomlin和Shanker Sastry ,該實驗室的著名人物還包括李澤湘、馬毅等。
2011年9月,張巍加入俄亥俄州立大學,在電氣與計算機工程系先后擔任助理教授和長聘教授,繼續(xù)從事混雜動態(tài)系統(tǒng)控制的研究和教學。值得一提的是,MIT開源方案核心人物之一的Patrick Wensing,彼時也還在俄亥俄州立大學學習機器人與控制理論。直到2014年,Patrick Wensing才前往MIT仿生機器人實驗室,負責足式機器人的控制算法。
張巍認為,機器人的足在踩踏地面時,是一個離散事件,并且速度和系統(tǒng)狀態(tài)會發(fā)生跳變,本質(zhì)上就是Hybrid Dynamical System。如何系統(tǒng)地控制這類運動,是張巍一直在研究的課題。
2019年5月,張巍回國加入南方科技大學,擔任機械與能源工程系教授,創(chuàng)辦了機器人控制與學習實驗室(CLEAR LAB),并指導學生開始以強化學習的方式訓練足式機器人,并于三年后下場創(chuàng)業(yè),成立了逐際動力。
張巍告訴雷峰網(wǎng),逐際動力是通用足式機器人公司,先要解決機器人的核心痛點:全地形移動能力,即像人一樣移動,人能去的地方,機器人都能去。
鑒于當前四足機器人欠缺復雜場景移動能力、效率低能耗高的等問題,逐際動力對機器人進行了「系統(tǒng)升級」,包含兩方面,一是以感知為核心的運動控制,二是將足式和輪式的優(yōu)點結(jié)合,形成輪足式。
“逐際動力要解決的是復雜場景下,四足機器人從A點穩(wěn)定快速地到B點。至于機器人的使用場景,是巡檢、配送,還是裝了機械臂做更復雜的工作,將結(jié)合客戶本身的業(yè)務去做落地?!?/p>
就像大疆的無人機,在天空上飛來飛去,客戶可以用來拍照、撒農(nóng)藥,也可以用來巡檢、表演,而逐際動力打造的是“地面的大疆”——全地形移動底盤,并推出了首款四輪足產(chǎn)品W1。
W1 基于逐際動力「運動智能Motion Intelligence」研發(fā),將腿式和輪式結(jié)構(gòu)相結(jié)合,具備實時地形感知與全地形移動能力,在效率上比單純的足式機器人更高效,適用場景也更加豐富、復雜,可以實現(xiàn)上下樓梯、斜坡、伏地穿越、過草地石板路等功能。
張巍表示,四足機器人已經(jīng)有足夠的技術(shù)積累,基礎(chǔ)研究與商業(yè)化的交集業(yè)已出現(xiàn)。現(xiàn)階段能落地并產(chǎn)生價值的,首先是封閉場景,例如危險、復雜的工業(yè)環(huán)境,代替人的工作,這類環(huán)境比較可控,機器人能很快適應;開放場景存在的不可控因素太多,比如人為干擾、突發(fā)事件等,不太容易落地。
因此,逐際動力計劃首先將W1在固定路線上落地,如工業(yè)巡檢、物流配送、特種作業(yè)等場景,并持續(xù)打磨產(chǎn)品;在固定路線跑通后,再逐步嘗試開放場景,循序漸進,最終打通四足機器人的廣泛應用。
從世界第一臺機器人誕生至今,機器人的發(fā)展已接近百年歷史。每一次技術(shù)革命都將給機器人的發(fā)展帶來強大的助推力:能源、信息、大數(shù)據(jù)、芯片、人工智能...都推動了機器人持續(xù)進化,從簡單的模仿到惟妙惟肖,從實驗室走向生產(chǎn)生活,從不能行動到穩(wěn)定行走,從輪式到四足再到雙足。
如今,機器人已經(jīng)以各種形態(tài)融入人們的生產(chǎn)生活,比如掃地機器人、工業(yè)機器人。雖然現(xiàn)階段的機器人還比較“笨”,距離通過“圖靈測試”還有很長一段距離。不過,技術(shù)本身是「涌現(xiàn)」出的,誰也無法預測這個「奇點」。
但無可爭議的是,正如人的進化史一樣,機器人也在慢慢進化,且終將迎來一個新的時代。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))長期關(guān)注機器人行業(yè)報道,即將推出《中國足式機器人簡史》。讀者若有一手信息、觀點、故事、項目,歡迎添加作者微信 nanshu0126 交流。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。