四足機(jī)器人「技術(shù)躍變」：如何成為「地面的大疆」？

本文作者：高秀松

2023-10-08 11:11

導(dǎo)語：四足機(jī)器人已經(jīng)有足夠的技術(shù)積累，基礎(chǔ)研究與商業(yè)化的交集業(yè)已出現(xiàn)。

1950年，英國數(shù)學(xué)家艾倫·圖靈提出，當(dāng)一個(gè)測試者與一個(gè)計(jì)算機(jī)程序進(jìn)行對話，如果測試者無法區(qū)分程序的回答是由人類還是計(jì)算機(jī)生成的，那么該計(jì)算機(jī)程序被認(rèn)為具備與人類智能相當(dāng)?shù)哪芰Α?/p>

這便是AI領(lǐng)域赫赫有名的圖靈測試。在通用足式機(jī)器人領(lǐng)域，也有類似的測試：如果機(jī)器人能夠在任意情況下抓取任意的杯子，那么該機(jī)器人便具備了真正的運(yùn)動智能。

要通過這個(gè)測試非常困難，其中，機(jī)器人必須具備極強(qiáng)的感知能力，與環(huán)境進(jìn)行實(shí)時(shí)交互，不斷調(diào)整運(yùn)動控制，才有可能完成任務(wù)，整個(gè)“感知到控制”的閉環(huán)是完全實(shí)時(shí)、動態(tài)、無法預(yù)先設(shè)定的。

通用足式機(jī)器人公司逐際動力創(chuàng)始人張巍直言，機(jī)器人要通過類似測試，“比自動駕駛還難”。原因在于，自動駕駛僅解決移動（mobility）的問題，即從A點(diǎn)到B點(diǎn)，只需要位置關(guān)系的感知；足式機(jī)器人在此基礎(chǔ)上，還增加了接觸關(guān)系感知，比如地形感知、觸覺感知。機(jī)器人必須要通過這兩種感知做實(shí)時(shí)交互，實(shí)現(xiàn)移動，然后執(zhí)行操作（manipulation），才能被稱之為運(yùn)動智能。

現(xiàn)階段四足機(jī)器人的窘境在于，多數(shù)機(jī)器人處于「弱感知」階段，只有微弱的感知或者用了少量數(shù)據(jù)，甚至是沒有感知，行動能力十分受限，效率不高且通過復(fù)雜場景的魯棒性較低。

張巍表示，機(jī)器人的核心是運(yùn)動，包括“腿”的移動和“手”的操作。而運(yùn)動智能化的核心來源于感知，這類感知指的是基于復(fù)雜場景的實(shí)時(shí)感知。機(jī)器人基于實(shí)時(shí)感知進(jìn)行決策、控制，完成整個(gè)運(yùn)動的閉環(huán)。

技術(shù)「躍變」：從被動輸入數(shù)據(jù)到主動感知交互

移動機(jī)器人按照移動結(jié)構(gòu)可大致分為兩類：以底盤為重心的輪式，與動物和人類相似的足式（四足、雙足）。

輪式機(jī)器人主要在結(jié)構(gòu)化道路上進(jìn)行運(yùn)動，典型的如酒店配送機(jī)器人。這類機(jī)器人技術(shù)已經(jīng)非常成熟，各大細(xì)分賽道已經(jīng)出現(xiàn)了許多明星公司。但輪式機(jī)器人的不足之處在于，地形的適應(yīng)能力較差，很難克服樓梯、凹凸不平的路面、野外等非結(jié)構(gòu)化的場景；并且，輪式機(jī)器人有一個(gè)比較重的底盤，來支撐機(jī)身保持穩(wěn)定，但這個(gè)底盤除了承重和搭載傳感器以外，能夠執(zhí)行的任務(wù)比較有限。

張巍告訴雷峰網(wǎng)，如果機(jī)器人要像“人”一樣提供各種服務(wù)，腿的結(jié)構(gòu)至關(guān)重要，因?yàn)椤坝型鹊臋C(jī)器人末端自由度更高”。而且機(jī)器人必須具備實(shí)時(shí)調(diào)整重心的能力，保持平衡，提高負(fù)載自重比，才具備復(fù)雜場景運(yùn)動的基本能力，這是輪式機(jī)器人沒辦法做到的。

基于此，張巍認(rèn)為，未來的機(jī)器人會往兩個(gè)方向發(fā)展。一個(gè)是「專用機(jī)器人」，即單一或者簡單場景下，機(jī)器人能夠根據(jù)人設(shè)定的流程代替人高效地執(zhí)行任務(wù)，比如工廠的AGV/AMR、配送機(jī)器人等等。另一個(gè)則是「通（多）用機(jī)器人」，即機(jī)器人要滿足復(fù)雜地形、場景，執(zhí)行多種任務(wù)。

現(xiàn)階段，「專用機(jī)器人」已經(jīng)殺成一片紅海，不論是送餐、酒店，還是工廠，都已經(jīng)出現(xiàn)了許多機(jī)器人公司，從拼技術(shù)到卷價(jià)格，最終到渠道和服務(wù)，已經(jīng)漸漸跑通商業(yè)閉環(huán)。而足式機(jī)器人才剛剛起步，即便四足、雙足機(jī)器人已不是新鮮事物，但市面上還沒有一款真正具備智能的足式機(jī)器人產(chǎn)品。

這一現(xiàn)象的本質(zhì)原因，在于當(dāng)前的足式機(jī)器人缺少「感知」。

“機(jī)器人本質(zhì)上是理解用戶指令，然后根據(jù)機(jī)器人收集的環(huán)境信息，讓電機(jī)轉(zhuǎn)起來，實(shí)現(xiàn)運(yùn)動控制。”張巍表示，要實(shí)現(xiàn)精準(zhǔn)高效的控制，這與環(huán)境感知密不可分。

舉個(gè)例子，足式機(jī)器人要上下樓梯，需要知道樓梯與自身的相對位置（實(shí)時(shí)）、什么地形、踩哪兒、用多少力...在這些感知信息的基礎(chǔ)上，自主規(guī)劃路線、姿態(tài)等等，整個(gè)過程都是動態(tài)的，而非預(yù)先設(shè)定的運(yùn)動控制。

機(jī)器人實(shí)際上是通過感知來理解環(huán)境，再通過關(guān)節(jié)來產(chǎn)生作用力，實(shí)現(xiàn)控制運(yùn)動，所有的運(yùn)動都會有環(huán)境反饋。這里面既有位置關(guān)系的感知，也有接觸式感知，將二者完美融合起來的難度非常之大。并且，機(jī)器人與環(huán)境交互需求越大，根據(jù)實(shí)時(shí)感知環(huán)境來重新規(guī)劃動作（而不是按照事先預(yù)設(shè)流程）就越難，本身的控制和穩(wěn)定性問題會更難。

簡單而言，足式機(jī)器人必然要與環(huán)境產(chǎn)生感知交互，對應(yīng)的任務(wù)不是提前設(shè)置好的動作流程，直接進(jìn)行replay，而是根據(jù)現(xiàn)場情況進(jìn)行動態(tài)感知，并實(shí)時(shí)規(guī)劃動作。

張巍表示，機(jī)器人要“類人”，一定要跟環(huán)境交互，否則就沒有智能而只是一個(gè)機(jī)器，很難產(chǎn)生真正的價(jià)值，實(shí)現(xiàn)商業(yè)閉環(huán)。但是，從環(huán)境感知到運(yùn)動控制，這又是一件非常難的事情。

當(dāng)前四足機(jī)器人的兩個(gè)瓶頸：效率、穩(wěn)定性

相當(dāng)一段時(shí)間里，足式機(jī)器人都默默無聞。直到來自MIT的 Patrick Wensing 和Benjamin Katz 分別開源了兩套影響深遠(yuǎn)的方案之后，越來越多的玩家躬身入局，越來越多的機(jī)器狗從實(shí)驗(yàn)室走向公眾視野，這個(gè)行業(yè)才漸漸被看到，接著有了資本助力，產(chǎn)品開始落地到具體場景。

雖然現(xiàn)在不少機(jī)器狗可以行走、爬樓梯甚至跳舞、翻跟斗，但從做一個(gè)demo展示到實(shí)際量產(chǎn)甚至落地到具體、復(fù)雜的業(yè)務(wù)場景，仍然會遇到兩個(gè)問題：效率低，以及穩(wěn)定性弱。

比如，機(jī)器狗在通過非結(jié)構(gòu)化地面時(shí)，速度不高，而且缺乏穩(wěn)定性，容易“趴窩”。

張巍認(rèn)為，這一問題的本質(zhì)，甚至是足式機(jī)器人還沒有很好的商業(yè)化落地的原因之一就在于，這些機(jī)器人缺少 Perceptive Locomotion（基于感知的運(yùn)動控制）。沒有感知，意味著機(jī)器人的運(yùn)動失去了“眼睛“，只能靠盲走，就像閉上眼睛的人直立行走，一定會走得歪歪斜斜，因?yàn)槿鄙俑兄獊韺?shí)時(shí)調(diào)整路線。

當(dāng)前，機(jī)器人的控制主要有兩種方法，一種是基于模型（Model）的控制，一種是基于學(xué)習(xí)（Learning）的控制。這兩種方法都是為了解決同一個(gè)「最優(yōu)控制」的問題，控制機(jī)器人的本體以最好的姿態(tài)高效、高質(zhì)量地完成動作，卻也有不同之處。

“Model是用解析模型做推演、設(shè)計(jì)控制；Learning是減少使用Model的顯性表達(dá)，用仿真器來預(yù)測控制的效果。實(shí)際上，Learning本質(zhì)上也是基于模型的，仿真器都是基于模型設(shè)計(jì)，但是更側(cè)重于強(qiáng)化學(xué)習(xí)，需要機(jī)器人反復(fù)迭代、試錯(cuò)來改進(jìn)其控制器?！?/p>

打個(gè)比方，在高空飛行的飛機(jī)，從A點(diǎn)到B點(diǎn)，可以用一個(gè)固定的模型來解決；但如果機(jī)器在低空環(huán)境中飛行，會遇到建筑物、動植物、飛行物等復(fù)雜場景，機(jī)器人需要自己辨別障礙物是什么、怎么避開、怎么實(shí)現(xiàn)控制等，就需要Learning。

換句話說，復(fù)雜場景的感知交互，一定要用到Learning。機(jī)器人需要把各種傳感器（攝像頭、IMU、雷達(dá)）的數(shù)據(jù)融合起來，先構(gòu)建一個(gè)高精度地形圖，然后定位、規(guī)劃行走，行走過程中不斷進(jìn)行感知，實(shí)時(shí)調(diào)整運(yùn)動控制。

現(xiàn)階段，機(jī)器人行業(yè)專注于基于感知的運(yùn)動控制的有Boston Dynamics、Anybotics、逐際動力LimX Dynamics等。Boston Dynamics 是業(yè)內(nèi)最領(lǐng)先的足式機(jī)器人公司，而逐際動力也正在進(jìn)行追趕，并走了一條差異化路線。

張巍告訴雷峰網(wǎng)，逐際動力既有Model-based的控制，也有Learning-based的控制，這兩種方法有各自適合的任務(wù)，通過模型數(shù)據(jù)混合的方式來做迭代。

在足式機(jī)器人的功能方面，逐際動力的路線是，首先完成腿部的基本功能，例如高效穩(wěn)定地上下樓梯、穿越復(fù)雜地形；然后攻克全身運(yùn)動的問題，即運(yùn)動+操作；最后將產(chǎn)品打磨足夠穩(wěn)定之后，針對細(xì)分場景進(jìn)行作業(yè)。

目前，逐際動力已經(jīng)可以實(shí)現(xiàn)帶感知的運(yùn)動控制，雖然成熟度上相對于Boston Dynamics還有待提高，但能力已經(jīng)接近。在陡峭的、真實(shí)的鏤空的工業(yè)場景下，逐際動力的機(jī)器人已經(jīng)可以實(shí)現(xiàn)穩(wěn)定的上下樓梯，以及克服草地石板路、斜坡等各類場景。

逐際動力：先打造全地形移動底盤，做“地面的大疆”

張巍本科畢業(yè)于中國科技大學(xué)自動化系， 2005年開始在美國普渡大學(xué)攻讀博士學(xué)位，研究基于模型的混雜動態(tài)系統(tǒng)的控制（Hybrid Dynamical System）。

博士后期間，張巍加入了加州伯克利分校的Hybrid System 實(shí)驗(yàn)室，導(dǎo)師為美國工程院院士Claire Tomlin和Shanker Sastry ，該實(shí)驗(yàn)室的著名人物還包括李澤湘、馬毅等。

2011年9月，張巍加入俄亥俄州立大學(xué)，在電氣與計(jì)算機(jī)工程系先后擔(dān)任助理教授和長聘教授，繼續(xù)從事混雜動態(tài)系統(tǒng)控制的研究和教學(xué)。值得一提的是，MIT開源方案核心人物之一的Patrick Wensing，彼時(shí)也還在俄亥俄州立大學(xué)學(xué)習(xí)機(jī)器人與控制理論。直到2014年，Patrick Wensing才前往MIT仿生機(jī)器人實(shí)驗(yàn)室，負(fù)責(zé)足式機(jī)器人的控制算法。

張巍認(rèn)為，機(jī)器人的足在踩踏地面時(shí)，是一個(gè)離散事件，并且速度和系統(tǒng)狀態(tài)會發(fā)生跳變，本質(zhì)上就是Hybrid Dynamical System。如何系統(tǒng)地控制這類運(yùn)動，是張巍一直在研究的課題。

2019年5月，張巍回國加入南方科技大學(xué)，擔(dān)任機(jī)械與能源工程系教授，創(chuàng)辦了機(jī)器人控制與學(xué)習(xí)實(shí)驗(yàn)室（CLEAR LAB），并指導(dǎo)學(xué)生開始以強(qiáng)化學(xué)習(xí)的方式訓(xùn)練足式機(jī)器人，并于三年后下場創(chuàng)業(yè)，成立了逐際動力。

張巍告訴雷峰網(wǎng)，逐際動力是通用足式機(jī)器人公司，先要解決機(jī)器人的核心痛點(diǎn)：全地形移動能力，即像人一樣移動，人能去的地方，機(jī)器人都能去。

鑒于當(dāng)前四足機(jī)器人欠缺復(fù)雜場景移動能力、效率低能耗高的等問題，逐際動力對機(jī)器人進(jìn)行了「系統(tǒng)升級」，包含兩方面，一是以感知為核心的運(yùn)動控制，二是將足式和輪式的優(yōu)點(diǎn)結(jié)合，形成輪足式。

“逐際動力要解決的是復(fù)雜場景下，四足機(jī)器人從A點(diǎn)穩(wěn)定快速地到B點(diǎn)。至于機(jī)器人的使用場景，是巡檢、配送，還是裝了機(jī)械臂做更復(fù)雜的工作，將結(jié)合客戶本身的業(yè)務(wù)去做落地?！?/p>

就像大疆的無人機(jī)，在天空上飛來飛去，客戶可以用來拍照、撒農(nóng)藥，也可以用來巡檢、表演，而逐際動力打造的是“地面的大疆”——全地形移動底盤，并推出了首款四輪足產(chǎn)品W1。

W1 基于逐際動力「運(yùn)動智能Motion Intelligence」研發(fā)，將腿式和輪式結(jié)構(gòu)相結(jié)合，具備實(shí)時(shí)地形感知與全地形移動能力，在效率上比單純的足式機(jī)器人更高效，適用場景也更加豐富、復(fù)雜，可以實(shí)現(xiàn)上下樓梯、斜坡、伏地穿越、過草地石板路等功能。

張巍表示，四足機(jī)器人已經(jīng)有足夠的技術(shù)積累，基礎(chǔ)研究與商業(yè)化的交集業(yè)已出現(xiàn)。現(xiàn)階段能落地并產(chǎn)生價(jià)值的，首先是封閉場景，例如危險(xiǎn)、復(fù)雜的工業(yè)環(huán)境，代替人的工作，這類環(huán)境比較可控，機(jī)器人能很快適應(yīng)；開放場景存在的不可控因素太多，比如人為干擾、突發(fā)事件等，不太容易落地。

因此，逐際動力計(jì)劃首先將W1在固定路線上落地，如工業(yè)巡檢、物流配送、特種作業(yè)等場景，并持續(xù)打磨產(chǎn)品；在固定路線跑通后，再逐步嘗試開放場景，循序漸進(jìn)，最終打通四足機(jī)器人的廣泛應(yīng)用。

機(jī)器人，大時(shí)代

從世界第一臺機(jī)器人誕生至今，機(jī)器人的發(fā)展已接近百年歷史。每一次技術(shù)革命都將給機(jī)器人的發(fā)展帶來強(qiáng)大的助推力：能源、信息、大數(shù)據(jù)、芯片、人工智能...都推動了機(jī)器人持續(xù)進(jìn)化，從簡單的模仿到惟妙惟肖，從實(shí)驗(yàn)室走向生產(chǎn)生活，從不能行動到穩(wěn)定行走，從輪式到四足再到雙足。

如今，機(jī)器人已經(jīng)以各種形態(tài)融入人們的生產(chǎn)生活，比如掃地機(jī)器人、工業(yè)機(jī)器人。雖然現(xiàn)階段的機(jī)器人還比較“笨”，距離通過“圖靈測試”還有很長一段距離。不過，技術(shù)本身是「涌現(xiàn)」出的，誰也無法預(yù)測這個(gè)「奇點(diǎn)」。

但無可爭議的是，正如人的進(jìn)化史一樣，機(jī)器人也在慢慢進(jìn)化，且終將迎來一個(gè)新的時(shí)代。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))長期關(guān)注機(jī)器人行業(yè)報(bào)道，即將推出《中國足式機(jī)器人簡史》。讀者若有一手信息、觀點(diǎn)、故事、項(xiàng)目，歡迎添加作者微信 nanshu0126 交流。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章