0
2022年底,ChatGPT 一經(jīng)推出,不多久便點(diǎn)燃了全球的科技熱情,一眾圍繞大模型創(chuàng)業(yè)的公司紛紛涌現(xiàn)。一片喧鬧中,彼時(shí)在西雅圖 Meta的胡魯輝,將目光越過(guò)了生成式人工智能大模型,望向注重感知與理解世界的物理智能模型。
所謂物理智能(Physical Intelligence),其核心在于使機(jī)器能夠感知、理解物理世界,并與之交互。近幾年,物理智能成了熱門(mén)話(huà)題,不僅能在各路技術(shù)大牛的演講中頻頻聽(tīng)到,斯坦福大學(xué)李飛飛老師更是直接創(chuàng)辦公司 World Labs,進(jìn)行物理智能領(lǐng)域的探索。
在胡魯輝老師看來(lái),物理智能會(huì)是繼 GPT 等信息智能之后、更具想象力的下一站,而機(jī)器人將是其最佳載體。正值國(guó)內(nèi)具身智能浪潮,胡魯輝決定結(jié)束西雅圖的安逸生活,回國(guó)創(chuàng)業(yè),親自下場(chǎng)將自己的想法付諸實(shí)踐。
今年4月,胡魯輝在杭州創(chuàng)辦智澄AI,短短四個(gè)月后即推出了 TR1 和 TR2 兩款人工智能機(jī)器人產(chǎn)品,并開(kāi)啟了商業(yè)化進(jìn)程。在他的設(shè)想里,智澄 AI 會(huì)依據(jù)實(shí)際應(yīng)用場(chǎng)景,進(jìn)行“沿途下蛋”,推出適配的機(jī)器人產(chǎn)品。
胡魯輝在機(jī)器人圈或許是個(gè)“生面孔”,但在人工智能領(lǐng)域,他卻是一個(gè)地道的行業(yè)老炮。作為一名資深的人工智能專(zhuān)家,胡魯輝的職業(yè)旅程遍布了全球科技行業(yè)的一些重要地標(biāo)。從早年留學(xué)美國(guó),歷經(jīng)微軟、亞馬遜、華為美國(guó)研究院,再到卸任的 Meta,胡魯輝在人工智能領(lǐng)域積淀了十余年行業(yè)經(jīng)驗(yàn)。
此次創(chuàng)業(yè),似乎是一場(chǎng)跨界行動(dòng),但對(duì)胡魯輝而言,是因?yàn)榭吹搅似渲刑N(yùn)藏的機(jī)會(huì)?!澳壳皺C(jī)器人有許多難點(diǎn)、痛點(diǎn),如成本高、泛化性差,要解決這些問(wèn)題,僅靠硬件遠(yuǎn)遠(yuǎn)不夠,還需要從軟件和模型入手?!?/p>
“我們的核心技術(shù)是物理智能,但我們不是只做物理智能模型,而是要做軟硬件兼具的機(jī)器人。”這也是他對(duì)智澄 AI 的愿景,做一個(gè)具有挑戰(zhàn)性的智能機(jī)器人,最終推動(dòng)機(jī)器人時(shí)代的到來(lái)。
圍繞此次創(chuàng)業(yè),AI 科技評(píng)論與胡魯輝進(jìn)行了一次深度對(duì)談。在交談中,他向我們展現(xiàn)了對(duì)物理智能領(lǐng)域的深刻見(jiàn)解,同時(shí),我們也能感受到胡魯輝對(duì)此次創(chuàng)業(yè)的熱情與信心。過(guò)往豐富的行業(yè)經(jīng)歷,讓他為團(tuán)隊(duì)拉來(lái)了一眾志同道合的優(yōu)秀人才;此外,多元的產(chǎn)業(yè)背景、此前成功的創(chuàng)業(yè)經(jīng)歷,讓他對(duì)如何運(yùn)營(yíng)一家商業(yè)化科技公司有了自己的解法。
以下是 AI 科技評(píng)論與胡魯輝的對(duì)話(huà)。
AI科技評(píng)論:您什么時(shí)候有了創(chuàng)業(yè)想法?
胡魯輝:我一直都有創(chuàng)業(yè)的熱情。早在 2018年 AI 1.0 時(shí)代,我第一次回國(guó)創(chuàng)業(yè)將人工智能與千億級(jí)零售業(yè)務(wù)智慧升級(jí)相結(jié)合,此外在Meta、華為、微軟、亞馬遜等科技巨頭的經(jīng)歷我也深度參與了AI模型訓(xùn)練、AI+信息流、AI+云計(jì)算、AI+物流商流等一次次技術(shù)變革浪潮。這次 AI 2.0 時(shí)代來(lái)臨,我覺(jué)得機(jī)會(huì)比之前的浪潮更大,而且論創(chuàng)業(yè)環(huán)境,我認(rèn)為國(guó)內(nèi)機(jī)會(huì)更多,所以就決定回來(lái)了。
AI科技評(píng)論:您此前從事的方向更偏向于算法軟件這塊,現(xiàn)在做機(jī)器人會(huì)不會(huì)又是另一個(gè)領(lǐng)域?
胡魯輝:其實(shí)機(jī)器人并非新東西,已有十來(lái)年、甚至更久。機(jī)器人此前也火過(guò),后來(lái)由于各種原因又歸于平靜了。此次我們創(chuàng)業(yè)的初衷和主要目的,是因?yàn)橄嘈艡C(jī)器人是未來(lái)、是下一個(gè)時(shí)代——機(jī)器人時(shí)代。
目前機(jī)器人發(fā)展處于一個(gè)尷尬階段,因?yàn)橛袃纱笸袋c(diǎn)。第一個(gè)是機(jī)器人特別貴,隨便一個(gè)人形機(jī)器人也需要好幾萬(wàn)、幾十萬(wàn)。相比之下,一輛不錯(cuò)的汽車(chē)也就 20 來(lái)萬(wàn),但一個(gè)能表演的機(jī)器人也都要幾十萬(wàn),甚至功能不夠完善,只能表演;第二個(gè)痛點(diǎn),是泛化技術(shù)有難度,可靠性、穩(wěn)定性、工程性根本不行。然而這兩個(gè)問(wèn)題相互關(guān)聯(lián),要解決不能單靠硬件,還得要從模型和軟件入手,讓機(jī)器人變得更好、更智能,能夠完成泛化作業(yè)。我們想解決機(jī)器人根本性問(wèn)題,也就是機(jī)器人的數(shù)據(jù)和智能的問(wèn)題,大數(shù)據(jù)和人工智能正是我的強(qiáng)項(xiàng)。
AI科技評(píng)論:您曾發(fā)表許多關(guān)于 AI 大模型相關(guān)內(nèi)容,如今跨界做機(jī)器人,您的創(chuàng)業(yè)方向具體是什么?
胡魯輝:針對(duì)機(jī)器人領(lǐng)域的挑戰(zhàn),我們認(rèn)為人工智能是有效的解決方案,尤其是大模型。目前,大模型在人工智能領(lǐng)域備受關(guān)注,如 ChatGPT 和國(guó)內(nèi)月之暗面、智譜等,它們主要開(kāi)發(fā)多模態(tài)大模型,用于構(gòu)建交互式對(duì)話(huà)系統(tǒng),即 Chatbot。
但是我們的產(chǎn)品將采用不同的技術(shù)路徑。我們專(zhuān)注于開(kāi)發(fā)機(jī)器人,核心技術(shù)不是生成式多模態(tài)大模型,而是物理智能,即對(duì)物理世界的感知和理解。今年4月,我在生成式人工智能大會(huì)上也介紹了我們的創(chuàng)業(yè)方向,強(qiáng)調(diào)了物理智能在機(jī)器人技術(shù)中的重要性。我們的目標(biāo)是通過(guò)物理智能技術(shù),提升機(jī)器人的自主性和智能化水平。
AI科技評(píng)論:所以你們做的不是單純的文本模型,而是理解物理世界的模型?
胡魯輝:我們正在自研物理世界模型,取名為“澄靈物理世界模型”,它專(zhuān)注于理解物理世界,與多模態(tài)大模型不同。我們區(qū)分這兩種智能:多模態(tài)大模型屬于信息智能,如 Chatbot 這類(lèi)人工智能,主要處理信息和交互;而我們的產(chǎn)品則屬于物理智能,專(zhuān)注于感知和理解現(xiàn)實(shí)世界的物理規(guī)律。
AI科技評(píng)論:怎么理解物理智能?
胡魯輝:人工智能的終極目標(biāo)也許是實(shí)現(xiàn)通用人工智能,而當(dāng)前階段我們正處于生成式人工智能的發(fā)展時(shí)期。這一觀(guān)點(diǎn)并非我首次提出,我與張亞勤院士交流時(shí),了解到他在五年前就已提出人工智能的發(fā)展路徑,從信息智能到物理智能,最終達(dá)到通用人工智能,這是一個(gè)逐步實(shí)現(xiàn)的過(guò)程。Meta 多年來(lái)也一直在討論世界模型的概念。今年6月,黃仁勛在臺(tái)灣的演講中也提到,下一個(gè)人工智能的發(fā)展方向是物理智能。
生成式人工智能處理的是一維或二維信息的輸入,如文字、圖片、音頻或視頻,并輸出相同類(lèi)型的信息。物理智能則在兩個(gè)層面上有所不同:首先,在輸入層面,我們處理的是感知和理解世界的數(shù)據(jù),包括視覺(jué)和觸覺(jué)等感官信息;其次,在輸出層面,我們生成的是TSD數(shù)據(jù),即時(shí)間(T)序列(S)數(shù)據(jù),這種數(shù)據(jù)可以直接用于控制機(jī)器人。
此外,生成式大模型和物理智能的產(chǎn)品形態(tài)和應(yīng)用場(chǎng)景也有所不同。生成式大模型不需要實(shí)時(shí)反饋,例如ChatGPT中有些信息可能只更新到去年9月。而我們的系統(tǒng)必須實(shí)時(shí)處理輸入信息,以確保機(jī)器人能夠及時(shí)響應(yīng)。
AI科技評(píng)論:你們機(jī)器人的研發(fā)是基于人工智能模型,演繹物理世界模型?
胡魯輝:對(duì)的。我們核心技術(shù)是物理世界模型,同時(shí)也做本體,打造一系列產(chǎn)品,目前已經(jīng)推出了機(jī)器人產(chǎn)品 TR1,TR2。
AI科技評(píng)論:你們已經(jīng)驗(yàn)證了這條鏈路了是嗎?
胡魯輝:是的,除了清晰的 Northstar,也能逐步驗(yàn)證和產(chǎn)品落地。
AI科技評(píng)論:物理智能是不是一定會(huì)和機(jī)器人結(jié)合?
胡魯輝:物理智能不一定非要和機(jī)器人結(jié)合,只是我認(rèn)為機(jī)器人領(lǐng)域或具身智能是最理想的應(yīng)用場(chǎng)景。好比,生成式人工智能目前最好的應(yīng)用是 Chatbot,但其實(shí)它也有很多其他場(chǎng)景可以用。
AI科技評(píng)論:一個(gè)能夠感知和理解世界的機(jī)器人,它的技術(shù)棧會(huì)包含哪幾塊?
胡魯輝:我認(rèn)為主要是三個(gè)方面:第一,與物理世界的交互。與信息智能不同,物理智能需要與現(xiàn)實(shí)世界進(jìn)行互動(dòng);第二,算法能力。物理智能需要具備和生成式人工智能一樣的算法能力,因?yàn)樗靡蟹夯芰屯评硎褂媚芰Γ坏谌?,?shí)時(shí)性。物理智能需要從三維、甚至四維(包含時(shí)空)的角度理解信息,這與信息智能有本質(zhì)的不同,因而要能夠?qū)崟r(shí)處理和響應(yīng)信息。
AI科技評(píng)論:其實(shí)這也是具身智能追求的目標(biāo)。
胡魯輝:對(duì),這就是個(gè)通用人工智能。
AI科技評(píng)論:您是什么時(shí)候有了要做物理智能的這一想法?
胡魯輝:2022年年底,ChatGPT出來(lái)的時(shí)候。ChatGPT一經(jīng)推出就在美國(guó)迅速走紅,因?yàn)榇蠹铱吹搅怂诲e(cuò)的泛化能力。國(guó)內(nèi)對(duì)它的關(guān)注應(yīng)該是在幾個(gè)月后逐漸升溫。當(dāng)時(shí)我還在西雅圖,我開(kāi)始思考我們應(yīng)該如何跟進(jìn)這一趨勢(shì),也有不少創(chuàng)業(yè)公司開(kāi)始圍繞 ChatGPT 進(jìn)行創(chuàng)業(yè)。
那時(shí),我也在 Meta 了解到世界模型的概念,而 Meta 首席 AI 科學(xué)家楊立昆對(duì)大模型并不特別熱衷。我也認(rèn)為,繼 ChatGPT 之后,下一個(gè)重要的發(fā)展將是物理智能,它將擁有更廣泛的應(yīng)用前景。
AI科技評(píng)論:您會(huì)認(rèn)為大模型對(duì)于機(jī)器人的發(fā)展是一個(gè)機(jī)遇?
胡魯輝:大模型是一種技術(shù)手段,類(lèi)似于我們開(kāi)發(fā)的世界模型,它也是一種大模型的表現(xiàn)形式,盡管具體的實(shí)現(xiàn)方式有所不同。這些模型都屬于基礎(chǔ)模型(foundation model),我們自主研發(fā)的世界模型同樣具備這樣的基礎(chǔ)模型特性。
AI科技評(píng)論:您怎么看待通用人工智能與通用機(jī)器人間的關(guān)系?
胡魯輝:通用人工智能是人工智能領(lǐng)域的終極目標(biāo),它指的是達(dá)到人類(lèi)水平的智能,這主要是從技術(shù)層面來(lái)講的。而通用機(jī)器人則是指具體的產(chǎn)品或應(yīng)用。無(wú)論是通用人工智能還是通用機(jī)器人,它們的核心目標(biāo)都是實(shí)現(xiàn)“通用性”,而實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵在于掌握通用人工智能的技術(shù)。
AI科技評(píng)論:基于物理世界模型開(kāi)發(fā)機(jī)器人的路徑,國(guó)內(nèi)目前還沒(méi)有相似公司?
胡魯輝:應(yīng)該是沒(méi)有的。由于我司比較低調(diào),我先提出這個(gè)想法時(shí),并沒(méi)有引起太多人的興趣。但自從李飛飛老師和一些美國(guó)企業(yè)開(kāi)始討論這個(gè)概念后,它就迅速受到了廣泛關(guān)注。
AI科技評(píng)論:在這波具身智能浪潮中,你們的優(yōu)勢(shì)是什么?
胡魯輝:我覺(jué)得我們的優(yōu)勢(shì)還是蠻多的,主要是四個(gè)方面。第一,我們專(zhuān)注于物理智能領(lǐng)域,這是我們的核心技術(shù)和主要?jiǎng)?chuàng)新點(diǎn);第二,我們的團(tuán)隊(duì)成員基本都是來(lái)自頂級(jí)企業(yè)的高管,不僅擁有豐富的行業(yè)經(jīng)驗(yàn),也有很多業(yè)務(wù)資源;第三,我們?cè)诿艚萁桓斗矫嬲宫F(xiàn)出了強(qiáng)大的工程化實(shí)力,TR1 和 TR2 的出色表現(xiàn)證明了我們的執(zhí)行力和交付能力;第四,我們與哈佛、清華等頂尖高校建立了合作關(guān)系,并得到了地方政府的支持,這為我們提供了強(qiáng)大的資源后盾。
AI科技評(píng)論:你們團(tuán)隊(duì)今年才成立,但產(chǎn)品發(fā)布很快,你們是不是很早就布局了?
胡魯輝:應(yīng)該說(shuō)是我們的團(tuán)隊(duì)非常優(yōu)秀,并且我們采用了亞馬遜的敏捷開(kāi)發(fā)模式。亞馬遜的開(kāi)發(fā)模式使我們每?jī)蓚€(gè)月進(jìn)行一次迭代,我們從今年5月份開(kāi)始,大約兩個(gè)月推出一款新產(chǎn)品的節(jié)奏。在四個(gè)月的時(shí)間里,我們成功推出了 TR1 和 TR2 兩款產(chǎn)品原型。
AI科技評(píng)論:你們現(xiàn)在團(tuán)隊(duì)規(guī)模有多大?
胡魯輝:現(xiàn)在有 20 來(lái)人,基本以研發(fā)人員為主,研發(fā)團(tuán)隊(duì)都是碩士以上,畢業(yè)于國(guó)內(nèi)外名校。
AI科技評(píng)論:TR1 和 TR2 兩款產(chǎn)品已經(jīng)量產(chǎn)了嗎?
胡魯輝:目前我們已經(jīng)開(kāi)始與意向客戶(hù)進(jìn)行合作落地。
AI科技評(píng)論:這兩款產(chǎn)品的功能定位是什么?
胡魯輝:我們致力于開(kāi)發(fā)通用人工智能和通用機(jī)器人,是因?yàn)橄胪苿?dòng)機(jī)器人時(shí)代的到來(lái)。與許多僅用于表演和研發(fā)的機(jī)器人不同,我們的目標(biāo)是讓機(jī)器人能夠?qū)嶋H執(zhí)行任務(wù)。要實(shí)現(xiàn)這一點(diǎn),機(jī)器人的“手”是最關(guān)鍵的部分,因此我們的開(kāi)發(fā)從手臂開(kāi)始。我們的產(chǎn)品 TR1 是一款單臂機(jī)器人,而 TR2 則是一款雙臂機(jī)器人。我們希望能夠開(kāi)發(fā)出更復(fù)雜、更具挑戰(zhàn)性的機(jī)器人,這也是我們的愿景。
AI科技評(píng)論:那你們是做專(zhuān)用機(jī)器人,還是通用機(jī)器人?
胡魯輝:我們并不局限于機(jī)器人本體,而是會(huì)依據(jù)業(yè)務(wù)場(chǎng)景來(lái)做不同的機(jī)器人。
移動(dòng)互聯(lián)網(wǎng)時(shí)代的一大標(biāo)志是 iPhone 的到來(lái),iPhone 帶來(lái)的是硬件平臺(tái)化,上面可以有不同app,而每一個(gè)app對(duì)應(yīng)一個(gè)應(yīng)用,說(shuō)白了就是一個(gè)特定業(yè)務(wù)場(chǎng)景的解決方案。因此,我們希望將這一概念應(yīng)用到物理世界智能領(lǐng)域,打造一個(gè)平臺(tái)化的模型,支持不同的硬件和機(jī)器人,以適應(yīng)配送、工廠(chǎng)作業(yè)、家庭服務(wù)等多種場(chǎng)景。
AI科技評(píng)論:聽(tīng)起來(lái),你們是以人工智能算法為中心,再加不同本體,如人形、四足等,你們自己也做本體嗎?
胡魯輝:我們也會(huì)做本體。我們自己做設(shè)計(jì),但我們不做生產(chǎn)。
AI科技評(píng)論:你們技術(shù)核心是不是在算法驅(qū)動(dòng)這塊?
胡魯輝:應(yīng)該說(shuō)是物理智能層面,我們要打造物理智能,也就是理解物理世界的人工智能。
AI科技評(píng)論:你們接下來(lái)的產(chǎn)品計(jì)劃是什么?
胡魯輝:我們的 TR1 和 TR2 產(chǎn)品將會(huì)持續(xù)進(jìn)行迭代升級(jí),在這個(gè)過(guò)程中,我們會(huì)繼續(xù)投入創(chuàng)新和研發(fā)工作。同時(shí),我們會(huì)將產(chǎn)品與實(shí)際應(yīng)用場(chǎng)景結(jié)合,逐步推動(dòng)商業(yè)化進(jìn)程,“沿途下蛋”。目前,我們已經(jīng)收到了多家企業(yè)的合作意向。
AI科技評(píng)論:您覺(jué)得國(guó)內(nèi)機(jī)器人領(lǐng)域的融資環(huán)境好嗎?你們?nèi)谫Y困難嗎?
胡魯輝:整體環(huán)境我覺(jué)得一般,應(yīng)該說(shuō)沒(méi)有以前好,但現(xiàn)在人工智能、AI 2.0還是很火爆的。
AI科技評(píng)論:與國(guó)內(nèi)廠(chǎng)商競(jìng)爭(zhēng),你們會(huì)遇到什么挑戰(zhàn)?
胡魯輝:我們的發(fā)展主要受兩大因素影響。一是科技發(fā)展的內(nèi)在趨勢(shì),二是商業(yè)環(huán)境的實(shí)際需求。作為一家商業(yè)化的科技公司,我們不僅要適應(yīng)市場(chǎng)的變化,還要在技術(shù)上不斷實(shí)現(xiàn)突破。當(dāng)然,這種情況也是許多企業(yè)在發(fā)展過(guò)程中需要面對(duì)的挑戰(zhàn)。
雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。