0
本文作者: 張進(jìn) | 2023-04-25 15:40 |
ChatGPT爆火,引得全世界為之瘋狂,恍惚中一夜之間,人人都在討論ChatGPT,所有大佬和資本紛紛涌進(jìn)大模型。
上一次如此熱鬧還是Web 3,不過(guò)相對(duì)前者是少部分人的自?shī)首詷?lè),大模型則像魔法,引得全民為之著迷,短短 2 個(gè)月內(nèi) ChatGPT 就收獲 1 億用戶(hù),幣圈甚至認(rèn)為過(guò)去3個(gè)月內(nèi)AI創(chuàng)造的價(jià)值,超過(guò)了虛擬貨幣歷史上創(chuàng)造價(jià)值的總和。而創(chuàng)業(yè)者和投資人對(duì)大模型更狂熱,更加充滿(mǎn)信念感,堅(jiān)信大模型的歷史意義將不亞于電力的發(fā)明;而爭(zhēng)奪大模型技術(shù)的領(lǐng)導(dǎo)地位,則像“研發(fā)核武器”。
“全球最聰明的人都在大模型創(chuàng)業(yè),沒(méi)人會(huì)禁受得住它的誘惑?!鼻皹O狐(GitLab)創(chuàng)始人陳冉這樣對(duì)雷峰網(wǎng)說(shuō)。
一個(gè)資深技術(shù)極客趙亞雄博士亦是如此。2019年從工作了六年的谷歌離職后,便一直奔赴在創(chuàng)業(yè)前線(xiàn),最初加入創(chuàng)業(yè)公司Pixie小試牛刀,2022年他決定回國(guó),因?yàn)閲?guó)內(nèi)涌現(xiàn)出的創(chuàng)業(yè)機(jī)會(huì)深深吸引著他——中國(guó)正在發(fā)展獨(dú)立自主技術(shù)體系,中國(guó)要做自己的IT技術(shù)棧,發(fā)展自己的技術(shù)生態(tài)。對(duì)他來(lái)說(shuō),腦海中有無(wú)數(shù)誘人的技術(shù)創(chuàng)新點(diǎn)子,但是在美國(guó)成熟的技術(shù)生態(tài)中,這些想法都顯得過(guò)于激進(jìn)。
對(duì)他這樣一個(gè)在國(guó)外科技大廠(chǎng)經(jīng)受過(guò)近十年技術(shù)訓(xùn)練的人來(lái)說(shuō),這是一個(gè)難能可貴的機(jī)會(huì)。從2008年到2019年的十年里,趙亞雄博士分別在A(yíng)mazon、Google工作,在基礎(chǔ)軟件領(lǐng)域已經(jīng)成為一名資深的技術(shù)極客。
懂技術(shù)有國(guó)際視野還心懷一腔熱情,這是支撐他在人生的舒適期,從大廠(chǎng)離職出來(lái)完成自己創(chuàng)業(yè)夢(mèng)想的基礎(chǔ)。
2022 年 10 月回國(guó)后,趙亞雄博士獲得奇績(jī)創(chuàng)壇創(chuàng)始人 CEO 陸奇博士的天使輪投資,開(kāi)始了每周工作 100 小時(shí)以上的硬核模式。他長(zhǎng)期關(guān)注 OpenAI 及硅谷創(chuàng)投生態(tài),看到在自動(dòng)駕駛長(zhǎng)期無(wú)法獲得突破、AI 創(chuàng)業(yè)領(lǐng)域一片低迷的情況下,ChatGPT從 11 月底橫空出世后,重新激發(fā)了全球范圍內(nèi)對(duì) AI 的狂熱。
“未來(lái)一定是AI的世界”,趙亞雄博士的商業(yè)猜想轉(zhuǎn)移到大模型。但他的商業(yè)方案“算想未來(lái)”不直接參與做大模型,而是要做大模型和AI應(yīng)用的基礎(chǔ)設(shè)施。未來(lái)“算想未來(lái)”要做AI的基礎(chǔ)設(shè)施—— AI IaaS Cloud,區(qū)別于傳統(tǒng)的云計(jì)算廠(chǎng)商,即一個(gè)以AI為導(dǎo)向的云計(jì)算廠(chǎng)商。
趙亞雄博士基于自己長(zhǎng)期在Google 為 Google Brain、DeepMind 構(gòu)建的大規(guī)模高性能機(jī)器學(xué)習(xí)計(jì)算平臺(tái)上的經(jīng)驗(yàn),敏銳地意識(shí)到中國(guó)大模型的研發(fā),受制于基礎(chǔ)設(shè)施軟件薄弱、人才稀缺、以及 GPU 芯片禁售的風(fēng)險(xiǎn)。他堅(jiān)信,接下來(lái)將迎來(lái)大模型大爆發(fā),對(duì)算力的需求隨之會(huì)暴漲,“算想未來(lái)”就是要承接住大模型帶來(lái)的這部分機(jī)會(huì)。
以下是雷峰網(wǎng)與趙亞雄博士的對(duì)話(huà),講述了他對(duì)大模型的認(rèn)知,對(duì)國(guó)內(nèi)云計(jì)算、SaaS產(chǎn)品發(fā)展的分析以及“算想未來(lái)”的規(guī)劃。
雷峰網(wǎng):是什么時(shí)候關(guān)注的大模型?
趙亞雄:2018 年我們就關(guān)注到來(lái)自 OpenAI 的博客 “AI and Compute”(https://openai.com/research/ai-and-compute)的一個(gè)結(jié)論:大模型的算力需求每 3.4 個(gè)月翻一番。我還在 Google 時(shí),Google就一直保持對(duì)大規(guī)模機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的投入,我這邊所在的 Borg 團(tuán)隊(duì)一直有專(zhuān)門(mén)的小組支持 Google Brain、DeepMind ,負(fù)責(zé)在大規(guī)模 GPU、TPU 集群上的資源管理和調(diào)度。
我們一直關(guān)注Transfomer、GPT 的進(jìn)展,但是 ChatGPT 的誕生確實(shí)完全出乎意料,的確完全超出了我們之前腦海中固化的“線(xiàn)性發(fā)展”的能力曲線(xiàn)。也從前同事了解到ChatGPT對(duì)Google的沖擊,感到非常震撼。
2018 年我們嘗試了 GPU Cloud 的創(chuàng)業(yè)方案,2020 年又嘗試了 Compute Infra with AI Chips,都沒(méi)有成功。當(dāng)時(shí)最大的阻力在于,大規(guī)模的 AI 算力需求仍然只是頭部大廠(chǎng)的小眾需求,市場(chǎng)空間有限。真正重新喚起我們對(duì) AI 基礎(chǔ)設(shè)施的熱情,是在 3 月 27 日陸奇博士在奇績(jī)創(chuàng)壇得宣講會(huì)上,他認(rèn)為大模型已經(jīng)帶來(lái)劃時(shí)代得變革。
3月 27 號(hào)那天,陸奇博士召開(kāi)了一個(gè)奇績(jī)創(chuàng)壇內(nèi)部成員企業(yè)的轉(zhuǎn)型研討會(huì),主要是有關(guān)AI、大模型。我們都知道陸奇博士他對(duì)AI領(lǐng)域的貢獻(xiàn):作為AI的一名布道者,他很早就參與過(guò) OpenAI 的早期工作,在微軟也一直在做搜索及人工智能方面的技術(shù)管理,百度的“All in AI ”戰(zhàn)略也是他制定的。
在這個(gè)研討會(huì)上,通過(guò)陸奇博士的視角,讓我從整個(gè)人類(lèi)社會(huì)經(jīng)濟(jì)歷史、社會(huì)發(fā)展以及大模型帶來(lái)的機(jī)會(huì),對(duì)大模型有了更加深刻的認(rèn)識(shí)。
我們意識(shí)到 AI 基礎(chǔ)設(shè)施軟件,對(duì)中國(guó)大模型團(tuán)隊(duì)追趕 OpenAI 至關(guān)重要。基于我們跟 OpenAI 基礎(chǔ)設(shè)施團(tuán)隊(duì)過(guò)往的交流,我們認(rèn)為中國(guó)沒(méi)有可以匹敵 OpenAI 的基礎(chǔ)設(shè)施軟件技術(shù)團(tuán)隊(duì),這是“算想未來(lái)”的起點(diǎn)。
雷峰網(wǎng):也就是我們要做AI的云,但是現(xiàn)在國(guó)內(nèi)公有云競(jìng)爭(zhēng)已經(jīng)是一片紅海了。
趙亞雄:傳統(tǒng) Cloud 市場(chǎng)確實(shí)是紅海。但是大模型和 AI 應(yīng)用的需求,完全不同于傳統(tǒng) Cloud 所服務(wù)的軟件系統(tǒng)。在大模型和 AI 應(yīng)用領(lǐng)域,大家的技術(shù)積累沒(méi)有質(zhì)的差別。
首先我們看到中國(guó)現(xiàn)在有個(gè)最大的機(jī)會(huì),就是中國(guó)正在發(fā)展獨(dú)立自主技術(shù)體系,也就是常說(shuō)的國(guó)產(chǎn)替代,從政府到公眾、以及企業(yè)都推動(dòng)。如此一來(lái),從芯片,到服務(wù)器等基礎(chǔ)設(shè)施,再到上面的模型應(yīng)用,都有機(jī)會(huì)完全獨(dú)立自主。每個(gè)層面都有全新的機(jī)會(huì)。
另外,因?yàn)?AI 大模型帶來(lái)的AI算力的需求,包括AI的訓(xùn)練和AI的應(yīng)用研發(fā),這些場(chǎng)景衍生出來(lái)的公有云需求,會(huì)持續(xù)快速增長(zhǎng)。我們有一個(gè)非常有名的統(tǒng)計(jì)數(shù)據(jù)——OpenAI 在 2018 年寫(xiě)的 AI and compute 的一個(gè)blog,里面介紹了他們統(tǒng)計(jì)的每個(gè)時(shí)間階段最大的深度學(xué)習(xí)模型,它訓(xùn)練所需要的算力總額,每3.4個(gè)月就要翻一翻。那可想而知,隨著未來(lái) AI 持續(xù)地被更多人使用,算力以及從算力衍生出來(lái)的大數(shù)據(jù)還有 AI 應(yīng)用研發(fā),對(duì)基礎(chǔ)設(shè)施的需求會(huì)很快地超過(guò)傳統(tǒng)的云計(jì)算。
雷峰網(wǎng):能具體講講怎么做AI、大模型的基礎(chǔ)設(shè)施嗎?
趙亞雄:我們要做一個(gè)操作系統(tǒng),或者說(shuō)一個(gè)管理 AI超級(jí)計(jì)算機(jī)的基礎(chǔ)設(shè)施軟件平臺(tái)。
這個(gè)操作系統(tǒng)將 GPU(以及其他定制化的AI芯片)的算力,充分釋放給上層的 AI訓(xùn)練和推理,特別是大模型的訓(xùn)練。我們現(xiàn)在要做的這個(gè) GPU 計(jì)算平臺(tái)軟件,實(shí)際上就是讓大模型訓(xùn)練,可以高效地?cái)U(kuò)展到GPU集群所能允許的最大規(guī)模,提升訓(xùn)練過(guò)程中對(duì)硬件的使用效率,加速大模型訓(xùn)練的迭代速度,最終達(dá)到快速追趕 OpenAI 的目標(biāo)。
通過(guò)擴(kuò)大規(guī)模來(lái)提高硬件使用效率,縮短模型訓(xùn)練的時(shí)間周期,原來(lái)可能要兩個(gè)月訓(xùn)練,我們現(xiàn)在可以三個(gè)星期完成,快速地進(jìn)行模型研發(fā)、迭代,從而加速去追趕 OpenAI ,盡早達(dá)到OpenAI GPT 3.5 或者 GPT 4 的能力。
“算想未來(lái)”第一階段關(guān)注提升分布式大模型訓(xùn)練的規(guī)模;第二階段,我們會(huì)尋求國(guó)產(chǎn) AI算力的硬件,即GPU和其他 AI芯片的合作,為大模型及AI應(yīng)用提供最具性?xún)r(jià)比的AI推理算力,并推出算想未來(lái)自己的AI算力基礎(chǔ)設(shè)施解決方案,來(lái)為大中型企業(yè)建立私有AI云。
“算想未來(lái)”的最終目標(biāo),是在第三階段,集合大數(shù)據(jù)、訓(xùn)練、推理以及其他 AI 計(jì)算相關(guān)的基礎(chǔ)設(shè)施能力和服務(wù),立足中國(guó)、服務(wù)全球,成為中國(guó)領(lǐng)先的 AI IaaS 云服務(wù)提供商。
雷峰網(wǎng):上面提到超級(jí)計(jì)算機(jī),是類(lèi)似Meta的RSC(https://ai.facebook.com/blog/ai-rsc/)?
趙亞雄:AI 超算的這個(gè)概念,現(xiàn)在指的是一類(lèi)專(zhuān)門(mén)來(lái)服務(wù)大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí),還有其他 AI 訓(xùn)練的一類(lèi)集群式的計(jì)算平臺(tái)。我們說(shuō)的超算跟你提到Meta的RSC,其它的系統(tǒng)還有Google TPU Pod(https://cloud.google.com/tpu)、Tesla Dojo ExaPod(https://www.tesla.com/AI)這些都是同一類(lèi)型的硬件系統(tǒng)。
AI超算的硬件之上還有軟件層,那這個(gè)軟件層我們可以把它想象成, AI超級(jí)計(jì)算機(jī)的操作系統(tǒng),它最核心的是要提供一種能力:可以把底層硬件的算力資源,通過(guò)軟件的 API 形式,更容易地讓模型這些框架性的軟件高效率地對(duì)接起來(lái),從而讓機(jī)器學(xué)習(xí)和人工智能的研究人員和 AI 應(yīng)用的開(kāi)發(fā)者,可以用盡量小的研發(fā)投入,來(lái)使用 AI 超級(jí)計(jì)算機(jī)下面的硬件計(jì)算能力。
雷峰網(wǎng):國(guó)內(nèi)做AI公有云的,有百度百舸、火山引擎,我們是對(duì)標(biāo)他們嗎?
趙亞雄:是的。百度百舸,是針對(duì)客戶(hù)自有硬件之上的私有化部署的軟件產(chǎn)品?!八阆胛磥?lái)”在第二階段推出的私有 AI 基礎(chǔ)設(shè)施解決方案,就會(huì)包含一個(gè)與百舸類(lèi)似的軟件平臺(tái)。而火山引擎中針對(duì) AI 的基礎(chǔ)設(shè)施云服務(wù),包括網(wǎng)絡(luò),相關(guān)大數(shù)據(jù)產(chǎn)品,也是我們未來(lái)要嘗試的方向?!八阆胛磥?lái)”的優(yōu)勢(shì)在于,擁有來(lái)自硅谷一線(xiàn)大廠(chǎng)中核心 AI 基礎(chǔ)設(shè)施團(tuán)隊(duì),從事 AI 超算系統(tǒng)研發(fā)的實(shí)踐經(jīng)驗(yàn)。
另一個(gè)區(qū)別在于大家聚焦點(diǎn)不同,“算想未來(lái)”平臺(tái)聚焦底層硬件資源的管理、優(yōu)化、調(diào)度。而以上的產(chǎn)品專(zhuān)注在提供軟件工具來(lái)幫助機(jī)器學(xué)習(xí)研究者、AI 應(yīng)用開(kāi)發(fā)者,來(lái)更快速完成機(jī)器學(xué)習(xí)模型代碼和AI 應(yīng)用代碼的編寫(xiě)。換言之,“算想未來(lái)”關(guān)注的是如何將硬件資源以軟件 API 的形式呈現(xiàn)給機(jī)器學(xué)習(xí)研究者、AI 應(yīng)用開(kāi)發(fā)者,讓模型訓(xùn)練、AI 應(yīng)用能更高效地使用硬件資源。
此外,我們的平臺(tái)將聚焦在支持國(guó)產(chǎn) GPU,目標(biāo)是基于國(guó)產(chǎn) GPU 構(gòu)建媲美 nVidia 芯片的算力平臺(tái)解決方案。以上百舸、火山引擎也支持其他非 nVidia GPU,但只是將其作為補(bǔ)充、并非核心。從技術(shù)獨(dú)立自主這個(gè)角度看,百舸、火山引擎并沒(méi)有優(yōu)勢(shì)。
雷峰網(wǎng):前面提到“算想未來(lái)”是基于大模型做基礎(chǔ)設(shè)施,提供公有云服務(wù),那您怎么看待國(guó)內(nèi)這群做大模型的人和公司?我們聽(tīng)到的有一種觀(guān)點(diǎn)是,目前國(guó)內(nèi)這些做大模型的企業(yè)大多都是白費(fèi)力氣,他們用的都是很老的算法,您為什么不直接切入做大模型,而是要做大模型的基礎(chǔ)設(shè)施?
趙亞雄:首先我認(rèn)為這些投資和大模型團(tuán)隊(duì)的出現(xiàn)都是非常好的,對(duì)中國(guó)的AI發(fā)展有積極作用。
這一次,在人工智能方面,中國(guó)和美國(guó)的差距通過(guò) ChatGPT 放大出來(lái)。以前官方報(bào)道的中國(guó)人工智能的水平,很多是通過(guò)專(zhuān)利、論文,還有畢業(yè)工程師和博士的數(shù)量等等,這種量化指標(biāo)來(lái)體現(xiàn)。那這些量化指標(biāo)有個(gè)很大的缺陷,就是沒(méi)有關(guān)注AI 理論研究的實(shí)際水平,以及支持 AI 理論研究和應(yīng)用軟件系統(tǒng)的基礎(chǔ)設(shè)施(包括硬件、軟件)的能力, AI 應(yīng)用實(shí)際落地的商業(yè)閉環(huán)和對(duì) Ai 技術(shù)生態(tài)的飛輪效應(yīng)。
ChatGPT讓我們看到美國(guó)整個(gè)生態(tài)是有更深的“內(nèi)功”,以前不過(guò)是發(fā)“大招”之前的蓄力,看上去平平常常,一爆發(fā)就震驚世界。
當(dāng)然差距沒(méi)有想象中那么大。相比之前各個(gè)輪次的創(chuàng)業(yè)熱點(diǎn)來(lái)說(shuō),這次的熱點(diǎn)是一個(gè)完全由技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)熱潮。上一輪技術(shù)驅(qū)動(dòng)的熱潮是無(wú)人車(chē),但當(dāng)時(shí)的問(wèn)題是它是以美國(guó)的團(tuán)隊(duì)為核心,像小馬智行、文遠(yuǎn)知行等,實(shí)際上都是美國(guó)的人才在美國(guó)的土地上來(lái)做這件事情,雖然接受了大量中國(guó)風(fēng)投的資金,但是它整個(gè)還是美國(guó)公司。
這一次大模型的創(chuàng)業(yè)有一個(gè)非常好的變化,就是中國(guó)本土的人員搭上本土的資金,然后也是完全關(guān)注中國(guó)本土市場(chǎng),而且完全由技術(shù)驅(qū)動(dòng)。
以技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè),最后能取得好的商業(yè)成果的概率都是很低的。這是毋庸置疑的。但是,技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)所積累下來(lái)的技術(shù)成果,在未來(lái)都是有更大機(jī)會(huì)在新的場(chǎng)景下發(fā)揮價(jià)值,這跟以往的商業(yè)模式驅(qū)動(dòng)的同質(zhì)化創(chuàng)業(yè)競(jìng)爭(zhēng)區(qū)別就在這兒。商業(yè)模式同質(zhì)化競(jìng)爭(zhēng)的失敗者,他所積累的東西本身幾乎沒(méi)有復(fù)用價(jià)值,至多就是提供給后來(lái)者如何規(guī)避商業(yè)競(jìng)爭(zhēng)中的同類(lèi)風(fēng)險(xiǎn)。
“算想未來(lái)”的信心在于,我們能搭建一個(gè)世界一流的工程團(tuán)隊(duì),擁有在硅谷頭部企業(yè)研究團(tuán)隊(duì)中實(shí)踐大模型訓(xùn)練的技術(shù)經(jīng)驗(yàn),根據(jù)我們?cè)诿绹?guó)的技術(shù)經(jīng)驗(yàn)和技術(shù)的實(shí)踐成果,把這些技術(shù)能力轉(zhuǎn)移到國(guó)內(nèi)來(lái)做第一批早期客戶(hù)。
我們最近也是跟國(guó)內(nèi)的大模型團(tuán)隊(duì),還有其他的歷史更長(zhǎng)的一些人工智能公司做交流。我們很明顯地感覺(jué)到,大家對(duì)基礎(chǔ)設(shè)施方面有一些共性的技術(shù)問(wèn)題,都是我們之前在 Google 還有其他的公司都已經(jīng)解決過(guò)的。所以在技術(shù)解決能力上我們很有信心。
雷峰網(wǎng):您說(shuō)我們正在跟很多大模型團(tuán)隊(duì)有過(guò)討論,能透露一下接觸過(guò)哪些團(tuán)隊(duì)嗎?
趙亞雄:所有中國(guó)過(guò)去一段時(shí)間出現(xiàn)的大模型團(tuán)隊(duì),我們都在接觸中。另外還有一些傳統(tǒng)的 AI 應(yīng)用廠(chǎng)商,大家耳熟能詳企業(yè),我們也在積極地做業(yè)務(wù)拓展,具體的信息在“算想未來(lái)”后期有了階段性成果之后,肯定會(huì)公布出來(lái)。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)):既然您同意國(guó)內(nèi)大模型創(chuàng)業(yè)公司只有30+家,競(jìng)爭(zhēng)激烈,后期活下來(lái)的也不會(huì)很多。那么,“算想未來(lái)”闖進(jìn)AI的基礎(chǔ)設(shè)施領(lǐng)域,市場(chǎng)空間有多大?
趙亞雄:首先要明確一點(diǎn),我們的AI IaaS Cloud只是從服務(wù)大模型團(tuán)隊(duì)做切入,實(shí)際上我們的愿景是AI 基礎(chǔ)設(shè)施的云服務(wù),它無(wú)論是大模型、中模型,還是小模型,甚至是邊緣的,甚至是嵌入式移動(dòng)端的,都會(huì)有相應(yīng)的需求。我們會(huì)為所有的企業(yè)提供相應(yīng)的訓(xùn)練、推理,還有大數(shù)據(jù)以及其他支撐性的軟件服務(wù),像 MLOPs、AI 應(yīng)用框架、Serverless AI 等等這些。
目前大模型創(chuàng)業(yè),是爭(zhēng)奪大模型市場(chǎng)的領(lǐng)導(dǎo)地位,其中絕大多數(shù)企業(yè)都會(huì)在競(jìng)爭(zhēng)中被淘汰,從而消失,或者只享有極小的市場(chǎng)份額。但是這不意味著未來(lái)只有極少數(shù)幾家大模型團(tuán)隊(duì)。實(shí)際上在主流投資圈關(guān)注的視野之外,有很多大模型團(tuán)隊(duì)都在默默地自由生長(zhǎng)著。最后的格局應(yīng)該是少數(shù)幾家頭部,后面跟了大量長(zhǎng)尾的大模型團(tuán)隊(duì)服務(wù)各個(gè)行業(yè)客戶(hù)。
另一個(gè)方面,大模型訓(xùn)練也不是少數(shù)企業(yè)才會(huì)有的需求。因?yàn)榇竽P烷_(kāi)啟了 AI 經(jīng)濟(jì)的序幕,意味著一般意義上的 AI 模型即將被大多數(shù)消費(fèi)者、軟件廠(chǎng)商所接受。
此外,雖然大模型與傳統(tǒng)手工編寫(xiě)的軟件,采用了完全不同的生產(chǎn)方式,但大模型仍然是一種軟件,仍然需要在使用過(guò)程中不斷進(jìn)行重新訓(xùn)練、微調(diào)來(lái)滿(mǎn)足用戶(hù)的具體需求,這導(dǎo)致需求會(huì)源源不斷。
正如用戶(hù)在使用開(kāi)源軟件,都或多或少會(huì)進(jìn)行相應(yīng)的定制,因此不會(huì)出現(xiàn)由少數(shù)幾個(gè)大模型公司壟斷模型訓(xùn)練、推理的情況。
綜上,我們認(rèn)為以大模型訓(xùn)練為開(kāi)端,逐步擴(kuò)大和深入的國(guó)內(nèi)AI經(jīng)濟(jì),將會(huì)是一個(gè)多元多維度不斷發(fā)展的市場(chǎng),不會(huì)是單一的,也不會(huì)是停滯的市場(chǎng)。
雷峰網(wǎng):大模型會(huì)給中國(guó)軟件產(chǎn)業(yè)帶來(lái)什么樣的影響?
趙亞雄:鑒于中國(guó)經(jīng)濟(jì)的獨(dú)特結(jié)構(gòu),國(guó)有企業(yè)主導(dǎo)的、以公有制主體的經(jīng)濟(jì)格局,要有美國(guó)模式的 SaaS 產(chǎn)品出現(xiàn),成本太高了。
大模型的出現(xiàn)意味著以 AI 為主體的軟件服務(wù),會(huì)給中國(guó)軟件產(chǎn)業(yè)帶來(lái)跳躍式發(fā)展。如同中國(guó)跳過(guò) PC 互聯(lián)網(wǎng)的成熟而直接進(jìn)入移動(dòng)互聯(lián)網(wǎng),中國(guó)的軟件服務(wù)業(yè)也會(huì)跳過(guò) SaaS 進(jìn)入 AiaaS 階段,這意味著絕大部分軟件應(yīng)用都會(huì)用AI 模型來(lái)支持其功能,也意味著更廣泛的 AI 算力需求,這正是“算想未來(lái)”最關(guān)注的市場(chǎng)空間。
如此一來(lái),國(guó)內(nèi)的 AI 基礎(chǔ)設(shè)施市場(chǎng)有機(jī)會(huì)出現(xiàn)一個(gè)“為中國(guó) AI 經(jīng)濟(jì)而生的 AWS”,在A(yíng)I云上也隨之能長(zhǎng)出如Netflix這樣的現(xiàn)象級(jí)SaaS應(yīng)用。這是“算想未來(lái)”的機(jī)會(huì)和目標(biāo)。
但國(guó)內(nèi)這些以大模型為核心的公司,不會(huì)成為像AWS那樣的大公司。我們當(dāng)然是希望王慧文這樣的成功創(chuàng)業(yè)者,能走出一條出人意料的商業(yè)化路徑,這也是我們?cè)敢飧械拇竽P蛨F(tuán)隊(duì),一起來(lái)琢磨在更大的集群上跑更大的模型的辦法,首先完成對(duì) OpenAI 的追趕,然后大家再?gòu)P殺角逐出最強(qiáng)的團(tuán)隊(duì),跑出最好的商業(yè)模式。
雷峰網(wǎng):為什么國(guó)內(nèi)這批以大模型為核心的創(chuàng)業(yè)公司,不會(huì)成為像AWS那樣的大公司?
趙亞雄:假設(shè)這些大模型公司,打算以大模型構(gòu)建公有云平臺(tái),那這意味著大模型要具有廣泛的應(yīng)用能力,來(lái)為其他 AI 應(yīng)用團(tuán)隊(duì)提供一種等同于(現(xiàn)有公有云上的)IaaS 能力,換句話(huà)說(shuō),AI 應(yīng)用團(tuán)隊(duì)要能夠使用大模型來(lái)搭建自己的 AI 應(yīng)用。
這就存在兩個(gè)問(wèn)題:1、大模型的泛化能力有待驗(yàn)證?,F(xiàn)在僅僅依靠文本語(yǔ)言作為媒介的大模型,雖然表現(xiàn)出了類(lèi)人的能力,但是難以想象這種能力如何作為基礎(chǔ)能力,來(lái)嵌入其他應(yīng)用,即商業(yè)化場(chǎng)景模糊。
2、大模型的技術(shù)壁壘有限。LLaMA開(kāi)源之后,其能力已經(jīng)接近、或部分超越 GPT3,雖然 GPT4 的能力大幅提升。但是在大廠(chǎng)之間,模型的能力差距在 3 年之內(nèi)(以?xún)烧甙l(fā)布時(shí)間為對(duì)比, llama 2023年對(duì)比 GPT3 2020 年),并且這個(gè)差距是在 meta 等企業(yè)無(wú)意持續(xù)擴(kuò)大模型和訓(xùn)練數(shù)據(jù)規(guī)模的情況下產(chǎn)生的。OpenAI 尚且可以憑借先發(fā)優(yōu)勢(shì),保證市場(chǎng)主導(dǎo)地位,而國(guó)內(nèi)公司由于均處于同一出發(fā)點(diǎn),而且在技術(shù)路線(xiàn)上完全跟蹤 OpenAI,因此并不存在一家獨(dú)大的現(xiàn)實(shí)基礎(chǔ)。
當(dāng)然一切仍需由市場(chǎng)、時(shí)間給出答案。美團(tuán)誕生之初,恐怕也很難以預(yù)測(cè)其能成長(zhǎng)為 O2O 的統(tǒng)治者吧。
雷峰網(wǎng):回到“算想未來(lái)”,名字是您取的嗎?有什么樣的含義或者寄予了怎樣的意義?
趙亞雄:一開(kāi)始項(xiàng)目名字叫初芯,大概意思就是說(shuō) AI 的計(jì)算,但是很多人反映聽(tīng)上去像一個(gè)做芯片的公司,就換成了“算網(wǎng)”。
因?yàn)槲覀兪且粋€(gè)云計(jì)算公司,這是“網(wǎng)”代表的含義。那“算”則是對(duì)計(jì)算需求的體現(xiàn)。算網(wǎng)加在一起,代表我們就是一個(gè)做計(jì)算的、一個(gè)云的提供商。因?yàn)樵谖磥?lái)比較長(zhǎng)一段時(shí)期里面,我們相信AI算力需求會(huì)成為人類(lèi)所有的算力需求里面最主流的、最重要的這一部分。算網(wǎng)這個(gè)階段正是要服務(wù) AI 計(jì)算的需求。
我們覺(jué)得“算網(wǎng)”非常順口,但很快因?yàn)檫@個(gè)名字注冊(cè)不到公司和商標(biāo)。團(tuán)隊(duì)一起頭腦風(fēng)暴后有了“算想未來(lái)”這個(gè)名字。
“算想未來(lái)”表達(dá)了我們對(duì)未來(lái) AI 算力需求的愿景,算、想這兩個(gè)字代表以計(jì)算為基礎(chǔ),通過(guò) AI 技術(shù)服務(wù)人們的想象力、創(chuàng)造力。“算想未來(lái)”代表用計(jì)算將人們想象中的未來(lái),變成現(xiàn)實(shí)的使命。
雷峰網(wǎng):以前的職業(yè)生涯對(duì)您此次創(chuàng)業(yè)有什么啟發(fā)和幫助?
趙亞雄:我在 Amazon Kinesis 待了 1 年不到,Google 做了快 6 年,后來(lái)以早期員工身份加入 Pixie 并被 New Relic 收購(gòu)。這些年里我一直在做云基礎(chǔ)設(shè)施、AI基礎(chǔ)設(shè)施相關(guān)的工作,積累了很多經(jīng)驗(yàn)。
例如,參與過(guò)Amazon一個(gè)很有名的云產(chǎn)品 Kinesis;2015年加入Google的Borg團(tuán)隊(duì),負(fù)責(zé) Google 內(nèi)部所有服務(wù)器集群,它類(lèi)似一個(gè) K8S 的平臺(tái);2018 年之后,以我為主在Borg內(nèi)部開(kāi)啟了一個(gè)新項(xiàng)目,即讓 Borg 上面的應(yīng)用開(kāi)發(fā)者,可以更容易地開(kāi)發(fā)管理他自己的業(yè)務(wù),這個(gè)系統(tǒng)用到了機(jī)器學(xué)習(xí)來(lái)優(yōu)化集群管理和資源調(diào)度,同時(shí)也提高了Borg 平臺(tái)上的底層硬件資源的使用效率。
Borg后期的工作,主要的重點(diǎn)都是來(lái)支持機(jī)器學(xué)習(xí)和人工智能,就像網(wǎng)絡(luò)層的話(huà),我們給機(jī)器學(xué)習(xí)這些算力芯片都專(zhuān)門(mén)設(shè)計(jì)了高性能的網(wǎng)絡(luò)。我也直接參與和領(lǐng)導(dǎo)了 Google 內(nèi)部全球化 GPU 算力池的項(xiàng)目,目的是讓 Brain、DeepMind 的 AI 研究者和工程師,非常容易地把機(jī)器學(xué)習(xí)訓(xùn)練任務(wù)跑在全球各地的數(shù)據(jù)中心里。
2019 年作為第四號(hào)員工,正式加入 Pixie初創(chuàng)公司,這個(gè)公司的軟件工程體系是我跟創(chuàng)始人一起,按照 Google 的實(shí)踐經(jīng)驗(yàn)來(lái)搭建的。
具體來(lái)說(shuō),Pixie算是我第一次正式創(chuàng)業(yè),它是一家硅谷初創(chuàng)公司,產(chǎn)品是面向 Kubernetes 的微服務(wù)觀(guān)測(cè)平臺(tái),創(chuàng)新點(diǎn)是用 eBPF(Linux 內(nèi)核中的可觀(guān)測(cè)性 API)實(shí)現(xiàn)無(wú)侵入式的數(shù)據(jù)采集。Pixie 曾獲得頂級(jí) VC Benchmark & GV的投資,并于 2020 年 12 月被應(yīng)用性能監(jiān)控領(lǐng)域的老牌廠(chǎng)商,同時(shí)在紐約證券交易所上市公司 New Relic 收購(gòu)。
其實(shí),Amazon和Google的經(jīng)歷,除了讓我在技術(shù)上得到歷練和積累,更多的是對(duì)我創(chuàng)業(yè)精神的影響。Amazon和Google都是極具創(chuàng)業(yè)文化的公司,在A(yíng)mazon,內(nèi)部每個(gè)團(tuán)隊(duì)都可以作為一個(gè)小的創(chuàng)業(yè)公司,來(lái)定位自己的業(yè)務(wù)方向;而Google鼓勵(lì)員工創(chuàng)業(yè),在員工離職創(chuàng)業(yè)后,想要再加入Google并不需要面試,這給了員工很大的心理保障和激勵(lì)。
雷峰網(wǎng):作為初創(chuàng)公司,我們?cè)趺磁c百度百舸、火山引擎這些大廠(chǎng)的產(chǎn)品來(lái)競(jìng)爭(zhēng)?
趙亞雄:對(duì)于這個(gè)問(wèn)題,我有四個(gè)觀(guān)點(diǎn)可以回答。
第一,也是最重要的點(diǎn),初創(chuàng)企業(yè)勝在小而精悍!初創(chuàng)公司整個(gè)團(tuán)隊(duì)凝成一股勁之后的戰(zhàn)斗力,是很多大廠(chǎng)比不了的。大廠(chǎng)有錢(qián)有資源,也無(wú)法彌補(bǔ)文化和團(tuán)隊(duì)精神上的綿軟和懈怠;畢竟人不是機(jī)器,不是老板說(shuō)一句大家要拼,就能拼得起來(lái)。對(duì)此我在Pixie深有感觸。這也是“算想未來(lái)”的最大的動(dòng)力和信心來(lái)源。
舉個(gè)例子,當(dāng)遇到一個(gè)非常難的一個(gè)技術(shù)問(wèn)題的時(shí)候,創(chuàng)業(yè)公司往往整個(gè)團(tuán)隊(duì)更加執(zhí)著,以及整個(gè)團(tuán)隊(duì)的緊密合作最后得出來(lái)的解決方案,其質(zhì)量遠(yuǎn)高于大廠(chǎng)。
這可以用“木刀”和“鋼刀”來(lái)比喻大廠(chǎng)和初創(chuàng)企業(yè),相比木頭,鋼鐵更鋒利是因?yàn)樗脑馗o密地貼合在一起,密度大。大廠(chǎng)更像是一個(gè)木質(zhì)的機(jī)構(gòu),自然會(huì)面臨組織能力渙散、退化。所以“算想未來(lái)”要解決的就是如何長(zhǎng)期擰成一股繩,保持高戰(zhàn)斗力,跟大廠(chǎng)對(duì)抗,如何能始終保持這種凝聚力,這是我們最核心、最關(guān)鍵要考慮的問(wèn)題。
第二,我們有技術(shù)上的后發(fā)優(yōu)勢(shì)。怎么理解呢?從技術(shù)發(fā)展角度來(lái)看,每次出現(xiàn)一次巨大技術(shù)變革之后,新入局的玩家共同具有的一個(gè)優(yōu)勢(shì),就是可以很容易規(guī)避之前的發(fā)展進(jìn)程中的彎路和各類(lèi)無(wú)效的投入。說(shuō)白了就是相對(duì)于更大、更成熟的廠(chǎng)商,初創(chuàng)公司從一開(kāi)始就能花小錢(qián)辦大事兒。
第三,在大模型帶來(lái)的 AI 計(jì)算需求之前,在所有主流平臺(tái)上的AI需求都不是主流的需求,所以大家對(duì)該問(wèn)題的研究都是很有限的。換句話(huà),今天我們跟他們其實(shí)是處在同一個(gè)起跑線(xiàn)上。
具體到正在做的事情。我們的核心團(tuán)隊(duì)成員都是來(lái)自國(guó)際大廠(chǎng)的infra技術(shù)專(zhuān)家,同時(shí)我們能時(shí)常與 OpenAI、 MSR 、Google、DeepMind這些AI先進(jìn)團(tuán)隊(duì)保持密切交流、合作,從而從各個(gè)層面了解世界前列對(duì) AI 的趨勢(shì)判斷。這是國(guó)內(nèi)以業(yè)務(wù)驅(qū)動(dòng)的 AI 團(tuán)隊(duì)所不能比擬的,因?yàn)槲覀兯私獾男畔⑹冀K比他們要高一個(gè)層次。
第四,我們更多是把AI作為一種改變世界的技術(shù)手段,而不是服務(wù)某項(xiàng)特定業(yè)務(wù)的技術(shù)能力來(lái)看待。所以我們能看到中國(guó)的SaaS實(shí)力不足,過(guò)去中國(guó)經(jīng)濟(jì)發(fā)展實(shí)際上沒(méi)有辦法支持,如美國(guó)那么大規(guī)模的 SaaS 企業(yè),只有AI這樣的技術(shù)工具出現(xiàn),我們才能以更高效的方式來(lái)實(shí)現(xiàn)軟件服務(wù)。
最基本的邏輯是美國(guó)的 SaaS,現(xiàn)在都是以公有云為支撐的數(shù)據(jù)的搬運(yùn)和處理,那它對(duì)數(shù)據(jù)本身的大小處理并沒(méi)有實(shí)質(zhì)性的變化。有了大模型之后,就可以把上TB的數(shù)據(jù)濃縮到幾百G的模型里面,再加上模型還有自學(xué)習(xí)能力,實(shí)際上便可以大大降低軟件服務(wù)在交付功能過(guò)程中,對(duì)數(shù)據(jù)的這個(gè)依賴(lài)程度,如此就能大大提升軟件服務(wù)的效率。
這也是為什么中國(guó)的 SaaS 在國(guó)內(nèi)反而發(fā)展不起來(lái),因?yàn)槭袌?chǎng)給它的空間很有限,但對(duì)它的效率要求又非常高,又沒(méi)有一個(gè)技術(shù)手段,能用更高效率來(lái)實(shí)現(xiàn)這些軟件服務(wù)?,F(xiàn)在有了大模型后,我們意識(shí)到在技術(shù)上用 AI 的通用手段來(lái)實(shí)現(xiàn)軟件服務(wù),會(huì)比傳統(tǒng)的SaaS模式效率更高,而且是可行的。
我們把公司的名字叫做 “算想未來(lái)”,體現(xiàn)的就是我們用 AI + 計(jì)算來(lái)實(shí)現(xiàn)人們想象中的未來(lái)世界的愿景,我們對(duì)AI 價(jià)值的認(rèn)知,比我們接觸到的國(guó)內(nèi)這些大廠(chǎng)或者是其他創(chuàng)業(yè)公司,要走在更前面。我們這個(gè)團(tuán)隊(duì)人員來(lái)自中國(guó)大陸、日本、美國(guó),既有金融背景在高盛待過(guò)的投資人、硅谷大廠(chǎng)的技術(shù)專(zhuān)家、清華基礎(chǔ)科學(xué)班畢業(yè)的人工智能專(zhuān)家,都是圍繞在我們對(duì) AI 經(jīng)濟(jì)未來(lái)的認(rèn)知上的,才能把天南海北、各行業(yè)的頂尖專(zhuān)家聚攏起來(lái)。
最后總結(jié)一下的話(huà),毫不夸張地說(shuō),我每天睡覺(jué)之前都反復(fù)拷問(wèn)自己你問(wèn)的這個(gè)問(wèn)題;我們創(chuàng)始團(tuán)隊(duì)每次都會(huì)專(zhuān)門(mén)花時(shí)間來(lái)一起思考這個(gè)問(wèn)題。頭腦風(fēng)暴啊、假想場(chǎng)景啊等等,大家的共識(shí)就是,困難很大,但是我們這個(gè)團(tuán)隊(duì),就只喜歡做最具挑戰(zhàn)性的事兒。
雷峰網(wǎng):我們的團(tuán)隊(duì)籌備情況如何?
趙亞雄:李靜是我們的COO,她之前在高盛做投后管理,我們的首席科學(xué)家和CTO,他們分別都是在日本和美國(guó)AI 研究和應(yīng)用領(lǐng)域知名的研究機(jī)構(gòu)供職,但現(xiàn)在不方便透露他們的具體身份。
目前我們正在加速籌備完整的團(tuán)隊(duì),同時(shí)也已經(jīng)開(kāi)始跟很多大模型團(tuán)隊(duì)做業(yè)務(wù)探討。我們已經(jīng)在推進(jìn)與國(guó)內(nèi)知名的語(yǔ)言類(lèi) AI 產(chǎn)品供應(yīng)商的合作,來(lái)推進(jìn)幫他們?nèi)绾翁嵘竽P陀?xùn)練,即 GPU的使用效率。
總體上來(lái)說(shuō),我們是一個(gè)進(jìn)展非??斓膱F(tuán)隊(duì),因?yàn)闄C(jī)會(huì)很重要,我們一直是以成為中國(guó) AI IaaS Cloud領(lǐng)導(dǎo)者的目標(biāo)來(lái)快速推進(jìn)。像我的話(huà),基本上從去年 10 月份到現(xiàn)在,每天都是 997 的工作節(jié)奏。
雷峰網(wǎng):您認(rèn)為未來(lái)國(guó)內(nèi)SaaS會(huì)如何發(fā)展?
趙亞雄:因?yàn)镹etflix它是傳統(tǒng)云計(jì)算上的一個(gè)殺手級(jí)應(yīng)用,是伴隨著 AWS 的成長(zhǎng)逐漸長(zhǎng)出來(lái)一個(gè)SaaS產(chǎn)品代表。我們希望未來(lái)在“算想未來(lái)”的平臺(tái)上,也可以生長(zhǎng)出一個(gè)能顛覆現(xiàn)在各類(lèi) To C 互聯(lián)網(wǎng)企業(yè)的,一個(gè)全新的,以 AI為核心的一個(gè)消費(fèi)者應(yīng)用。
(如有意愿與趙亞雄博士溝通交流可加微信:15910236560)。
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。