丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給齊鋮湧
發(fā)送

0

AI 的下一個(gè)戰(zhàn)場(chǎng):小模型崛起

本文作者: 齊鋮湧   2025-09-05 21:13
導(dǎo)語(yǔ):AI不止是飄在空中的華麗愿景,是真能鉆進(jìn)工廠,或者普惠大眾的落地好產(chǎn)品。

過(guò)去一段時(shí)間,大模型行業(yè)經(jīng)歷了一場(chǎng)風(fēng)切變。

八月初,騰訊官宣“混元系列小模型”落地,不久后,阿里跟進(jìn)了兩款通義Qwen3-4B。

起初,大家以為只是國(guó)內(nèi)大廠對(duì)轟,互秀肌肉罷了。

幾天后,劇情愈演愈烈,大洋彼岸的 OpenAI 也加入戰(zhàn)斗,破天荒開(kāi)源gpt-oss-20B等兩款模型,同樣聚焦在小模型上。

頭部玩家們?nèi)绱苏R劃一的舉動(dòng),很難讓人不浮想翩翩:

在大集群訓(xùn)練、大集群部署之外,小模型要重回舞臺(tái)中央。

 

01

小模型重回大眾視野

小模型不是一個(gè)新名詞。

但這次回歸的,不是停留在論文上的小模型,而是真正落地在終端的小模型。

在2020年 GPT-3 發(fā)布之前,全世界都在訓(xùn)小模型,只不過(guò)大多數(shù)小模型成果,都在論文里或者實(shí)驗(yàn)室里,屬于普羅大眾眼里紙上談兵的“小模型”。

但 GPT-3 連帶著ChatGPT橫空出世,從學(xué)術(shù)界出圈,成為了人工智能領(lǐng)域史詩(shī)級(jí)的商業(yè)化產(chǎn)品。

有了資本加持,人工智能的發(fā)展從「大煉模型」邁入了「煉大模型」時(shí)代。

2021年到2024年,AI的技術(shù)路線(xiàn)可以總結(jié)成五個(gè)字:大力出奇跡”。

堆數(shù)據(jù),堆算力,打補(bǔ)丁,改prompt,以及做post training的大模型思路,成了人工智能的正統(tǒng),小模型至此徹底被雪藏了。

但去年底,OpenAI 的前首席科學(xué)家 Ilya Sutskever 正式預(yù)警:「數(shù)據(jù)壓榨到頭了」。

大家逐漸意識(shí)到,數(shù)據(jù)會(huì)枯竭,算力永遠(yuǎn)不夠。

于是今年開(kāi)始,大模型領(lǐng)域玩家開(kāi)始分化。

除了一部分頭部玩家仍追隨 OpenAI 的腳步,死磕大參數(shù)基模外,剩下很多燒不起錢(qián)的玩家開(kāi)始轉(zhuǎn)頭擁抱應(yīng)用端。

然而,在這兩個(gè)主流之外,還有一小撮“非共識(shí)”的玩家,把目光落在了小模型上。

但這次,不少創(chuàng)業(yè)公司重新拾起的小模型,和文章開(kāi)頭提到ChatGPT出現(xiàn)前十年間停留在論文上的小模型完全不一樣。

它們是真正落地在終端的小模型,并且有了另一個(gè)名字:

端側(cè)小模型或端側(cè)智能。

 

02

嶄露頭角的端側(cè)小模型公司們

今年以來(lái),不少端側(cè)小模型已經(jīng)開(kāi)始嶄露頭角了。

前一段的WAIC上,西門(mén)子MindSphere展臺(tái)上圍滿(mǎn)了專(zhuān)業(yè)觀眾。

大家正在看一個(gè)展臺(tái)上一個(gè)小于50MB的端側(cè)部署小模型,它能夠預(yù)測(cè)現(xiàn)場(chǎng)的三臺(tái)沖壓設(shè)備故障,并發(fā)出警報(bào)。

在這之前,車(chē)間里沖壓機(jī)床只有累到趴窩才會(huì)被工人察覺(jué),緊接著就需要停擺檢修,造成全車(chē)間流水線(xiàn)暫停,帶來(lái)巨大人力和財(cái)力損失。

因此在沖壓機(jī)床出故障前,預(yù)警功能就非常重要。

面對(duì)這樣的小場(chǎng)景,大模型算力再?gòu)?qiáng),moe結(jié)構(gòu)設(shè)計(jì)再精妙,也無(wú)法處理。

但這樣一個(gè)精準(zhǔn)的端側(cè)小模型,就能夠輕松應(yīng)對(duì)。

這就是落地在終端小模型的冰山一角。

在這條窄路上前進(jìn)的,還有一些獨(dú)角獸公司,比如base北京的AI初創(chuàng)公司面壁智能。

之所以關(guān)注這家企業(yè),是因?yàn)檫@家公司今年五月的一次成功融資。

在DeepSeek大火后,國(guó)內(nèi)大模型公司融資難度堪比抵地獄級(jí)。一方面是行業(yè)共識(shí)認(rèn)為大模型已收斂,另一方面,有DeepSeek珠玉在前,你實(shí)在太難說(shuō)服投資人為什么要投你了。

但面壁智能卻能持續(xù)拿到融資。

我問(wèn)了很多業(yè)內(nèi)人士,得到一個(gè)答案,關(guān)鍵在于它早早找到了自己的道路:小模型。

AI 科技評(píng)論獨(dú)家知悉,就在這幾天,面壁的全體員工,收到了一封特殊的“內(nèi)部信”。

郵件來(lái)自公司決策層,借著公司三周年周慶,高層向全體員工回答了一個(gè)問(wèn)題:為什么公司從大模型切入,卻all in 端側(cè)小模型?

郵件講述了一些底層思考,內(nèi)容非常爆炸,即使是外人看來(lái),也能從一家AI初創(chuàng)公司的生存視角,有所收獲。

按照郵件內(nèi)的時(shí)間節(jié)點(diǎn)描述,面壁智能的創(chuàng)立初期是100%堅(jiān)定大模型方向的。

它的創(chuàng)立時(shí)間是2022年,甚至早于DeepSeek。

創(chuàng)始團(tuán)隊(duì)出身于清華系,來(lái)自清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室。

在創(chuàng)立之前,面壁的創(chuàng)始團(tuán)隊(duì)就主力參與北京智源人工智能研究院的“悟道”,從時(shí)間來(lái)看,面壁智能應(yīng)該吃到一波融資的紅利,但我們先去分析過(guò),國(guó)內(nèi)的AI 科技 VC 有一些路徑依賴(lài),更愿意選擇一些“曾經(jīng)打過(guò)勝仗的連續(xù)創(chuàng)業(yè)者”,導(dǎo)致面壁智能雖然起的大早,但并沒(méi)有成為資本的寵兒,而是靠自己硬拚出來(lái)的天地。

2022-2023年間,面壁一直在死磕大模型,當(dāng)初他們的愿景是做出平民版大模型,我們?cè)?jīng)寫(xiě)過(guò)稿件,認(rèn)為他是國(guó)內(nèi)和DeepSeek愿景最類(lèi)似的公司。

當(dāng)然,面壁也做出了不少成績(jī),比如訓(xùn)練出多個(gè)百億、千億參數(shù)規(guī)模的大模型。

轉(zhuǎn)折點(diǎn)發(fā)生在2023 年。

2023年,隨著 Llama 開(kāi)源,眾多資本涌入,那一年里,大模型的創(chuàng)業(yè)公司增加到了十幾家。

面壁智能迅速發(fā)現(xiàn),千億大模型燒錢(qián)太快,并且商業(yè)化方面難以落地,于是果斷選擇了調(diào)整戰(zhàn)略,決定轉(zhuǎn)向訓(xùn)練參數(shù)規(guī)模更小、算力更低、但性能更強(qiáng)的端側(cè)模型。

轉(zhuǎn)型之初,面壁并不容易。

一方面,端側(cè)智能算是在黑暗中摸索,另一方面,市場(chǎng)上噪音很多,比如DeepSeek V3 以少勝多的戰(zhàn)役,也曾讓面壁的創(chuàng)始人懷疑,如果堅(jiān)持不轉(zhuǎn)型,是否自己也有機(jī)會(huì)在大模型上攀上一座高峰。(后續(xù)的行情,證明面壁智能果斷轉(zhuǎn)型是明智的)

但彼時(shí),面壁已經(jīng)全盤(pán)all in 端側(cè)小模型,已經(jīng)失去驗(yàn)證“更低成本訓(xùn)練更強(qiáng)大模型”的機(jī)會(huì)了。

好在小模型并不是邪修,面壁團(tuán)隊(duì)迅速在端側(cè)小模型賽道找到感覺(jué),有了一些自己的思路。

 

03 想成為端側(cè)小模型的“開(kāi)拓者”,并不容易

 

從時(shí)間上看,面壁智能不僅比文章開(kāi)頭提到的“混元”和“通義Qwen3”更早開(kāi)啟小模型的探索,并且在端側(cè)探索上,幾乎是領(lǐng)先行業(yè)一年半的身位。

提前一年半的布局,讓面壁有不少成果。

第一是模型層面,面壁的端側(cè)模型被稱(chēng)為小鋼炮 MiniCPM系列。

至今已經(jīng)完成多次迭代,最新的是上周開(kāi)源的 minicpm v4.0 ,一款 8B 能做到5%的極高稀疏度,端側(cè)能跑長(zhǎng)文本、深思考,另一款 0.5B 更是能適配非常多的終端場(chǎng)景,能做到手機(jī)端持續(xù)、穩(wěn)定可用,還不發(fā)熱。

再加上此前做在視覺(jué)及實(shí)時(shí)語(yǔ)音對(duì)話(huà)等優(yōu)化,面壁智能的端側(cè)模型,完全能實(shí)現(xiàn)在iPad上進(jìn)行多模態(tài)直播,這意味著,它的使用場(chǎng)景變得異常豐富。

從麥當(dāng)勞的點(diǎn)餐機(jī)器人,到政府行政服務(wù)中心的服務(wù)機(jī)器人,再到兒童陪伴玩具都能完全能夠勝任。

除了技術(shù)層面的突破,還有一些學(xué)術(shù)和開(kāi)源成果。

上個(gè)月《Nature Communications》正式收錄了面壁智能此前發(fā)布的一項(xiàng)關(guān)于新模型 MiniCPM-V 的研究成果系列。

其中包括一個(gè)OpenCompass 評(píng)分中超越 GPT-4V(2023.11.16 版本)的80 億參數(shù)模型。

開(kāi)源方面,面壁智能的小鋼炮 MiniCPM 系列是2024 年 Hugging Face 最多下載、最受歡迎中國(guó)大模型,截至目前全平臺(tái)下載量累計(jì)破 1000 萬(wàn),能看到一定的使命感在里面。

除去技術(shù)層面和學(xué)術(shù)等層面,但真正能讓大家直觀感受的,還是落地到現(xiàn)實(shí)世界的場(chǎng)景。

社交媒體上經(jīng)常有一些同類(lèi)型的問(wèn)題,為什么都說(shuō)大模型能力早早超越人類(lèi),但遲遲沒(méi)看到驚艷的落地場(chǎng)景?

答案在于大模型的能力,需要高性能云服務(wù)器才能發(fā)揮出來(lái)。

但大家平時(shí)生活中使用的手機(jī),平板汽車(chē)等設(shè)備,都是算力非常有限的設(shè)備。

這類(lèi)型設(shè)備有一個(gè)學(xué)名,叫做“邊端算力場(chǎng)景”。

而這正是眾多小模型廠家的主場(chǎng)。

繼續(xù)拿面壁智能舉例。和需要調(diào)用各種云端超高算力的大模型不一樣,面壁的小鋼炮系列模型,能在消費(fèi)級(jí)顯卡上流暢運(yùn)行。

這就意味著手機(jī),個(gè)人電腦,汽車(chē),機(jī)器人,甚至是剛才提到的工廠環(huán)境,以及一些涉密的政府部門(mén)等等都可以部署。

“不僅把模型的配置門(mén)檻打下來(lái)了,使用場(chǎng)景還變得更豐富了”。

在面壁智能的內(nèi)部信上,也提到了這些場(chǎng)景。

首先是汽車(chē)場(chǎng)景,面壁智能?chē)@著智能座艙,發(fā)布了一個(gè)以 MiniCPM 模型為核心汽車(chē)助手 cpmGO 。

我查了一下,這是業(yè)界第一個(gè)純端側(cè)的智能座艙。(雷峰網(wǎng))

目前 cpmGO ,已經(jīng)與長(zhǎng)安、上汽大眾、長(zhǎng)城、吉利、廣汽等車(chē)企談完合作了。

不出意外,第一款量產(chǎn)車(chē)會(huì)落在今年三季度即將上市的網(wǎng)紅車(chē)款長(zhǎng)安馬自達(dá) MAZDA EZ-60 上。

不止是車(chē)企,面壁還與高通、英特爾、聯(lián)發(fā)科技、梧桐車(chē)聯(lián)、德賽西威、中科創(chuàng)達(dá)、安波福等做了深度適配,正在推動(dòng)下一代智能座艙的誕生。

這一點(diǎn),面壁高層非常重視,根據(jù)內(nèi)部信的內(nèi)容,面壁今年為此特地成立了汽車(chē)業(yè)務(wù)線(xiàn),目標(biāo)非常簡(jiǎn)單粗暴:

“將MiniCPM 搭載到更多汽車(chē)上”。

從某種意義上,面壁確實(shí)在端側(cè)的技術(shù)探索和實(shí)踐落地上,在努力成為行業(yè)開(kāi)拓者的角色。

 

最后,當(dāng)我們?cè)趯?xiě)這篇文章的時(shí)候得知,前面提到那個(gè)西門(mén)子展臺(tái)的沖壓機(jī)床預(yù)警小模型,經(jīng)過(guò)幾個(gè)月的真實(shí)產(chǎn)線(xiàn)的數(shù)據(jù)訓(xùn)練,預(yù)測(cè)準(zhǔn)確率已經(jīng)提升到89%,隨著時(shí)間積累,準(zhǔn)確度還在不斷提高中。

與此同時(shí),面壁智能的全體員工,也在對(duì)這份內(nèi)部信進(jìn)行了深度復(fù)盤(pán)。

過(guò)去,大模型領(lǐng)域在資本的加持下,蒙眼狂奔,讓我們誤以為 AGI 很快會(huì)到來(lái),不做大模型就是原罪。

但當(dāng)頭部大模型企業(yè)開(kāi)始進(jìn)入瓶頸期,我們也冷靜下來(lái)才逐漸看到,有那么多端側(cè)小模型企業(yè),正在腳踏實(shí)地去思考人類(lèi)到底喜歡什么,大眾到底需要什么,然后反推出背后的技術(shù)路線(xiàn),做出小而美的落地產(chǎn)品。

它們值得被看到。(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

 


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

AI 的下一個(gè)戰(zhàn)場(chǎng):小模型崛起

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)