0
本文作者: 鄭佳美 | 2025-07-17 17:03 |
最近 AI 圈最大的新聞,大約就是 Meta 扎克伯格親自出手、重金招人的消息了。根據(jù)公開信息,如今在小扎親自出手的推動(dòng)下,Meta 已經(jīng)組建起一支堪稱豪華的 AI 戰(zhàn)隊(duì)。
核心領(lǐng)導(dǎo)團(tuán)隊(duì)方面,包括前 Scale AI 創(chuàng)始人 Alexandr Wang(現(xiàn)任 Meta 首席 AI 官)、前 GitHub CEO Nat Friedman,以及 Safe Superintelligence 聯(lián)合創(chuàng)始人 Daniel Gross,三人共同執(zhí)掌 Meta Superintelligence Labs 的戰(zhàn)略與節(jié)奏。
技術(shù)陣容同樣令人矚目。Meta 從 OpenAI 挖來了多位重量級(jí)研究員,包括 GPT-4o 的語音與圖像模塊開發(fā)者 Shuchao Bi 和 Huiwen Chang,“思維鏈”(Chain-of-Thought)技術(shù)代表人物 Trapit Bansal,以及 GPT 系列模型的重要研發(fā)成員 Ji Lin、Shengjia Zhao、Hongyu Ren 和 Jiahui Yu 等人。
而在 OpenAI 之外,Meta 同樣高價(jià)吸引了 Apple 和 DeepMind 的核心人才:包括 Apple Foundation Models 負(fù)責(zé)人 Ruoming Pang(據(jù)稱簽約價(jià)高達(dá) 2 億美元),DeepMind 前研究員 Jack Rae 與 Pei Sun,以及來自 Anthropic 的 Joel Pobar 和 Sesame AI 的 Johan Schalkwyk,也都陸續(xù)加盟。
而網(wǎng)傳 Meta 的最新挖人動(dòng)向,則是他們又成功挖走了 OpenAI 的兩員大將,分別是 Jason Wei 和 Hyung Won Chung。
其中 Jason Wei 曾在 OpenAI 主導(dǎo)參與了 o1/o3 系列模型及 deep research 項(xiàng)目,是強(qiáng)化學(xué)習(xí)的堅(jiān)定擁護(hù)者,同時(shí)也是 2022 年“Emergent Abilities”(涌現(xiàn)能力)概念的開創(chuàng)者之一。他在思維鏈(Chain-of-Thought)等前沿技術(shù)上的貢獻(xiàn)廣受認(rèn)可。而 Hyung Won Chung 同樣是 OpenAI 的核心研究員,深度參與了 o1 系列與 deep research 項(xiàng)目,研究方向主要聚焦于推理能力(reasoning)與智能體(agents)。
據(jù)報(bào)道,目前兩人的 OpenAI 內(nèi)部 Slack 賬號(hào)已被注銷,基本坐實(shí)了離職消息。更驚人的是,據(jù)稱 Meta 為吸引這兩位 AI 頂尖科學(xué)家,直接開出了高達(dá) 3 億美元的四年期薪酬包,可見其對(duì)“超級(jí)智能”戰(zhàn)略的重視與投入之大。
不少人感慨“大廠要拼命了”“AI 人才再次供不應(yīng)求”,但也有人冷靜指出:大家關(guān)注的不是 Meta 的產(chǎn)品愿景、人才密度,而是它開出的高薪。
這就很耐人尋味,為什么我們對(duì)“只要聚集足夠多聰明人就能做出偉大成果”這件事不再那么有信心了?
因?yàn)椋F(xiàn)實(shí)一次次證明:人多、人強(qiáng)≠結(jié)果好。
OpenAI 推出 ChatGPT 時(shí),所有人都關(guān)注它的技術(shù)、以及背后的組織力,但由于當(dāng)時(shí) OpenAI 云集的世界知名大神很多,所以組織力的歸因占比還不算最突出。但在 DeepSeek 這樣一個(gè)神秘又主要凝聚中國本土 C9 高校學(xué)者的團(tuán)隊(duì)冒出后,所有人都無法再忽視這樣的一個(gè)事實(shí):
在像 AGI 這樣的大規(guī)模團(tuán)隊(duì)作戰(zhàn)形式中,個(gè)人能力拔尖不如組織能力拔尖重要。
回顧人工智能的發(fā)展史,曾像 Meta 一樣集結(jié)超多杰出人才的團(tuán)隊(duì)不勝枚舉:MSRA、DeepMind、谷歌、百度、智源……乃至大模型時(shí)代,近兩年騰訊、字節(jié)也都曾組織過各個(gè)方向的杰出人才組成大團(tuán)隊(duì),但最終都要么人才四散而去、要么組織目標(biāo)由高降低、要么做出一兩件大新聞后泯然眾人。
背后的原因眾多,有企業(yè)的文化架構(gòu)問題,有行業(yè)變化影響,但往往也容易出現(xiàn)一個(gè)普遍的現(xiàn)象,即:優(yōu)秀人才之間的離散與斗爭。
最終,強(qiáng)人集合沒有產(chǎn)生加倍的效果,反而天才之間可以互相抵消。
每個(gè)牛人都有一套成熟的認(rèn)知系統(tǒng)、經(jīng)驗(yàn)路徑和話語權(quán)構(gòu)建邏輯,而偉大的突破往往來自對(duì)路徑的反常識(shí)性挑戰(zhàn)。如果組織沒有“容錯(cuò)機(jī)制”,牛人越多,分歧越大,行動(dòng)越慢。
一群彼此不服、各自為營的聰明人湊在一起,容易像一場永不散場的學(xué)術(shù)討論會(huì),而不是一個(gè)能落地的工程團(tuán)隊(duì)。
DeepSeek 是一個(gè)有意思的反例。它沒有明星科學(xué)家,沒有學(xué)術(shù)巨擘撐場,成員年輕,團(tuán)隊(duì)規(guī)模?。ɑA(chǔ)研究員在 150 人左右)、扁平化、沒有打卡、沒有層層 KPI 管理,創(chuàng)始人親自下場擼代碼,文化更像一個(gè)純粹的研究小組。
直到推出 V3,外界還認(rèn)為它只是在“巨人肩膀上摘果子”,但當(dāng) R1 發(fā)布、實(shí)現(xiàn)推理性能超越時(shí),它直接被推到了行業(yè)第一梯隊(duì)。
DeepSeek 的成功,并不是因?yàn)樗麄儭氨葎e人更聰明”,而是因?yàn)樗麄儭氨葎e人更敢干、更能協(xié)同”。從組織的角度來看,DeepSeek 幾乎反其道而行:
極致扁平:沒有層層結(jié)構(gòu),沒有 KPI 內(nèi)卷,反而激發(fā)了探索欲。
投入純粹:大家都在搞基礎(chǔ)研究,不用分心“交付”“商業(yè)”“報(bào)表”。
執(zhí)行高效:一群動(dòng)手能力超強(qiáng)的人每天都在干正事,不在做匯報(bào)。
認(rèn)知一致:沒有“上下級(jí)權(quán)威差”,只有“想清楚再動(dòng)手”的共識(shí)。
對(duì)比之下,過去兩年,字節(jié) Seed 的團(tuán)隊(duì)曾一度多達(dá) 1000 人,大模型創(chuàng)業(yè)公司的基礎(chǔ)模型團(tuán)隊(duì)雖控制在一百來人的規(guī)模、但同樣要背負(fù)商業(yè)交付與產(chǎn)品支持的壓力,因此難以構(gòu)建起“高信任、低管理、強(qiáng)動(dòng)機(jī)”組織模型。最終,DeepSeek 的第一輪勝出,幾乎是注定的。
我們很容易陷入“能力總和論”陷阱:覺得一個(gè)組織的戰(zhàn)斗力 = 每個(gè)人的能力總和 × 工作時(shí)間。但事實(shí)更接近于:組織戰(zhàn)斗力 = 協(xié)同效率 × 方向一致性 × 持續(xù)穩(wěn)定性。
換句話說:牛人越多,協(xié)同越難,任務(wù)越復(fù)雜,扁平化越重要。
所有大廠與模型團(tuán)隊(duì)的人都在看下一輪基礎(chǔ)模型的競爭力,一種直覺的觀點(diǎn)認(rèn)為:大廠同樣不缺人、不缺錢、不缺卡甚至不缺場景與數(shù)據(jù),戰(zhàn)斗力也不應(yīng)該低于 DeepSeek。但如果將不同團(tuán)隊(duì)的研究日常作對(duì)比,就不難發(fā)現(xiàn),實(shí)際上純以 AGI 為研究目標(biāo)的團(tuán)隊(duì)與復(fù)雜大廠之間的差距。
如果將人才的能力水平從 0 到 100 分劃分,單人每天平均研究投入時(shí)間為 0 到 14 個(gè)小時(shí),那么人才組織與產(chǎn)出的公式就可以清晰轉(zhuǎn)化為效率的乘積:
假設(shè)在 DeepSeek 團(tuán)隊(duì)中,專注基礎(chǔ)研究的年輕博士能力可以打 70-80 分,Top 大模型研究選手如張正彥這樣基礎(chǔ)理論與實(shí)踐能力兼具的研究員是 100 分,那么 DeepSeek 的整體平均水平約為 85 分。同時(shí) DeepSeek 沒有商業(yè)化壓力,150 人團(tuán)隊(duì)可以每天平均集中投入 12 個(gè)小時(shí)做基礎(chǔ)研究。
對(duì)比一個(gè)千人研究團(tuán)隊(duì)的大廠,基礎(chǔ)研究人員與工程師的戰(zhàn)斗力由高到低不等,加上大團(tuán)隊(duì)意味著管理壓力大,算平均值 60 分。且由于要花時(shí)間做商業(yè)化交付與應(yīng)用產(chǎn)品支持,1000 人的團(tuán)隊(duì)平均每人每天可能最多只能投入 6 個(gè)小時(shí)做基礎(chǔ)研究。
那么基礎(chǔ)研究總投入來看,DeepSeek 與大廠的對(duì)比實(shí)際是:150*85*12 VS 1000*60*6。
除了客觀可量化的投入,組織效率、協(xié)同成本、執(zhí)行張力這些更難量化的變量,也是決定戰(zhàn)斗力的關(guān)鍵。
如果 DeepSeek 擁有近乎滿分的執(zhí)行效率,記作 1.0,而大廠在目標(biāo)分散、協(xié)作鏈條冗長等影響下,組織效率只有 0.2,那最終真正釋放出來的有效產(chǎn)出會(huì)是:
DeepSeek:153000 × 1 = 153000
大廠團(tuán)隊(duì):360000 × 0.2 = 72000
如此來看,其實(shí)不難發(fā)現(xiàn) Deepseek 在基礎(chǔ)問題的研究投入與產(chǎn)出預(yù)期上,實(shí)際上是比大廠要多得多。
這也就解釋了,為什么 DeepSeek 一個(gè) 150 人的小團(tuán)隊(duì),反而能做出一鳴驚人的成果,而一些大廠的千人團(tuán)隊(duì),卻因?yàn)榻M織結(jié)構(gòu)復(fù)雜、任務(wù)重心分散,反而削弱了在基礎(chǔ)研究上的真實(shí)投入。
再次回到 Mate 花大錢買人的這個(gè)事情上,其中有一個(gè)非常容易被忽視的變量:動(dòng)機(jī)的成分到底是什么?
Meta 的超高薪能買來聰明人,但買不來“持續(xù)愿意干活”的動(dòng)機(jī)。DeepSeek 為什么讓人愿意拼 14 個(gè)小時(shí)?不是因?yàn)殄X給得最多,而是因?yàn)樵妇罢鎸?shí)、結(jié)構(gòu)自由、成果看得見。
如果動(dòng)機(jī)只建立在薪水上,個(gè)體會(huì)進(jìn)入“被動(dòng)等待回報(bào)”的狀態(tài),但如果動(dòng)機(jī)來自共創(chuàng)、掌控感和對(duì)問題的真實(shí)興趣,反而會(huì)激發(fā)內(nèi)驅(qū)。
而 Meta、Google 等大型科技公司的問題在于——他們的組織系統(tǒng)已經(jīng)高度僵化,即使有牛人加入,也只能發(fā)揮一小部分。
除了被忽視的動(dòng)機(jī)成分外,人們也經(jīng)常會(huì)誤解“創(chuàng)新”是由最聰明的人做出來的。但其實(shí),創(chuàng)新更多發(fā)生在邊緣人群、結(jié)構(gòu)松散的小團(tuán)隊(duì)中。
另一個(gè)容易被忽視的客觀事實(shí)是:隨著人工智能的發(fā)展時(shí)間拉長、各種開源技術(shù)的發(fā)展,AGI 的知識(shí)門檻也在不斷降低——這就意味著,十年前只有 AI 技術(shù)大牛才能研究出來的算法,如今一個(gè) 985 高校的碩博生沉下心來也能鉆研明白、探究清楚,并提出大膽的改進(jìn)設(shè)想了。
據(jù) AI 科技評(píng)論了解,即使是 Transformer 這樣的權(quán)威主流架構(gòu),國內(nèi)的 MiniMax、Rock AI 等團(tuán)隊(duì)在敢于修改注意力機(jī)制后也能取得較大的創(chuàng)新,且在這些團(tuán)隊(duì)中主導(dǎo)架構(gòu)修改的研究人員都并非以往行業(yè)追捧的頂級(jí)技術(shù)明星。
這也是 DeepSeek 給整個(gè)行業(yè)的啟示:與其追求明星團(tuán)隊(duì),不如追求執(zhí)行團(tuán)隊(duì);與其拼大模型預(yù)算,不如拼問題沉淀和反饋機(jī)制;與其堆博士、挖大牛,不如形成一個(gè)真正愿意彼此合作、共同思考的小集體。
回到問題本身,雷峰網(wǎng)認(rèn)為或許 Meta 很難復(fù)制 DeepSeek。不是說 Meta 沒有足夠的錢,而是 Meta 已經(jīng)不是一個(gè)“可變”的組織。
DeepSeek 是一個(gè)不斷試錯(cuò)的小機(jī)器,相比之下 Meta 就是一個(gè)巨型飛輪,一旦啟動(dòng),就很難偏航。組織的慣性,才是最難被打敗的東西。
Meta 的高薪策略背后,其實(shí)反映出一種焦慮:他們需要重建早期 OpenAI 的文化,但用的是“招聘+績效+話語權(quán)”的老一套工具。這套系統(tǒng)能招來人,但無法召喚真正的協(xié)作精神。
歸根結(jié)底,人工智能行業(yè)目前最迫切的或許是打破“聰明人多就能贏”的迷信——聰明人當(dāng)然重要,但關(guān)鍵是這些聰明人能不能真正協(xié)同起來,有沒有共識(shí),有沒有足夠多的自由去試錯(cuò),甚至是有沒有愿意親自寫代碼的創(chuàng)始人... ...
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))認(rèn)為在這輪 AI 創(chuàng)新浪潮中,組織的重構(gòu)能力可能比模型的進(jìn)步還要重要。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。