0
這是2025年開年最火的科技明星,短短幾天時(shí)間,梁文鋒從小到大的種種過往都被展現(xiàn)在世人眼前,包括他來不及裝修的新房以及在房子里睡覺用的帳篷,都成為了他獨(dú)特個(gè)性的象征。
獨(dú)特個(gè)性固然為人津津樂道,但并不是成功的關(guān)鍵,這個(gè)籍籍無名的大學(xué)生,在過去的十幾年中所能倚靠的,只有他的思想和能力。
所有人都好奇這樣一個(gè)問題,為什么是梁文鋒做出了DeepSeek?這其中固然有時(shí)代的因素,以及他本人迥異于其他大模型研究者的個(gè)人經(jīng)歷。但AI科技評(píng)論認(rèn)為,理解梁文鋒是個(gè)什么樣的人,才是理解這個(gè)問題的關(guān)鍵。
找人才不需要標(biāo)簽
獵頭都覺得,幫梁文鋒的公司找人太不容易了。
一位從21年開始就與幻方深度合作的獵頭告訴雷峰網(wǎng),招人招得讓他“想哭”,因?yàn)殡y度太高了。
“清華本博,六篇頂會(huì),你覺得肯定沒問題了吧,哎,怎么簡(jiǎn)歷直接掛了;一個(gè)清華本科的MIT博士,第二輪面試就被淘汰了?!?/p>
如果要在大廠內(nèi)部找候選人,他認(rèn)為,幻方和DeepSeek基本上不會(huì)對(duì)標(biāo)國內(nèi)公司,他們只會(huì)對(duì)標(biāo)Google和Meta這樣的海外大廠。
另外一位獵頭一談到DeepSeek也是忍不住頭大,“太挑剔了,推過一個(gè)在字節(jié)績(jī)效非常好的年輕中層,聊了之后沒過。我就很奇怪,去問他們,給我的回答是,這個(gè)人對(duì)AI沒有熱情。人家都是做過一些AI Agent相關(guān)的項(xiàng)目了,一般是不太會(huì)說這樣的評(píng)價(jià)的?!?/p>
梁文鋒對(duì)人才沒有標(biāo)簽,不論學(xué)歷背景,不論過往業(yè)績(jī),他只看這個(gè)人的個(gè)人能力和個(gè)人素質(zhì)。
極高的人才門檻,造就了如今的DeepSeek。在國內(nèi)的大模型團(tuán)隊(duì)中,DeepSeek的人才厚度可能不足以跟頂尖公司相提并論,但是人才密度絕對(duì)可以說得上是第一檔。
留住這些人才,除了DeepSeek的高薪酬外,還有充分尊重創(chuàng)意與idea的管理模式。“無固定團(tuán)隊(duì)、無匯報(bào)關(guān)系、無年度計(jì)劃”與其說是管理,不如說是信任。《奈飛文化手冊(cè)》一書曾經(jīng)說過,“優(yōu)秀的同事和艱巨的挑戰(zhàn)是吸引人們來公司工作的最大因素”。對(duì)AI從業(yè)者而言,再?zèng)]有比AGI更艱巨的挑戰(zhàn)了。
做最難的事,就要找到最好的人,給出充足的資源與信任。得到信任的頂級(jí)人才往往會(huì)帶來巨大的爆發(fā)力,這一理論可以在抖音崛起中得到印證。
在2018年春節(jié)期間,抖音日新增用戶超過千萬量級(jí)。一位負(fù)責(zé)增長(zhǎng)的產(chǎn)品經(jīng)理曾提及,這個(gè)增長(zhǎng)項(xiàng)目完全沒有績(jī)效壓力,而且向財(cái)務(wù)發(fā)了一封郵件,他的賬戶中就多出了上億元的投放預(yù)算。他當(dāng)時(shí)就意識(shí)到,“這樣的團(tuán)隊(duì),做啥打不贏呢?”
DeepSeek也是同理。被篩掉簡(jiǎn)歷的人,一定不是學(xué)歷問題;面試通不過,肯定也不是能力問題;人才的需求集中為一句話就是,這個(gè)人是可以被信任一同為AGI努力的人嗎?
這就是DeepSeek的人才觀,理解了這種人才觀,就是理解梁文鋒的第一步。
極簡(jiǎn)主義的世界觀
盡管做了多年量化,但是梁文鋒并不認(rèn)為自己是個(gè)做金融的,他對(duì)自己的看法是,“我是做AI的,只不過做的是量化場(chǎng)景”。
幾乎所有與梁文鋒交流過的人,都說出他是一個(gè)不會(huì)受到外界干擾的人,“他的思維方式極其純粹,特別注重第一性原理”,“說話很慢”,“一開口就切中要害”。
量化投資的特性恰好契合了他這種極簡(jiǎn)主義的風(fēng)格——它不需要與復(fù)雜的上下游產(chǎn)業(yè)鏈打交道,只需專注于純粹的市場(chǎng)數(shù)據(jù)。
時(shí)至今日,梁文鋒依然常常沉浸在自己的技術(shù)世界中,專注于解決問題。比如做大模型這件事,他會(huì)告訴別人,“想清楚了就能干,只要有卡就行”,其他困難不在考慮范圍之內(nèi)。
對(duì)待金錢也是如此。錢就是用來投資,或者做慈善事業(yè)的,只要能花在合適的地方,虧損并不值一提。
2023年底,曾有一個(gè)旨在扶助聾啞人士的手語大模型項(xiàng)目,為了拉投資找到了梁文鋒。梁文鋒提出,這個(gè)項(xiàng)目的優(yōu)點(diǎn)是公益性突出,缺點(diǎn)是市場(chǎng)規(guī)模有限,其中的隱患是,這是一個(gè)Top高校大學(xué)生團(tuán)隊(duì)的項(xiàng)目,他們可能不會(huì)長(zhǎng)期堅(jiān)持。
盡管極有可能得不到任何回報(bào),他仍然提出,只要團(tuán)隊(duì)愿意繼續(xù)推進(jìn)項(xiàng)目,他就愿意投入。
過去梁文鋒每年會(huì)拿出5億元用于投資或慈善上,現(xiàn)在他把這筆錢花在了DeepSeek上。炒股是為了掙錢,投入大模型是為了AGI,僅此而已。
DeepSeek有將近兩萬張卡,他對(duì)算力極其慷慨,對(duì)上述的手語大模型團(tuán)隊(duì),他就承諾過,算力集群會(huì)隨時(shí)向他們開放。但是他又有點(diǎn)“小氣”,對(duì)這近兩萬張卡的利用率要求很高,力求打滿,不要空轉(zhuǎn)。
這兩種行為看似矛盾,如果按照極簡(jiǎn)主義的觀點(diǎn)來解釋,那就行得通了:卡的存在就是為了用的,能用盡用,萬勿浪費(fèi)。
不以商業(yè)化為限
沒花一分錢投放費(fèi)用,DeepSeek的App只用7天時(shí)間就得到了一個(gè)億用戶,對(duì)這一奇跡般的增長(zhǎng),梁文鋒怎么看? 有投資人在春節(jié)期間專門問了梁文鋒這個(gè)問題,但是梁文鋒看起來對(duì)這么大的流量根本毫不在意,投資人得到的回答是,“這距離AGI的路還很遠(yuǎn)”。
這并不是梁文鋒在故作姿態(tài)。據(jù)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))了解,DeepSeek只安排了兩三個(gè)人負(fù)責(zé)App維護(hù)、對(duì)話網(wǎng)頁開發(fā)、以及充值后臺(tái)的管理工作。所以它不好用是正常的。
DeepSeek在B端市場(chǎng)的種種事跡,流傳更廣。比如此前他們的私有化部署定價(jià)僅為45萬元,其中不僅包含一臺(tái)H20或910b的使用權(quán),還附贈(zèng)大模型服務(wù),使用期限為一年。而同樣的價(jià)格,在華為云上僅僅只能租到 910b一年的使用權(quán),這也就意味著 DeepSeek 的大模型近乎免費(fèi)提供。
私有化部署不掙錢,DeepSeek也不在乎靠API掙不掙錢。一位對(duì)接DeepSeek的大廠員工吐槽它有一種“愛用不用”的氣質(zhì),總是很難用,總是不調(diào)整。
再大的客戶和調(diào)用量,都不值得另眼相看。一切大廠在高峰期都要排隊(duì),用戶體驗(yàn)很差。大客戶的反饋也很多,要求DeepSeek擴(kuò)容擴(kuò)容再擴(kuò)容,至少回應(yīng)流暢一些,不要兩次請(qǐng)求就有一次失敗,特別是在客服場(chǎng)景上,這種失敗幾乎不能忍受。
外界喧喧囂囂,不過梁文鋒看起來并不是很在意這件事情。
這位大廠員工與DeepSeek員工私下交流過怎么改善這個(gè)問題,他得到的回答是,梁文鋒認(rèn)為,大廠完全有能力自己想辦法解決請(qǐng)求失敗的問題,他們應(yīng)該自己給自己兜底,而不是過度依賴 DeepSeek來保障服務(wù)。
這個(gè)回答簡(jiǎn)直要把他給氣笑了,“我們可是DeepSeek的Top級(jí)客戶?!?/p>
可以說,現(xiàn)在的梁文鋒不在乎商業(yè)化的一切可能。
在不少團(tuán)隊(duì)投入到應(yīng)用的今天,梁文鋒曾經(jīng)跟一個(gè)好友說過,“你不要一直去看應(yīng)用和行業(yè)落地的事情,你現(xiàn)在去看只能把你自己禁錮住了,因?yàn)闆]有到時(shí)候,現(xiàn)在想的一切都是錯(cuò)的。而且你在錯(cuò)誤的路上你還投入了更多時(shí)間、精力和錢?!?/p>
這是對(duì)好友的忠告,也是自己的踐行。將精力投入到應(yīng)用上,投入到商業(yè)化上,對(duì)梁文鋒來說,不論做什么,都是一條錯(cuò)誤的道路。
而正確的道路從來只有一條,他現(xiàn)在已經(jīng)走在了正確的道路上。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。