0
本文作者: 林覺民 | 2022-07-19 15:05 | 專題:2022年人物群像作品 |
作者 | 林覺民
編輯 | 王亞峰
總有些人,讓我們熱淚盈眶。
不知道現(xiàn)在的年輕人還玩不玩豆瓣,他們應(yīng)該不會(huì)知道,豆瓣是最先提出“推薦引擎改變世界”這句口號(hào)的公司。
不過,他們對(duì)中國頭號(hào)文藝青年+理想主義者“豆瓣阿北”或許還有印象。
阿北(楊勃)1998年加入發(fā)明計(jì)算機(jī)的IBM做顧問科學(xué)家,兩年后出來參加了一個(gè)Python郵件組,并且從中發(fā)掘出積極分子洪強(qiáng)寧。
豆瓣阿北
2005年底,阿北創(chuàng)辦豆瓣后,打算將洪強(qiáng)寧拉入伙,于是給他出了一道解BUG的面試題,洪強(qiáng)寧用Python完成后成為豆瓣2號(hào)員工。
洪強(qiáng)寧對(duì)雷峰網(wǎng)回憶過當(dāng)日見面的場景:“哈哈,阿北原來是用Java的,但是做豆瓣時(shí)他說自己恨死Java了,所以我們豆瓣一開始就用Python。”他后來主動(dòng)降薪加入豆瓣,做到首席架構(gòu)師,也是中國早期杰出的Python布道者。
在拿到融資前,整個(gè)豆瓣就阿北一個(gè)老板帶著洪強(qiáng)寧一個(gè)正式員工(負(fù)責(zé)社區(qū)管理的Brant當(dāng)時(shí)還是兼職),兩人每周在咖啡館見面一次,聊到深更半夜,然后各自回家干活,直到2006年6月他們才搬到北京798藝術(shù)區(qū)旁邊的辦公室里。
網(wǎng)上一直盛傳豆瓣得名于公司所在地“豆瓣胡同”,洪強(qiáng)寧卻跟雷峰網(wǎng)說,自己只是路過那里,并沒待過,只阿北在那里曾短暫居住。
從豆瓣成立第一天起,阿北要解決的問題就是信息過窄,他非常清晰的認(rèn)識(shí)到推薦是一個(gè)行之有效的解決方案。
阿北和后來的張一鳴一樣,自己動(dòng)手寫了第一版推薦引擎,這也是中文互聯(lián)網(wǎng)世界的第一個(gè)推薦引擎。
單從推薦效果來看,這個(gè)推薦引擎其實(shí)已經(jīng)相當(dāng)厲害。當(dāng)時(shí)豆瓣的主要用戶都是熱愛讀書創(chuàng)作的硬核文青,他們非常需要一個(gè)探索發(fā)現(xiàn)新書的工具。阿北幫助他們解決了這個(gè)需求,所以豆瓣開始風(fēng)靡博客圈,也因此獲得許多流量。
但是從運(yùn)行效率來看,阿北這個(gè)純Python的推薦引擎也同樣渣渣,隨著用戶的不斷涌入,很多時(shí)候運(yùn)行一整天才能算出結(jié)果。
不過阿北并不像張一鳴那樣為技術(shù)不足憂愁,因?yàn)樗型跏貚嬤@個(gè)多年老友相助。
王守崑
事實(shí)上,王守崑當(dāng)時(shí)手里拿著兩份offer,一份是世界第一有錢的電商公司亞馬遜的,另一份就是世界第一有情懷的豆瓣的,這兩份offer需要他做的事都一樣——那就是推薦算法。
這并不是一個(gè)需要考慮的抉擇,因?yàn)橥跏貚嬃x無反顧站到了阿北一邊,原因僅僅是豆瓣看起來更有意思。
王守崑老師對(duì)雷峰網(wǎng)回憶了剛加入時(shí)的工作:“我作為四號(hào)員工入職后,頭兩個(gè)月只做了一件事,就是把阿北的純Python版本改成純C版本,然后推薦效率就大概提升了十幾倍的樣子?!?/p>
按照王守崑的說法,阿北的版本仍然是非常好的,他認(rèn)為自己做的主要是優(yōu)化性能的工作。
同樣是2005年,同樣出身IBM,同樣覺得推薦有意思的徐易容創(chuàng)立了抓蝦,他聚攏了30位工程師,抓取了500多個(gè)博客和新聞?lì)l道的13億篇文章,他計(jì)劃將機(jī)票、招聘、教育、餐飲通通容納進(jìn)自己的抓蝦閱讀器,他甚至開始評(píng)價(jià)當(dāng)時(shí)正在創(chuàng)業(yè)的師兄李彥宏“也沒什么了不起”。
如果用后來移動(dòng)互聯(lián)網(wǎng)時(shí)代的說法,徐易容想做的抓蝦就是主打信息分發(fā)的推薦引擎,不過他始終沒有真正建立起一個(gè)推薦工具,從頭到底采用的仍然是傳統(tǒng)的關(guān)鍵詞規(guī)則匹配方法,主要是依靠好的產(chǎn)品體驗(yàn)獲取客戶。
另外,徐易容的想法太大,做的也太早,抓蝦最后抓瞎,只能賣給豆瓣。抓蝦雖然沒有為豆瓣帶來多少技術(shù),卻也貢獻(xiàn)了不少內(nèi)容資源。
在此之后,豆瓣開始做一個(gè)叫“豆瓣猜”的推薦產(chǎn)品,豆瓣內(nèi)部將書籍、電影、音樂稱為釘子,推薦引擎稱為錘子。阿北的任務(wù)是帶隊(duì)找釘子,王守崑的任務(wù)招人做錘子。
2007年,豆瓣第一個(gè)定義并且提出招聘“算法工程師”這個(gè)職稱。在此之后,廣大推薦算法人才終于有了自己獨(dú)特的崗位。
2007年谷文棟從北京航空航天大學(xué)博士畢業(yè),他敲響了王守崑的面試大門,雖然阿北和王守崑都覺得他是少見的推薦人才,但是谷文棟最終決定創(chuàng)業(yè),王守崑沒能招納到谷文棟,只好保持長期聯(lián)系。
一年后的夏天,國人的目光都集中在奧運(yùn)盛典上時(shí),谷文棟卻醉心于經(jīng)營自己討論推薦算法的郵件組和博客,很多推薦技術(shù)愛好者都是其忠實(shí)粉絲。
又過了一年,谷文棟和還在讀博的項(xiàng)亮一起成立面向推薦領(lǐng)域的專業(yè)社區(qū)ResysChina,并且計(jì)劃辦一場“ResysChina推薦大會(huì)”,將大家弄到一處好好聚聚,但是他們連個(gè)場地都沒有。
這時(shí)候,阿北和王守崑對(duì)兩人伸出了援手。
2009年12月19日,豆瓣支持谷文棟搞起了第一屆ResysChina推薦大會(huì),不僅給大家提供點(diǎn)心飲料紀(jì)念品,而且貢獻(xiàn)王守崑擔(dān)任主講人上臺(tái)演講,國內(nèi)推薦技術(shù)愛好者紛紛報(bào)名。
不久前,谷文棟和雷峰網(wǎng)回憶那天時(shí)說:“阿北當(dāng)時(shí)非常激動(dòng),他說了好多好多話?!?/p>
王守崑上臺(tái)分享了很多豆瓣猜經(jīng)驗(yàn)。
迅捷英翔的孫超和劉凱義講了怎么做推薦產(chǎn)品。
百度的張棟當(dāng)時(shí)正在搭建鳳巢系統(tǒng),有非常豐富的大規(guī)模機(jī)器學(xué)習(xí)經(jīng)驗(yàn),整段演講高屋建瓴而且故事性強(qiáng),每一段話都妙趣橫生,將大會(huì)推向高潮。
張棟
以至于,后來谷文棟再辦推薦大會(huì)時(shí),又再次找他。
張棟是中國搜索引擎界的臥龍鳳雛,當(dāng)前國內(nèi)能叫得出名字的搜索引擎大多和他有關(guān)。
他1976年出生,碩士畢業(yè)于中科院,博士畢業(yè)于瑞士聯(lián)邦理工大學(xué)和美國麻省理工大學(xué)。
2006年底張棟加入谷歌,從事推薦引擎技術(shù)的研發(fā)。兩年后,作為第一個(gè)從谷歌加入百度的員工,張棟擔(dān)任了百度鳳巢廣告系統(tǒng)架構(gòu)師,是最早將大規(guī)模機(jī)器學(xué)習(xí)核心算法應(yīng)用在中國互聯(lián)網(wǎng)產(chǎn)品的先行者。
多年后的一個(gè)寒夜,張棟吃完火鍋后這樣告訴雷峰網(wǎng):“當(dāng)前人們提到人工智能,首先想到的是戰(zhàn)勝國際象棋大師的 AlpahGo,人臉識(shí)別、自動(dòng)駕駛等。但是我認(rèn)為,人類迄今最大的人工智能應(yīng)用就是互聯(lián)網(wǎng)搜索引擎?!?/p>
在張棟眼里,離開百度可能是他做過最錯(cuò)誤的選擇,從他后來的創(chuàng)業(yè)來看,他骨子里仍然有很強(qiáng)的搜索情節(jié)。
時(shí)間回到2009年,張棟這年不僅在豆瓣的推薦大會(huì)上做了分享,而且還干了另一件影響深遠(yuǎn)的事,他把自己在谷歌的好友宿華拉進(jìn)了百度。
兩個(gè)人分工是這樣的,張棟擅長算法,所以能夠設(shè)計(jì)算法框架,宿華擅長系統(tǒng)優(yōu)化和工程,能做很多工程實(shí)現(xiàn)。
張棟那時(shí)候?qū)λ奕A評(píng)價(jià)非常高,每次見到谷文棟,都會(huì)忍不住自夸:“臥槽,哥們,我這邊有個(gè)天才程序員。”
宿華
張棟將百度鳳巢做起來后,百度收入飆升,凈利增165%,這也是百度領(lǐng)先騰訊阿里兩家的高光時(shí)刻,以后再也沒有這樣的機(jī)會(huì)了。
不得不說,谷歌對(duì)中國互聯(lián)網(wǎng)的發(fā)展真是影響深遠(yuǎn)。
從根子上說,張棟在百度鳳巢做的大規(guī)模矩陣分解,和他前同事王益后來在騰訊廣點(diǎn)通做的大規(guī)模語義分解,其實(shí)大同小異,都是谷歌大規(guī)模并行化技術(shù)的發(fā)展。
谷歌間接給百度和騰訊送來了最強(qiáng)營收算法。
有人說,張棟并沒有將算法看得很重,他在第二屆ResysChina推薦大會(huì)上甚至提出了一個(gè)觀點(diǎn),這個(gè)觀點(diǎn)被人解讀為“算法無用論”。
2010年的ResysChina推薦大會(huì)是在淘寶舉辦的。
這里有兩個(gè)背景:一是當(dāng)時(shí)淘寶事事向亞馬遜看齊,亞馬遜有個(gè)說法——他們35%的交易是推薦驅(qū)動(dòng)的,淘寶自然也開始重視推薦算法;二是當(dāng)年淘寶雙11交易額達(dá)到9.36億的天文數(shù)字,這都是靠人工運(yùn)營做出來的,阿里人很想知道還有沒有進(jìn)步空間。
淘寶贊助谷文棟搞ResysChina大會(huì)的目的非常明晰——那就是搜羅推薦人才。
本來,這次推薦大會(huì)最受期待的嘉賓是谷文棟請(qǐng)來的以色列人Yehuda Koren,此人在之前的奈非推薦大賽上擊敗項(xiàng)亮團(tuán)隊(duì),獲得全球第一名。
甚至可以這樣說,這次大會(huì)之所以如此火爆,一半的原因都是Yehuda Koren會(huì)出席。
可惜Yehuda Koren這個(gè)人表達(dá)不行,現(xiàn)場效果一般般,反而是張棟在會(huì)上提出的4321模型反響熱烈,后來被廣泛引用。
黃建軍就曾經(jīng)說過:“推薦系統(tǒng)作為一個(gè)整體,包括UE/UI、數(shù)據(jù)、行業(yè)知識(shí)和算法,我比較信奉百度張棟的說法。”
王守崑也曾經(jīng)在知乎里給人家安利張棟的框架。
那么張棟的4321模型是怎樣的呢?
公式大抵如此:UI/UE占40% > 數(shù)據(jù)占30% > 知識(shí)占20% > 算法10%。
這個(gè)說法提出后,有一段時(shí)間內(nèi)被解釋為“算法無用論”,人們?cè)尞愑诟愠霭俣萨P巢的張棟怎么會(huì)提這樣的觀點(diǎn)。
在雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))向張棟求證了4321的說法,張棟說了這么一句話:“推薦引擎大戰(zhàn)就好比奧運(yùn)會(huì)百米賽跑,前面90%大家都能跑,剩下10%決定勝負(fù)。”
對(duì)推薦系統(tǒng)來說,10%算法是更珍貴的,因?yàn)檫@是做推薦系統(tǒng)的第一步,如果沒有這個(gè),后面90%的實(shí)現(xiàn)問題都沒有機(jī)會(huì)解決。
這里接著說完第二屆推薦大會(huì)的故事,在這次大會(huì)上,阿里的人向谷文棟提了個(gè)問題:
“以阿里的體量搞一個(gè)推薦引擎,至少需要兩三百號(hào)人,而且都是價(jià)格不菲的頂級(jí)工程師,如果再考慮試錯(cuò)成本,這個(gè)投入值得嗎?畢竟阿里現(xiàn)在雙11已經(jīng)很猛了,真的有必要再搞推薦引擎嗎?”
谷文棟正面沒有回答,而是反問了阿里的人兩個(gè)問題:“一、你們相不相信阿里業(yè)務(wù)還會(huì)爆炸增長?二、你們認(rèn)不認(rèn)可數(shù)據(jù)驅(qū)動(dòng)的價(jià)值觀?”
后來的事情證明了阿里的選擇:IBM出來的袁泉被谷文棟鼓動(dòng)去了阿里,并且受到重用,袁泉開創(chuàng)了淘寶推薦算法。
2013年雙11期間,淘寶光是靠推薦引導(dǎo)的交易額就達(dá)到56.8億。
與之相對(duì)照的,當(dāng)當(dāng)技術(shù)總監(jiān)王洪濤那時(shí)候也在搞推薦,可惜李國慶俞渝內(nèi)亂太嚴(yán)重,公司的技術(shù)革新也處在矛盾對(duì)立中,于是一步落后步步落后,從此與推薦無緣。
事實(shí)上,阿里面臨的問題也是現(xiàn)在很多互聯(lián)網(wǎng)公司面臨的問題——大公司在行業(yè)已經(jīng)占據(jù)很大份額,是不是還有必要搞推薦這么昂貴的東西?
有些東西雖然正確,但到底值不值得,這真是一件不好抉擇的事情。這就好比美國經(jīng)濟(jì)已經(jīng)傲視全球,是不是還有必要搞高鐵和特高壓輸電?
歷史進(jìn)程給大國家、大公司、大人物的機(jī)會(huì)窗口,其實(shí)都是很有限的,抉擇甚至大于努力。
參加完推薦大會(huì)的張棟,也同樣面臨著是否留在百度的抉擇。
張棟做起鳳巢之后,在百度立下大功,也應(yīng)該獲得獎(jiǎng)勵(lì)晉升。
一位鳳巢前成員曾經(jīng)告訴雷峰網(wǎng),他們當(dāng)時(shí)認(rèn)為:“張棟做不了百度CTO,做百度的首席科學(xué)家還是可以的吧?!?/p>
不過,李彥宏顯然沒有同意這個(gè)要求,而是打了個(gè)大大的折扣任命他做鳳巢的首席科學(xué)家。(百度的隱秘故事可以參見科技史新書《沸騰新十年》,加下方小編微信可搶購預(yù)售。)
事實(shí)上,到這個(gè)時(shí)候,鳳巢團(tuán)隊(duì)的人已經(jīng)不太滿意了。畢竟老大上不去,下面的人也很難上的去。
為了安撫鳳巢團(tuán)隊(duì),李彥宏特設(shè)百度最高獎(jiǎng),既然給不了精神獎(jiǎng)勵(lì),給些物質(zhì)補(bǔ)償還是必要的。
李彥宏將百萬美金的獎(jiǎng)勵(lì)頒發(fā)給了鳳巢團(tuán)隊(duì)。
可以這么說,這個(gè)獎(jiǎng)一開始幾乎就是為張棟團(tuán)隊(duì)所特設(shè),后期需要獎(jiǎng)勵(lì)別人,就延續(xù)了下來。
但是兌現(xiàn)時(shí)又出了岔子,張棟后來發(fā)現(xiàn)這個(gè)獎(jiǎng)是分4年兌現(xiàn)的,于是憤而離職,其團(tuán)隊(duì)內(nèi)包括宿華在內(nèi)的一批牛人也是那時(shí)候離開了百度。
2010年谷歌退出中國大陸留下巨大空白市場,百度在國內(nèi)搜索引擎中一家獨(dú)大,其他巨頭也想來分一杯羹。
周鴻祎在360找來了兩個(gè)團(tuán)隊(duì)來賽馬,一支是董毅團(tuán)隊(duì),另一支是張棟團(tuán)隊(duì)。
張棟對(duì)做搜索引擎可以說是駕輕就熟,而且在算法方面的積累和資源遠(yuǎn)遠(yuǎn)超過其他人,幾乎是不可戰(zhàn)勝的。
董毅是360老將,曾經(jīng)一手做出360最核心的殺毒技術(shù)QVM人工智能引擎,幫助360在極短時(shí)間內(nèi)擊敗各大國際殺毒巨頭。
董毅團(tuán)隊(duì)的人后來這樣向雷峰網(wǎng)回憶:“我們?cè)谒阉鞣矫娴慕?jīng)驗(yàn)和能力遠(yuǎn)遠(yuǎn)落后于張棟,沒人、沒錢、沒資源,但是董毅這哥們腦袋真特么靈活,他一開始就定下來一條路:不比算法,比想法。”
那“比想法”是怎么做的呢?
董毅當(dāng)時(shí)的搜索團(tuán)隊(duì)只有8個(gè)人,不可能像張棟那樣搞機(jī)器學(xué)習(xí),但他非常懂殺毒。
他就專門搞了一個(gè)程序放在用戶電腦上,記錄用戶搜索日志,用戶點(diǎn)擊,用戶訪問了哪些網(wǎng)頁,然后把這些數(shù)據(jù)建成一個(gè)大的數(shù)據(jù)庫,并且進(jìn)行排序,轉(zhuǎn)化成索引。
這樣做的效果就是,當(dāng)用戶下次搜索的時(shí)候,在沒有網(wǎng)址導(dǎo)航的情況下,之前搜的網(wǎng)頁會(huì)排的最靠前,給用戶帶去了極佳的用戶體驗(yàn)。
360搜索上線一周就超過了搜搜、搜狗,后來最多時(shí)占據(jù)了國內(nèi)35%的市場份額。
周鴻祎果斷裁掉張棟團(tuán)隊(duì)。
不過,張棟團(tuán)隊(duì)的成員們也不算倒霉,他們都被張棟推薦給了宿華。
2013年宿華在晨興資本張斐的介紹下認(rèn)識(shí)人人網(wǎng)出來的程一笑,兩人一拍即合,將GIF快手改造成基于推薦的短視頻社區(qū)。
張棟推薦過來的人,很多都成為了快手的早期員工,所以快手短視頻早期才能在推薦算法方面爆發(fā)出驚人的戰(zhàn)斗力。
2014年,張一鳴打算收購快手,但是宿華太貴,只好轉(zhuǎn)頭收購了一家叫圖吧的公司。
張一鳴
圖吧的創(chuàng)始人是從貓撲出來的,她的名字叫張楠。
張楠之前每天在微博上給女兒寫一段話配一張圖,因?yàn)槁犅勎⒉┏^3萬條就會(huì)刪除多余微博,于是創(chuàng)業(yè)做起了圖吧。
圖吧會(huì)根據(jù)用戶瀏覽記錄分析用戶興趣,算是有點(diǎn)推薦的影子。
張一鳴后來對(duì)雷峰網(wǎng)回憶了決策收購的場景:
“那天我和陳林從圖吧公司回來路上,陳林說快手太貴了。那時(shí)候快手已經(jīng)接受了1000萬美金投資,如果要收購至少需要幾千萬美金。我們就討論說,還是別收快手,收張楠團(tuán)隊(duì)吧,讓他們進(jìn)來嘗試下這個(gè)方向?!?/p>
后來大家都知道,張楠成為了抖音的創(chuàng)始人。不過這已經(jīng)是幾年后的事情了,張楠當(dāng)時(shí)完全無法替代宿華,因?yàn)樽止?jié)很長時(shí)間的大窘境就是沒有好的推薦引擎,抖音崛起有不少的功勞在推薦引擎身上。
從字節(jié)創(chuàng)立第一天起,張一鳴就在為找技術(shù)負(fù)責(zé)人這件事發(fā)愁。
早年在酷訊時(shí)期,張一鳴就常年潛水于ResysChina社區(qū),他是見過高峰的人,所以也渴望高峰,但是公司早期太小,實(shí)在難容大佛,以至于張一鳴養(yǎng)成了這樣的挖人習(xí)慣——即當(dāng)時(shí)沒挖成,之后一兩年還是給人打電話約吃飯,然后問工作情況。
當(dāng)時(shí),張一鳴曾經(jīng)找過亞馬遜推薦團(tuán)隊(duì)出來的林承仁,想要收掉林承仁的無覓團(tuán)隊(duì)(該團(tuán)隊(duì)不少亞馬遜工程師),不過對(duì)方創(chuàng)業(yè)興致正濃被婉言拒絕。一年后,林承仁因?yàn)樽龀霈F(xiàn)象級(jí)產(chǎn)品無秘名聲大振,之后就轉(zhuǎn)向陌生人社交賽道,直到多年后才又回到個(gè)性化方向,這已是后話。
還有一次,張一鳴好不容易挖來百度技術(shù)委員會(huì)主席廖若雪負(fù)責(zé)技術(shù),可惜廖若雪只干了一個(gè)月覺得沒戲就走人,張一鳴只好又重頭開始。
2014年,張一鳴終于請(qǐng)到百度大搜副總監(jiān)楊震原吃飯,在這次飯局上,張一鳴沒有談技術(shù),而是大談對(duì)產(chǎn)品的理解,他跳出互聯(lián)網(wǎng)產(chǎn)品的角度,從產(chǎn)業(yè)的維度談起對(duì)信息分發(fā)的理解。
張一鳴對(duì)產(chǎn)品的理解讓楊震原佩服的五體投地,他后來私下表示,張一鳴的理解超過了他見過的所有人,所以他才愿意到頭條來試一試。
楊震原加入字節(jié),直接帶動(dòng)大量百度人相繼加入,其中就包括朱文佳等人。
楊震原
朱文佳是楊震原一手培養(yǎng)起來的推薦天才,在百度時(shí)候已經(jīng)是架構(gòu)師,到字節(jié)后長期負(fù)責(zé)算法工作,和項(xiàng)亮一起算是楊震原手下的推薦雙璧。
在抖音崛起的過程中,朱文佳就是那個(gè)向上的轉(zhuǎn)折點(diǎn)。
2016年末,張楠做起抖音后,經(jīng)過強(qiáng)運(yùn)營確實(shí)在微博上小火一把,但是之后就陷入了增長瓶頸,而且這時(shí)候出現(xiàn)了更大的危機(jī)——內(nèi)容嚴(yán)重同質(zhì)化,如此長時(shí)間下去用戶一定會(huì)流失。
張一鳴找到楊震原,要求調(diào)朱文佳去負(fù)責(zé)抖音推薦,卻遭到了拒絕,因?yàn)樗藭r(shí)正支撐著今日頭條的DAU和廣告營收。
張一鳴從戰(zhàn)略的角度看到了抖音的重要性,于是三番五次找楊震原聊天,最后終于將他說服。
朱文佳負(fù)責(zé)抖音算法后,抖音迅速煥發(fā)出強(qiáng)大的生命力,進(jìn)入用戶爆發(fā)期。
這里還有一個(gè)例子可以旁證推薦引擎對(duì)于短視頻社區(qū)的關(guān)鍵性:
Musically創(chuàng)始人陽陸育曾經(jīng)告訴雷峰網(wǎng),抖音和Musically產(chǎn)品上非常相似,但是推薦算法做得內(nèi)容泛化更好,他如果不把Musically賣給字節(jié),至少還需兩年時(shí)間才能追的上,那時(shí)候肯定已經(jīng)晚了。
2018年抖音海外版Tik Tok合并Musically,之后三年下載量成世界第一。在產(chǎn)品出海這件事上,字節(jié)終于為中國互聯(lián)網(wǎng)打了一場勝仗。
時(shí)間再次回到2012年,回到谷文棟辦的最后一屆ResysChina推薦引擎大會(huì)上。
這次的大會(huì)時(shí)Hulu贊助的,會(huì)場在清華科技園紫光國際交流中心,地方大很多,本來預(yù)備的200人席位遠(yuǎn)遠(yuǎn)容納不下想要參會(huì)的觀眾。
谷文棟不得不在宣傳欄里寫下“為了保證良好的討論氛圍,優(yōu)先考慮團(tuán)隊(duì)報(bào)名”這個(gè)要求。
大會(huì)的演講嘉賓非常豪華,谷文棟甚至請(qǐng)到了Facebook核心的華人推薦算法leader石言心。
石言心
當(dāng)時(shí)Facebook正是牛氣沖天之時(shí),挖了大量谷歌、亞馬遜的核心算法人才,準(zhǔn)備大舉進(jìn)軍推薦領(lǐng)域,對(duì)外其實(shí)是相當(dāng)保守的。
站在企業(yè)的角度來看,這也完全可以理解,因?yàn)楫?dāng)時(shí)谷歌和亞馬遜等國外巨頭也整天盯著Facebook,非常想要知道Facebook的具體執(zhí)行策略。
石言心在這種情況下能夠參加ResysChina推薦引擎大會(huì),并且分享的主題就是“Facebook的推薦系統(tǒng)”,這對(duì)于國內(nèi)推薦人進(jìn)行前沿探索起到重要作用。
石言心講完后,其他人也都傾其所有。
百度的劉其文講了“百度推薦系統(tǒng)的探索過程”,騰訊廣點(diǎn)通的王益講了“推薦系統(tǒng)實(shí)踐”,Hulu的鄭華和項(xiàng)亮也做了分享。
沒錯(cuò),這位項(xiàng)亮正是谷文棟一起創(chuàng)辦ResysChina的好友,此時(shí)的他已經(jīng)是Hulu推薦算法負(fù)責(zé)人。
前文一直在刻意忽略項(xiàng)亮,并不是他不重要,而是因?yàn)樗鳛橹袊扑]引擎的關(guān)鍵人物,值得重筆講述。
石言心和項(xiàng)亮正好代表了中國推薦算法的兩個(gè)階段:一、跨國大公司中的華人華僑群體將推薦算法帶向中國;二、中國自己培養(yǎng)的人才長成后是對(duì)外競爭的關(guān)鍵力量。
項(xiàng)亮在推薦引擎圈成名非常早。
項(xiàng)亮
早年奈非為了改善電影推薦系統(tǒng)算法,于是懸賞一百萬美元辦了場推薦大賽,吸引了全世界186個(gè)國家的數(shù)萬支隊(duì)伍參賽。
當(dāng)時(shí)項(xiàng)亮剛剛從中科大畢業(yè)進(jìn)入中科院自動(dòng)化所,其導(dǎo)師楊青就大力支持他參賽。
比賽開始后,項(xiàng)亮的模型和當(dāng)時(shí)以色列Yehuda Koren團(tuán)隊(duì)的模型在很多重要指標(biāo)上都不相伯仲,雙方都遠(yuǎn)遠(yuǎn)領(lǐng)先其他團(tuán)隊(duì)。
這時(shí)候,以色列團(tuán)隊(duì)開始拉攏四個(gè)排名靠前的團(tuán)隊(duì)搞模型融合,獲得了非常好的效果。項(xiàng)亮也反應(yīng)過來,開始跟其他的團(tuán)隊(duì)也進(jìn)行合作。
這一比賽就比了三年,最終項(xiàng)亮雖然在成績上和Yehuda Koren團(tuán)隊(duì)一樣,但因?yàn)楸葘?duì)方晚提交了2小時(shí)20分鐘,排名只能屈居第二。
經(jīng)此一役,項(xiàng)亮在推薦算法上的能力得到大幅度提升,也成為國內(nèi)推薦圈子的先鋒人物。
在此之后,項(xiàng)亮進(jìn)入阿北、徐易容、袁泉都曾經(jīng)供職的IBM實(shí)習(xí),并在這里和袁泉一起發(fā)過KDD論文。
在第二屆ResysChina推薦大會(huì)上,項(xiàng)亮見到了CSDN總編劉江,劉江跟項(xiàng)亮說,國外已經(jīng)有了講推薦系統(tǒng)的專業(yè)書,國內(nèi)還一本沒有,他們圖靈出版社希望能出版一本,這相當(dāng)于在跟項(xiàng)亮約稿。
項(xiàng)亮做完博士論文不久,對(duì)這方面的研究還很有熱情,于是答應(yīng)下來,然后就開始寫作《推薦系統(tǒng)實(shí)踐》一書,這一寫就寫了半年。
在寫書期間,項(xiàng)亮進(jìn)入Hulu鄭華手下任職,主要工作就是利用大數(shù)據(jù)做推薦系統(tǒng),雖然遇到了Hulu全球副總裁張小沛這個(gè)好領(lǐng)導(dǎo),但是Hulu這種長視頻應(yīng)用,并沒有辦法充分發(fā)揮推薦的作用。
這就來到著名的“借書事件”,這年頭條剛創(chuàng)立不久,剛剛起步的張一鳴找正在巔峰的項(xiàng)亮要沒出版的《推薦系統(tǒng)實(shí)踐》書稿,項(xiàng)亮不給他,最后張一鳴只能自己邊學(xué)邊寫,搞了個(gè)渣渣推薦引擎。
2013年,項(xiàng)亮、鄭華跟隨張小沛跳槽宜信大數(shù)據(jù)中心,做出了姨搜和反欺詐圖譜;11月,谷文棟加入宜信擔(dān)任創(chuàng)新中心副總經(jīng)理;一年后,豆瓣洪強(qiáng)寧也加入宜信。
宜信一時(shí)間成為算法人才高地,可惜它仍然沒有足夠的用戶場景釋放這些推薦人才的創(chuàng)新力。
2017年項(xiàng)亮離開宜信加入快手,雖然得到了宿華本人的足夠重視,但非常不適應(yīng)快手的企業(yè)文化,而且,他當(dāng)時(shí)最想做的視頻理解項(xiàng)目也沒有發(fā)揮空間,所以并沒有待多久。
外界對(duì)快手有一種推測,宿華帶進(jìn)快手的清華派自視甚高,外部加入的人才往往會(huì)遇到非工作的麻煩??焓掷蠁T工朱藍(lán)天在內(nèi)網(wǎng)文章《談?wù)効焓值牟 分幸矊ⅰ芭上盗至ⅰ绷袨榇髥栴},不知項(xiàng)亮是否受到影響。另一位算法天才蓋坤跳到快手還過得不錯(cuò),其清華出身起了很大作用。與之相近的還有個(gè)例子,推薦引擎領(lǐng)域的另一條超級(jí)大魚趙世奇離開百度加入了華為鴻蒙。
張一鳴沒有在第一時(shí)間知道項(xiàng)亮離職這件事,以至于被快手搶了先機(jī),但他并不打算放過這個(gè)機(jī)會(huì),于是多次游說項(xiàng)亮,終于將其招至頭條,頗有一種歷盡坎坷,終歸明主的感覺。
項(xiàng)亮歸入字節(jié)跳動(dòng)旗下,先是在AILab研究視頻理解,之后擔(dān)任推薦系統(tǒng)的負(fù)責(zé)人。
近兩年字節(jié)跳動(dòng)開始做TO B的火山引擎,最大賣點(diǎn)之一莫過于世界級(jí)的推薦系統(tǒng),其背后的就是項(xiàng)亮。
頭條快手之后,幾乎所有內(nèi)容社區(qū)都有了推薦這個(gè)必選項(xiàng),知乎周源引入李大海主持內(nèi)容泛化,小紅書毛文超找到郄小虎進(jìn)行推薦升級(jí),頭條產(chǎn)品的創(chuàng)始人黃河出來和李金波做了最右App,陳睿開始用推薦武裝B站從二次元社區(qū)變成YouTube。
在這篇文章發(fā)布前,王守崑老師在電話中跟雷峰網(wǎng)說,建議技術(shù)創(chuàng)業(yè)者和媒體應(yīng)該多關(guān)注下怎樣將推薦技術(shù)與隱私保護(hù)結(jié)合,甚至提到了一個(gè)前沿概念“數(shù)據(jù)稅”,即哪家廠商要用用戶數(shù)據(jù),就要額外付出成本。他自己目前也在和很多學(xué)者研究這些問題。
在很多推薦大神看來,推薦引擎的發(fā)展至今仍屬早期,必然要經(jīng)歷暴露問題的階段,從業(yè)者們只有從倫理規(guī)范角度做好管理,只有不斷探索如何保護(hù)好用戶隱私,才是推薦引擎技術(shù)長久發(fā)展之道。
自1994年中國接入互聯(lián)網(wǎng),到2009年之前的十余年里,中國互聯(lián)網(wǎng)人最成功的創(chuàng)業(yè)模式幾乎只有一種,那就是將國外(主要是美國)的互聯(lián)網(wǎng)產(chǎn)品搬到國內(nèi),百度之于谷歌,阿里巴巴之于亞馬遜,騰訊QQ之于ICQ,新浪微博之于推特,優(yōu)酷之于YouTube,人人網(wǎng)之于Facebook,無不是如此。
但這并不是因?yàn)橹袊ヂ?lián)網(wǎng)人缺乏創(chuàng)新力,而是我們開眼看世界之時(shí),人家已經(jīng)有了幾十年的發(fā)展經(jīng)歷,無論基礎(chǔ)設(shè)施,還是用戶認(rèn)知,國際互聯(lián)網(wǎng)生態(tài)都更加先進(jìn)。
摸著美國過河,是那個(gè)時(shí)期中國草莽創(chuàng)業(yè)者肉眼可見的最佳路徑,互聯(lián)網(wǎng)行業(yè)也同樣如此。
但是,學(xué)人者生,似人者死,中國互聯(lián)網(wǎng)如果一直亦步亦趨,那永遠(yuǎn)都不會(huì)有出頭之日,也只能被嘲笑是躲在防火墻后面的抄襲者。
中國互聯(lián)網(wǎng)人必須得有自己的殺手锏,這把锏可以繼承自師父,但必得經(jīng)過數(shù)代人才的精心打磨,才能成為與殘酷世界競爭的絕招。
現(xiàn)在看來,這殺手锏的名字就是推薦引擎,今天的中國互聯(lián)網(wǎng)已經(jīng)進(jìn)入了推薦引擎大時(shí)代。
如果有一天,中國互聯(lián)網(wǎng)真正追上乃至超越世界互聯(lián)網(wǎng),人們不應(yīng)該忘記這件事是從哪些人開始的。
雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。