0
本文作者: 郭思 | 2023-07-18 17:24 |
“宣布離職那天,團隊全員抱頭痛哭,這個場景讓我感慨萬分?;仡櫸以谖④浀娜辏曳浅8屑?,它教會了我很多東西?!?/p>
作者 | 郭思
編輯 | 陳彩嫻
6月9日,在微軟工作了 30 年的華人科學家黃學東正式宣布離職,并加入 Zoom 公司擔任 CTO。
黃學東的離開,為微軟華人的傳奇畫上了濃厚的一筆。他的離開是個人選擇,也是時代的變化所驅。
上世紀七十年代出生的黃學東是與變化共生、在變化中成長的一代人。
1962年,黃學東出生于「霸蠻之地」湖南,沒有上過高中。1977年,中國恢復高考,次年9月,十五歲的黃學東憑借優(yōu)異的成績考上了湖南大學師資班,就讀于電子工程專業(yè),是班上最小的學生之一。
從湖南大學畢業(yè)后,1982年,黃學東考到清華大學計算機系讀碩士,師從中國人工智能先驅常迥與方棣棠,首次接觸人工智能研究。碩士畢業(yè)后,黃學東留讀博,1987年又通過清華與英國愛丁堡大學聯(lián)合培養(yǎng)的博士項目赴英深造,是最早走出國門的人工智能學子之一。
在愛丁堡,黃學東開闊了國際研究視野。1989年博士畢業(yè)后,黃學東沒有選擇回國,而是去了美國卡內基梅隆大學(CMU)當博士后。彼時,CMU 的人工智能研究(尤其是語音與語言方向)在全球排名前三,但華人求學者寥寥無幾,黃學東與他的博士后導師、后來同為計算機大牛的李開復是少數(shù)任職的華人之一。1990年,李開復選擇去工業(yè)界,加入了蘋果公司,黃學東便從博士后轉為教職,留在了 CMU 任教。
彼時人工智能的研究方興未艾。在 CMU 的短短三年內,黃學東就取得了人工智能語音研究方向的多項成果,如 DARPA 語音智能系統(tǒng)測試的冠軍。DARPA測試一直以來被譽為「美軍顛覆性技術研究的風向標」,黃學東也憑借這項成果在 AI 領域一炮而紅,受到了諸如微軟等大廠的密切關注。
1993年,黃學東的事業(yè)迎來了新的轉折點:這一年,在微軟乃至比爾蓋茨的努力下,黃學東最終接受了微軟研究院的offer,從學術界轉到了工業(yè)界。彼時,微軟研究院(MSR)剛成立不到兩年,正籌備團隊,其中語音被視為研究院的戰(zhàn)略方向之一。黃學東加入 MSR 后,也成為了微軟研究院體系的第一位負責重大項目方向和團隊的華人研究管理人員。
黃學東開拓了微軟語音小組。彼時研究院人工智能方向只有兩個團隊,一個是自然語言處理方向,另一個則是黃學東率領設立的語音識別與處理方向。也是當時微軟研究院以統(tǒng)計方法為基礎的語音技術團隊和與規(guī)則方法的自然語言處理團隊兩個人工智能方向的不同代表。
但縱觀黃學東在微軟的30年,語音研究只是黃學東微軟事業(yè)開始的主線。語音研究以外,黃學東先后橫跨了研究、產品、孵化等多個業(yè)務線,精通語音與自然語言研究、工程、產品與團隊管理,是一位「全能手」:
2000年到2004年,黃學東擔任微軟語音平臺組的總經理,推出「Speech Serve」。這是微軟首次將語音技術轉化為企業(yè)及應用服務器的產品。隨后,黃學東開始接手微軟部分新產品研發(fā)項目直至2007年。
2008年金融風暴,美國經濟衰退,微軟為應對危機進行架構調整,黃學東所帶領的新產品孵化團隊全員解散,僅剩黃學東一人被調去必應(Bing)部門擔任首席架構師。彼時,Bing 的負責人是薩提亞·納德拉(現(xiàn)微軟 CEO)。在 Bing 期間,黃學東曾探索性地研發(fā)出一個超級大模型 「XCode」,率先驗證了大模型的潛力,為后續(xù)薩提亞與 OpenAI 的合作打下基礎。
2015年,黃學東再次回到微軟研究院,先后帶領團隊在轉錄會話語音、機器翻譯會話和計算機視覺圖像字幕等方面實現(xiàn)了多個「機器媲美人類水平」的行業(yè)里程碑。
2017年2月,微軟授予黃學東微軟全球技術院士(Technical Fellow)的稱號。微軟全球技術院士是微軟技術人員的最高榮譽,目前為止,全球僅有約二十個人獲得,其中包括圖靈獎得主 Butler W Lampson、Charles P. Thacker等,黃學東是首位入選華人科學家。
2020年,黃學東的微軟生涯迎來巔峰:微軟開始重視云計算與人工智能的結合,成立了 Azure AI 事業(yè)部。黃學東是 Azure 人工智能孵化的核心成員,從2020年開始擔任 Azure AI 的全球人工智能首席技術官。薩提亞上臺后,將云計算、人工智能與量子計算作為微軟科技未來的三個發(fā)展方向之一,Azure AI 就承擔了云計算與人工智能兩塊。
Azure AI的主要任務是在微軟的云計算平臺Azure上為客戶提供人工智能服務。人工智能服務的質量會直接影響到客戶選擇哪家云計算。因此Azure AI在Azure以及微軟的地位極其重要。
Azure AI和產品結合緊密。黃學東帶領團隊使得整個Azure AI從研究成果到產品質量都得到了大幅提升:2021年黃學東團隊實現(xiàn)了機器常識問答上第一次達到人類水平;同時在視覺智能方面推出佛羅倫薩項目,大力推動了計算機視覺的現(xiàn)代化;在語音方面,黃學東團隊也持續(xù)維持了微軟語音服務質量的業(yè)界領先地位等等。
值得注意的是,在微軟與 OpenAI 合作推出 ChatGPT 中,微軟 Azure 云平臺扮演了重要角色。
除了對微軟 AI 版圖的貢獻,黃學東也直接或間接地影響了中國的人工智能歷史:在微軟期間,黃學東幫助微軟公司招入了許多青年華人科學家,如李開復、沈向洋、張亞勤、鄧力、俞棟、張正友、何曉冬等等,他們在微軟的平臺上快速成長后,回到中國,為中國工業(yè)界的 AI 落地作出了重要貢獻。
另一個少為人知的事實是,黃學東是有「中國 AI 黃埔軍?!怪Q的微軟亞洲研究院成立的推動與參與英雄:
黃學東在1993年加入微軟研究院,經過幾年的成長,微軟研究院的規(guī)模進步肉眼可見,黃學東也是主要推手之一。大約在1997年前后,微軟籌備在世界各地建立研究院,黃學東是中國研究院計劃分部的策劃者與負責人,作為項目核心參與了招人、選址的重要工作。
其中,黃學東面試了眾多院長,最后在眾多杰出人選中確定了微軟中國研究院(微軟亞洲研究院的前身)院長的最佳人選,即他在 CMU 的博士后導師、后來鼎鼎大名的李開復。也是在黃學東的參與下,研究院最終選址在北京。
后來事實證明,李開復是正確的院長人選,北京也是正確的院址。這兩個明智的選擇,使微軟中國研究院不久后一躍而為微軟研究院的「亞洲總部」。
黃學東是微軟以及中國人工智能板塊上一塊不可或缺的拼圖,而作為常年帶領微軟團隊的管理者,黃學東更是微軟眾多員工心中的好上司,是團魂人物。
回憶起第一次見到黃學東的場景,黃學東前員工朱晨光(現(xiàn)微軟CSR 首席研究經理)仍記憶猶新。
“黃學東非常博學,而且對人才非常尊重。我從斯坦福大學讀博畢業(yè)后就面試進了微軟,他當時主動和我進行了交流,聽說我是安徽人時,他就說安徽出才子,還說出了很多歷史上的安徽名人。他對于我當時從灣區(qū)(美國加州舊金山灣區(qū))搬到西雅圖的一些顧慮都給予了很好的解答,并鼓勵我繼續(xù)勇攀科技高峰,還為我之后的發(fā)展規(guī)劃了藍圖?!?/p>
朱晨光坦言雖然當時已經收到了好幾個灣區(qū)的offer,而且認識的斯坦福畢業(yè)生也大多數(shù)留在灣區(qū),但是黃學東身上流露出來的那種值得敬重與信賴的感覺,讓他最終做出決定加入黃學東的團隊。
規(guī)模近1000人,在計算機科學以及人工智能領域變化翻天覆地的30年里,黃學東團隊一直都走在最前沿,引領語音、視覺、文本方面最尖端的研究和產品落地。這一切都與黃學東對于團隊管理的高標準嚴要求有關。
他會時時關心員工的業(yè)務進展,在匯報中詢問非常底層的關鍵問題。據(jù)朱晨光回憶,他在做文本總結研究時,一直苦于缺乏標注數(shù)據(jù)。黃學東了解這一情況后,建議用新聞的前幾句話作為總結,這樣可以利用超大規(guī)模數(shù)據(jù)提高模型質量。在黃學東的鼓勵下,朱晨光的研究最終獲得了成功,發(fā)表在SIGIR 2021并應用在MSN News中。Google后來做的PEGASUS也采用了類似微軟的思路。
還有一件事也讓朱晨光記憶深刻。
朱晨光來到微軟的第一個春節(jié),美國西雅圖,不停的雨雪天氣讓空氣中透著絲絲寒意。因業(yè)務繁忙,整個微軟春節(jié)都不放假,初到微軟的朱晨光倍感思鄉(xiāng)情切。
“新春快樂 !”
這時,一句響亮而親切的新年祝福讓朱晨光頓時暖意涌上心頭。黃學東得知微軟春節(jié)不放假,便挨個辦公室的給員工送上了祝福。
對于黃學東的離職,遺憾之情蔓延整個團隊,但那個笑容可撼,銳意進取的身影卻永遠留在了微軟。
在微軟30年,黃學東于研究、產品、工程上均有不可替代的貢獻,事業(yè)一路攀升。2023年實際是黃學東的事業(yè)巔峰期——就在黃學東思考離開微軟時,兩個院士的榮譽從天而降。2023年2月與4月,黃學東先后入選美國國家工程院以及美國藝術與科學院院士,成為計算機領域首位中國大陸大學培養(yǎng)出來的美國雙院院士。
黃學東告訴雷峰網,兩院院士的榮譽,更加堅定了他離開微軟、開始人生探索新篇章的決心。
今年5月,雷峰網與黃學東在美國西雅圖進行了一次深入交流:
雷峰網:您的求學經歷是什么樣的?
黃學東:我是 1978 考上湖南大學,當時才十五歲,從湖南大學畢業(yè)后去清華讀了碩士和博士。方棣棠先生和胡啟秀先生是我的碩士導師,常迥先生是我的博士導師。
這些老師都給我留下了深刻印象:方先生身上有著清華老一輩科學家腳踏實地、淡泊名利的君子之風,也有解決中文計算機輸入普及和全國信息化大格局的遠見卓識。而常先生是那時清華計算機系為數(shù)不多的博士生導師之一,常先生精神開放、善納新知,經常鼓勵我不要囿于自我狹窄的思路,要有國際視野,要追求國際一流的學術,對此我深銘于心。
雷峰網:后來您去了卡內基梅隆大學(CMU)
黃學東:我在愛丁堡拿了博士之前就去了CMU當博士后 (這個大概也創(chuàng)下了愛丁堡大學的記錄),期間李開復是我的老板,我在他手下做了半年研究然后才回到愛丁堡大學答辯博士畢業(yè)。后面(1990年)李開復去蘋果任職,我接班轉正。
我在CMU任教的時間不長,但指導過兩個現(xiàn)在挺有名的學生,一個是現(xiàn)在卡內基梅隆大學機器學習系的系主任Roni Rosenfeld,另一個就是黃美玉。這中間挺有意思,我離開 CMU、去微軟后,他們都還沒畢業(yè),我是通過電話來指導他們的博士論文。那時候沒有類似 ZooM 之類的會議軟件,只能打付費電話,花了我不少錢(笑)。
這么想,我跟 Geoffrey Hinton(圖靈獎得主)的路徑也有點像。我和他都是在愛丁堡大學獲得博士學位,做了一年博士后,然后我們都去了卡內基梅隆大學當教職,最后我們也都選擇了去工業(yè)界,只是他去了谷歌、我去了微軟(笑)。
雷峰網:您在CMU做研究取得了很大的突破,后來去工業(yè)界也做得很好,背后的原因是什么?
黃學東:我是湖南人嘛(笑),湖南人霸蠻。歷史上的一個典型名人是曾國藩,毛澤東曾有言“吾于近人,獨服曾文正,觀其收拾洪楊一役,完美無缺?!笔Y介石也佩服他。我的母親是湖南雙峰人,和曾國藩來自一個地方。曾國藩是帶領湖南出山的人,當時還將全國的資本帶回湖南,包括教育、飲食等等,重新定義了很多東西,實現(xiàn)了湖南的現(xiàn)代化。我身上的霸蠻氣質由此而來。湖南就是江河湖海都有,整個地方就是翻江倒海的地方。湖南人心氣高,有韌性,霸蠻,格局大。
雷峰網:您1993年進入微軟是基于什么樣的機緣?
黃學東:微軟在1992年就面試了我,但我一直沒同意過來。當時我在CMU負責語音人工智能系統(tǒng),獲得了全美 DARPA 所有測試指標的各項第一名,而且是國防部測評歷史上錯誤率最低的一次。微軟就盯著我挖,挖了三個月,最后通知我說蓋茨要見我。1993年1月,我正式開始加入微軟。整整30年,微軟依舊屹立不倒,這證明微軟十分強大興盛。我在微軟30年也正好經歷了微軟 AI 的發(fā)展歷程。
雷峰網:您加入微軟雷德蒙研究院時,微軟雷德蒙研究院有幾個組?
黃學東:AI 方面只有兩個組,一個是我?guī)ьI的語音 AI 組,還有一個是基于規(guī)則系統(tǒng)設立的語言組。當時研究院的宗旨是讓機器能聽、能看、能學習,能像人一樣工作,時至今日,微軟的成果實際上已經實現(xiàn)了這一宗旨。
而我的老板們基本上都已經退休了,包括比爾·蓋茨。我的第二個老板叫凌大任(前微軟雷德蒙研究院院長),在 98 年建中國研究院之前,我和凌大任去中國拜訪清華。當時微軟還沒有什么名氣,為了招人,我去過中國很多趟,清華的每個校招日我都會去現(xiàn)場招人。
雷峰網:當時微軟亞洲研究院的成立有什么故事嗎?
黃學東:微軟亞洲研究院的前身中國研究院最開始是我參與構建的。確定在北京落地前,我在微軟內部準備了兩年,面試了許多人,李開復、張亞勤、張宏江都是我面試的,洪小文、鄧力也都是我團隊的人。李開復是我博士后的老板,沈向洋是我在卡內基梅隆任教時上過我的課的的學生。所以按照資歷來說,李開復最資深,沈向洋最不資深(笑)。
開復的語音研究做得很好,組織管理能力也很強,而且開復很喜歡中國,他是很很合適很恰當?shù)娜诉x。把開復招進來后,我就放手了。之前我算是「幕后英雄」,在背后負責推動與策劃。后來開復在北京帶領研究院的發(fā)展,有些事他要取得微軟在美國的領導們同意,我就作為中間人起牽線搭橋的作用。
中國研究院剛成立時是一個很小的組織,回憶起來,這的確是一段很不容易的歷史。當時我們規(guī)劃了很多人和很多地方。上海、北京都考慮過,最后還是選擇了北京。后面的事實證明北京是正確的決定,開復也是正確的人選。
雷峰網(公眾號:雷峰網):有沒有想過在其他地方建研究院?
黃學東:微軟在中國建了研究院以后,在硅谷、印度和紐約也建了研究院。不過后來經濟蕭條,2015年就把硅谷研究院給裁了,硅谷研究院的負責人向沈向洋匯報,我跟 Harry(沈向洋)也有過深入共事。
我一直在微軟管語音研究和產品組,然后也管一部分的產品孵化。2008年經濟大蕭條,微軟把所有新產品都停掉,我的團隊被迫全裁,我就變成了 Bing 的首席架構師,Harry 是 Bing 的 Engineer Manager(工程負責人),我和 Harry 都匯報給薩提亞,然后 Harry 與薩提亞又都匯報給陸奇。
薩提亞后面晉升到管 Server 和云部門,和陸奇是同級。晉升時薩提亞本來想帶我走,但我沒走,一直在 Harry 手下工作。后面(2015年)Harry 晉升,負責研究部門,我就被 Harry 帶回了研究院。所以當時大家開玩笑,說我在誰手下做事,誰就會晉升(笑)。
雷峰網:微軟研究院經歷了哪些高峰和低谷?
黃學東:對于微軟而言,裁員算是低谷,2008年微軟裁員過一次。2015年硅谷研究被裁并沒有觸及根基,所以不算低谷。2008年我主管新產品創(chuàng)新,我手下的員工全被裁,因此我就被調去 Bing 那邊做首席架構師。
所以在我看來,裁員有時候也不一定是禍,「禍兮福所倚」,不離開研究院我就看不到外面的世界,從某個方面來說,這算是裁員帶來的好處。微軟是一個很大的生態(tài)系統(tǒng),我豐富的經驗是得益于我在研究院和產品組都做過。
雷峰網:在Bing 的時候有沒有發(fā)生什么有趣的事情?您從Bing 回研究院是發(fā)生在什么時候的事情?
黃學東:2015年左右,我還在Bing期間,做了一個名為 「Xcode」的超級大模型,但是當時沒有GPU,深度學習也不夠深度。這個模型占用了Bing 80%的計算資源,我被人罵得狗血淋頭。這證明大模型沒有GPU根本玩不轉。
一個背景:2014年薩提亞成為新一任微軟CEO后,立即提出了“移動為先,云為先”(Mobile First, Cloud First)的戰(zhàn)略,微軟將業(yè)務重心轉向企業(yè)服務市場,清理了原來駁雜的業(yè)務線,集中所有力量向云端轉型。其實這也為后續(xù)微軟云接入 ChatGPT 打下了根基。
雷峰網:沈向洋在2020年離職,他離開后,您的工作有變化嗎?
黃學東:那時候我一直在做產品。我在微軟內部換了很多團隊,我自己也有很大的轉變,但語音一直是我的主線。語音研究的性價比在微軟內外都沒有其他產品能比。我們每天要處理的語音轉寫量高達好幾百萬個小時,從三年前一年處理長度不到一百多萬小時到現(xiàn)在一天好幾百萬小時,處理量和速度肉眼可見地上升。
2015年Harry回研究院后,他負責整個技術和研究板塊,我也接手了語音和翻譯的事情。Azure AI 是 Harry 和我負責推動孵化與產品上市的,在那之后我就一直同時管語音和語言,后來微軟也把計算機視覺及所有 Azure OpenAI的內容放到了我這塊。
一直到今天,Azure OpenAI 是我的團隊做出來的,我很自豪。更自豪的是,Azure 從今年開始賺錢了。直到去年,這個項目一直都是虧錢狀態(tài)。
雷峰網:去年 Azure AI 靠什么掙錢?您為什么選擇這個時間點退休?
黃學東:主要是因為成本降下來了,薄利多銷、量大,市場表現(xiàn)好。做產品總要考慮賺錢的,研究院不做產品,所以肯定是虧錢的。
至于退休,是因為我在微軟工作30年了,負責的整個業(yè)務開始賺錢了,Azure云平臺是現(xiàn)在OpenAI的獨家云供應,雖然最大的成就與榮譽應該給 OpenAI,但Azure AI認知服務整個產品是我輸送出去的,然后我又拿了兩個院士(美國國家工程院院士,美國藝術與科學院院士)。兩院院士并不是微軟評定的,而是美國學術圈的大佬評定的,其標準是對世界和行業(yè)都有貢獻。(雷峰網按:黃學東是中國大陸是改革開放培養(yǎng)出來的第一人,姚期智是中國臺灣出來的,李飛飛是在美國讀的中學。)
在人工智能30年的發(fā)展過程,我真正將多個設想,或者說人們對美好社會的追求變成一個個實實在在的產品和服務,并且讓它開始掙錢、進而發(fā)展壯大,所以才能獲得兩院院士的榮譽。湖南大學的校長聽到這個消息,他說我替他揚眉吐氣了。湖南大學培養(yǎng)了中國計算機領域第一個美國雙院士,他覺得很自豪。
Azure賺錢加兩個院士,這些事情合到一起,我就萌生了「動一動」的想法。我在微軟已經到達職業(yè)高峰,再往下做,不可能還做同樣的事情,需要換一換方式去做其他事情。
雷峰網:語音交互為什么是人類的未來?您怎樣看待現(xiàn)在的大模型發(fā)展?
黃學東:在我看來,語音交互肯定會是人類的未來。GPT也是語音交互,我對Siri也有期待,還有亞馬遜做的智能音箱其實也非常有遠見,但是可惜亞馬遜對AI的認識不夠。微軟小冰一開始也應該做成大模型,但是這個需要很多能力(算力、產品、工程化等等),成敗都在細節(jié)。
如果從歷史的維度來講述 ,IBM是做語音最早的公司 。50 年代IBM 就開始做機器翻譯。70 年代 IBM 開始用語言模型( language model)進行語音研究,只是這個模型不夠大,識讀能力有限。后來IBM內部將做語音的方法應用用到機器翻譯,改寫了機器翻譯的歷史。所以 IBM 的語音對大模型的研究實際做出了巨大的貢獻。
所謂機器翻譯其實就是把你的問題翻譯成你的結果。這個解釋很簡單,人一聽就明白,也就是將過去已有事實轉變?yōu)閷ξ磥淼念A測(history to future)。機器翻譯經歷了幾次升級。第一次升級是IBM所帶來的,機器翻譯從規(guī)則方法切換到統(tǒng)計方法。第二次升級是微軟帶來的,Geoffrey Hinton 將深度學習應用到語音識別,這兩者基本上是同步進行的,但應用至語音識別基本還是采用的Hidden Markov Model加上深度學習的混合體,并沒有像第三次的谷歌Transformer機器翻譯一樣有革命性的突破。
雷峰網:按照您的看法,OpenAI能夠成功的原因是什么?與微軟給了OpenAI一大筆投資有關嗎?
黃學東:OpenAI 現(xiàn)如今最顯著的特征就是「大」,太大便不好處理,一般人把握不住。這也是OpenAI和微軟云能取得矚目成功的原因。這背后的確與微軟給予的巨額資金支持有關。OpenAI里面的人有理想,工程化能力十分強大,這也是非常重要的原因。
OpenAI 取得了歷史性的突破,真正把 “Chat”這個東西做成了。當時陸奇在微軟的時候就說過“Chat”很重要,當時他還提出過一個概念,叫「chat as service」,只是當時這項研究沒有足夠的突破性技術來支撐項目落地。不得不說,陸奇一直具備十分優(yōu)越的技術敏感度和前瞻性。
雷峰網:您什么時候開始有離開微軟的想法?
黃學東:其實去年我們團隊推Azure OpenAI 服務之后,離職的念頭已經萌生。這次我獲得了美國的兩院院士之后,更堅定了離開的決心。
微軟很照顧我,建議我留下來。在我宣布離職之際,團隊里的很多成員全部抱頭痛哭,這個場景讓我十分震動與感動。回顧我在微軟的三十年,我對微軟非常感激,它教會了我很多東西。
(未來,雷峰網將持續(xù)關注人工智能等前沿領域的人事變動,歡迎添加作者微信:Maggie19970521 溝通交流)
參考鏈接:
https://www.microsoft.com/en-us/research/people/xdh/
https://www.microsoft.com/en-us/research/podcast/speech-and-language-the-crown-jewel-of-ai-with-dr-xuedong-huang/
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。