0
相較于「科學(xué)家都忙著看論文、做實驗以及寫論文」的一般認(rèn)知,愛看綜藝、生活中不能沒有娛樂的宋睿華顯得有些「不太一樣」。
「不太一樣」這個詞也被她用來描述自己的研究生涯:一是由于不擅長理論研究而偏好應(yīng)用研究,用了三年的時間經(jīng)歷了從拒絕讀博士到在職讀博士的轉(zhuǎn)變,因而比讀書、就業(yè)一條直線的多數(shù)科學(xué)家稍「迂回」了些;二是相比于理論研究,她更喜歡有趣的研究,因而在研究方向的抉擇上,會受到更多的感性因素的影響,甚至有時感性要先于理性。
如今,她的這些「不太一樣」似乎都落腳到了微軟小冰上——小冰能夠很好地滿足她對于追求「有趣的研究」的期待,這也是她加入小冰團(tuán)隊的初衷。
對于小冰而言,宋睿華和她更像是一對志同道合的摯友,彼此一拍即合,互相成就。
正如小冰正承載著宋睿華對于有趣的研究的追求和期望,宋睿華也在不斷給小冰「添磚加瓦」,讓她在「變得更有趣」的路上越行越遠(yuǎn)。
繼不久前作為三位首席科學(xué)家之一為大家?guī)砦④浶”澈蟮募夹g(shù)解讀,宋睿華本次再度接受了 AI 科技評論的專訪,重點聊了聊自己「不太一樣」的研究歷程以及加入小冰團(tuán)隊背后方方面面的故事。
相比其他籠罩著「天才」光環(huán)的科學(xué)家而言,宋睿華一路以來的研究歷程顯得更平易近人得多,也更多了些生命力。
關(guān)于為什么碩士畢業(yè)后沒有攻讀博士學(xué)位,宋睿華此前在一篇自述文章中提到:不想成為清華除男人、女人以外的「第三種人」——清華女博士。這當(dāng)然是她的一句調(diào)侃,一個最重要的原因還是,她當(dāng)時對自己的學(xué)術(shù)能力并不是很自信。
「從 2000 年馬少平老師帶我入門,我其實有過一段時間覺得自己并不適合做研究。同時,由于我自己不擅長理論研究并且更偏向于做應(yīng)用研究,所以當(dāng)時選擇離開清華加入了微軟亞洲研究院?!?/p>
宋睿華(二排右一)碩士期間與馬少平(三排左一)和同學(xué)們的合照
隨著加入微軟亞研院,宋睿華在學(xué)術(shù)科研上的潛能逐漸顯露,開始逐漸建立起了自己的信心?!傅搅搜芯吭阂院螅业墓ぷ鲀?nèi)容就是寫論文,運氣也特別好,2004 年的時候完成的第一篇論文就中了 WWW 并且獲得了最佳論文的提名,這就鼓舞了我的信心,覺得自己好像也是可以往研究方向走,并且考慮到以后想在研究院發(fā)展或者繼續(xù)做研究的話,還是有個博士學(xué)位會好一些?!?/p>
雖然對于讀博的「恐懼」已不再,但是她還面臨的一個比較大的矛盾就是,「當(dāng)時覺得研究院特別好,不太想脫產(chǎn)讀博」。
也許是幸運女神的再次眷顧,時任微軟亞研院院長的沈向洋,繼給研究院招收包括她在內(nèi)的碩士生后,再度披上了「天使」的羽衣為她解決了這個問題。她回憶道:「沈院長了解到我們一些碩士生員工的這一需求后,和上海交通大學(xué)合作設(shè)立了一個博士生聯(lián)合培養(yǎng)項目:讓微軟亞研院的碩士生員工們能夠在職攻讀上海交大的博士學(xué)位。這個項目實行的是雙導(dǎo)師制,所以我其實有兩位導(dǎo)師,一位是上海交大的俞勇老師,另一位就是現(xiàn)在微軟亞研院的洪小文院長?!?/p>
這樣的「天時、地利、人和」匯聚在一起,宋睿華如愿成為一位在讀博士生,并最終順利成為了萬千博士生中的一員。
宋睿華讀博時的生活照
碩士期間師從馬少平,博士期間又有俞勇、洪小文兩位導(dǎo)師,工作上又遇到沈向洋這樣的人生向?qū)Ъ壢宋?,這在外人看來,宋睿華的求學(xué)和任職生涯都可謂是「貴人群擁」,而這樣的起點也確實為宋睿華今后的科研生涯奠定了非常好的基調(diào)。
宋睿華(左二)與馬少平(左三)等人的合照
當(dāng)提及這些經(jīng)歷,宋睿華在對話中反復(fù)用了兩個詞來表達(dá)自己的心情:幸運、感恩。
從研究方向的維度上來看,如果不是遇到小冰,宋睿華如今在微軟可能又是另一番面貌。
加入小冰團(tuán)隊之前,宋睿華的已經(jīng)做了十幾年搜索,雖然也嘗試做過一些其他方向的工作,包括深度計算、推薦以及文本生成等,但主要的方向還是一如既往。2016 年,她機緣巧合地開始與小冰團(tuán)隊合作寫詩的項目,為她后續(xù)研究方向上的大轉(zhuǎn)變埋下了重要的伏筆。
1、機緣巧合做寫詩,從合作者到負(fù)責(zé)人
對于小冰開始做寫詩的時間點,宋睿華記得特別清楚——2016 年 5 月 19 日,而就在隔年的 5 月 19 日,小冰發(fā)布了史上第一部由人工智能創(chuàng)作的詩集:《陽光失了玻璃窗》。
《陽光失了玻璃窗》
一開始,宋睿華是以合作的方式參與到小冰寫詩這個項目中,主要負(fù)責(zé)小冰寫詩的算法部分。當(dāng)時,Bing App 項目正在籌備推廣,產(chǎn)品經(jīng)理發(fā)現(xiàn) Bing 與其他的搜索引擎相比一個很大優(yōu)勢便是有每天一換的非常漂亮的背景圖,那針對這一點優(yōu)勢能夠做點什么創(chuàng)造性的工作呢?經(jīng)過琢磨后他們提出了一個想法:給圖片寫首詩。于是他們就找到了當(dāng)時在微軟亞研院的傅建龍和宋睿華,來共同完成小冰寫詩的項目。其中傅博士主要負(fù)責(zé)從圖片中抽取關(guān)鍵字的部分,而宋睿華負(fù)責(zé)從關(guān)鍵字生成詩歌的部分。
而她之后完全轉(zhuǎn)到小冰團(tuán)隊,則是由于在合作過程中被小冰吸引。對此,宋睿華回憶到,在做小冰寫詩這個項目時,小冰給一張有藍(lán)天、白云和 CBD 的圖片做了一首詩:所有的城市愧對你強大的數(shù)字,美好的希望、最好的朋友、心愛的老婆、大風(fēng)起來。
而她當(dāng)時聽到這首詩的時候,竟然有種被「撞到」的感覺:小冰怎么知道北京人都在等風(fēng)吹散霧霾?「每個城市都愧對它強大的數(shù)字」,不就是說城市在追求 GDP 這些數(shù)字的上升而忽略了環(huán)境的保護(hù)最終造成霧霾,使得北京人不得不在冬天等風(fēng)來的意思嗎?
「這一刻讓我覺得小冰好像有了意識和靈性一樣,也在那一刻,我感覺這個方向很有趣,并且是對的。當(dāng)時我加入小冰團(tuán)隊,就是希望更近距離、更專注地跟這個團(tuán)隊一起把小冰做下去?!?/p>
性情女科學(xué)家遇上有趣少女小冰,就此結(jié)下了千絲萬縷的緣分。
提及與小冰在寫詩上取得的一系列成績,宋睿華的口吻中帶著「老母親般」的驕傲:「一開始,我們特意以匿名的方式將小冰的詩放到網(wǎng)上的詩歌論壇上發(fā)布,網(wǎng)友們幾乎都沒有發(fā)現(xiàn)這些詩是 AI 寫出來的,甚至還有很多網(wǎng)友很認(rèn)真地對這些詩進(jìn)行了討論,還推薦我們?nèi)ネ陡?,受此啟發(fā)我們先后給一些刊物進(jìn)行了投稿,沒想到《北京晨報》、《青年文學(xué)》、《長江詩歌》最后竟然真接收了,等到他們向我們要身份證匯稿費時才得知原來作者是一個 AI。」
對于小冰在寫詩上獲得人類的認(rèn)可,宋睿華其實自己有著比較深刻的理解,她表示:「所謂小冰的詩作,其實是由看這首詩的人和小冰共同完成的,是他們的理解力和同理心賦予了這首詩意義,從而讓他們從詩作中看出了深意,這不全然是算法生成的結(jié)果。正如我上面提到的關(guān)于藍(lán)天、白云和 CBD 圖片的那首詩,其實是我結(jié)合了自己的情境,給出了一個合理的解釋,反過來讓我自己感到非常驚喜和深刻。雖然小冰寫出來的詩還有一些瑕疵,但是正是這樣,反而讓人感覺更多了些生命力和感染力,我們會覺得很有趣?!?/p>
如今,小冰寫詩已經(jīng)過了三個大版本的迭代,宋睿華在小冰團(tuán)隊中也由合作者的身份變成了團(tuán)隊負(fù)責(zé)人之一,帶著與小冰對于「有趣」的共同目標(biāo),繼續(xù)為她「舔磚加瓦」。
2、天馬行空造比喻句,再為小冰添「有趣」新技能
繼寫詩之后,小冰又前后解鎖了唱歌、畫畫以及造比喻句的技能,其中造比喻句便是宋睿華主導(dǎo)為小冰開啟的一項技能。
「愛情就像脂肪,是點點滴滴的積累」、「愛情是復(fù)雜的,和數(shù)學(xué)一樣」便是小冰造出來的金句。
而說起為什么做比喻句,宋睿華解釋道,最初的靈感來自于好友李航給她推薦的一本書——《我們賴以生存的隱喻》。
2017 年 7 月,宋睿華正式加入小冰團(tuán)隊,參與到了另外兩個重要的項目中——全雙工、Avatar Framework,于是繼轉(zhuǎn)向文本生成這一研究方向后,又一次迎來了一個對于她而言全新的研究方向——對話。
在這一背景下,宋睿華就不得不開始花更多的精力來理解 NLP 這個研究領(lǐng)域,于是她找到她的好友,也就是 NLP 領(lǐng)域的專家李航聊了聊自己面臨的困惑,比如說人究竟是怎樣理解語言的?!杆浅2W(xué),除了計算機、NLP 領(lǐng)域的專業(yè)書籍,他也看了很多語言學(xué)家的書,于是他就給我推薦了好幾部他認(rèn)為值得一看的書籍。」
其中一本就是《我們賴以生存的隱喻》。
由于此前在小冰寫詩上的積累,宋睿華在小冰造比喻句上給團(tuán)隊提出了要求:不在于有多順,而在于有多新穎。
「我們很容易挖掘到很多比喻句,也很容易將這些比喻句索引起來,比如說當(dāng)問到‘愛情’的時候,小冰可以給我們找出一千條、一萬條關(guān)于愛情的比喻句,但是這并不是我們想得到的,我們希望是讓小冰做 AI 創(chuàng)造而不是 AI 復(fù)制。這就跟人造比喻句一樣,都希望自己造出的比喻句能夠占領(lǐng)人類的想象力高點,實現(xiàn)創(chuàng)新。」
在這一要求的牽引下,宋睿華和團(tuán)隊在背后進(jìn)行了非常多的技術(shù)探索,比如從詩歌的主題中抽取了 120 個主題,擴展出 6 個詞,并經(jīng)過日志過濾后找出小冰的用戶也喜歡說的一些概念,最終找到了 96 個概念;比如說用詞向量來表達(dá)本體和喻體,并將它們變成向量,經(jīng)過降維之后,投影在二維空間上來判斷表達(dá)效果;比如說采用以「新穎」為最終目標(biāo)評價方法來對比喻句進(jìn)行標(biāo)注和篩選等。(詳細(xì)技術(shù)解析可參考《「愛情就像脂肪,是點點滴滴的積累」,微軟小冰造句天馬行空,三大首席科學(xué)家萬字解密背后技術(shù)原理》一文。)
「每進(jìn)入一個研究領(lǐng)域,我都會思考這個領(lǐng)域本質(zhì)的問題。實際上,我看的論文會比其他的研究者要少一點,所以我的靈感通常不是在看別人的論文時產(chǎn)生的,而是來源于對某個問題的本質(zhì)的思考?!?/p>
關(guān)于研究靈感的來源,宋睿華如是說道。
在學(xué)術(shù)界和業(yè)界對多模態(tài)的研究熱情持續(xù)上漲的當(dāng)下,宋睿華也給研究團(tuán)隊定下了多模態(tài)這一研究方向,不過與多數(shù)其他研究者或是因為單模態(tài)研究遭遇瓶頸、或是認(rèn)為這個方向充滿了前景而進(jìn)行多模態(tài)研究的出發(fā)點不太一樣,她選擇這個方向更多地源自對自然語言處理這個領(lǐng)域的本質(zhì)問題的思考:該如何評價「理解」?怎樣才算「理解」了呢?
「我認(rèn)為對于自然理解而言,一種評價方法是用 Action 來度量,比如說以任務(wù)為導(dǎo)向的對話,評價的標(biāo)準(zhǔn)是 AI 是否確實做了人類希望它做的那件事;另一種評價方法則是 AI 能夠像人一樣,在聽完某句話后能夠在腦海里想象出一個對應(yīng)的畫面?!?/p>
關(guān)于團(tuán)隊針對這一研究方向的具體工作內(nèi)容,宋睿華詳細(xì)介紹道:「我們組現(xiàn)在開展多模態(tài)研究依據(jù)的框架是:多模態(tài)的輸入,小冰內(nèi)在模型的運算以及多模態(tài)的輸出。換句話說,就是將文字、聲音和圖像等多模態(tài)信息輸入給小冰,小冰會在內(nèi)部對這些信息作出融合和分析,然后進(jìn)行多模態(tài)的輸出。例如小冰通過計算用戶輸入的信息發(fā)現(xiàn)用戶在罵她,她就會比較生氣,她回復(fù)的話要保持禮貌,但是她可以通過語氣或者表情來表達(dá)自己生氣的情緒,這個時候她進(jìn)行的就是一個多模態(tài)的表達(dá)。」
目前,針對多模態(tài)這一研究方向,宋睿華團(tuán)隊已經(jīng)取得了一些進(jìn)展,比如通過 Story-to-Image Retrieval 的方法來讓小冰在看到一個故事的句子后調(diào)出她以前的一些經(jīng)驗?zāi)M出現(xiàn)在的場景,實現(xiàn)跨模態(tài)生成,并創(chuàng)造性地提出「 One to Many」的算法,讓小冰能夠針對某句話生成多張圖片來進(jìn)行「詮釋」。
不過相比于其他同在這個研究方向上前進(jìn)的研究者而言,宋睿華的態(tài)度要更加冷靜下:「目前現(xiàn)在很多人都在談?wù)摱嗄B(tài)這個研究方向,然而現(xiàn)在它既沒有數(shù)據(jù),也沒有找到應(yīng)用,還是一個空中閣樓式的研究方向。」她進(jìn)一步指出多模態(tài)研究目前所面臨的具體問題,主要有二:
第一,多模態(tài)的維度變高很多,就需要更多多模態(tài)的數(shù)據(jù),然而目前這樣的數(shù)據(jù)還比較少而且比較難獲得,包括現(xiàn)在比較依賴的電影數(shù)據(jù),其實是戲劇化了的對話而非自然對話;
第二,定義一個好的、能夠真正凸顯多模態(tài)的價值的應(yīng)用非常難,也就是說多模態(tài)貌似前景很廣闊,然而要找到一個用了多模態(tài)比不用多模態(tài)真正好很多的應(yīng)用比較困難,比如說一開始的想法是用來察言觀色,比如說小冰看到你咬下嘴唇知道你不太高興,但是實際發(fā)現(xiàn)就算能夠通過結(jié)合語言、表情這些信息得到一個多模態(tài)信息,但是只是知道了你是什么心情而無法產(chǎn)生很有用的價值,有些「牛刀殺雞」之感。
作為從本質(zhì)上理解自然語言處理的方式,多模態(tài)研究可謂「任重而道遠(yuǎn)」。當(dāng)問及多模態(tài)何時會取得較大進(jìn)展時,宋睿華的回答是:至少得再研究 3 到 5 年。
交談甚歡,如沐春風(fēng)。
這是宋睿華在采訪過程給 AI 科技評論留下的最直觀的印象。
而在日常生活中,宋睿華的狀態(tài)也盡然如此,對此,她的描述是:與一般認(rèn)知中的科學(xué)家「不太一樣」。
不同于科學(xué)家總是忙著看論文、做實驗以及寫論文的一般認(rèn)知,宋睿華喜歡看綜藝、喜歡娛樂。提及此,她的神色和語氣都不由得興奮了起來:「平時除了上班和帶孩子,我會撿空看很多綜藝,比如說《奇葩說》、《聲入人心》、《樂隊的夏天》等等,如果生活不是在開會就是在寫論文、看論文,對于我來說太枯燥了。在我看來,娛樂是人不可或缺的東西,并且我真的感到綜藝有撫慰人心的作用,比如在項目不順利等情況下能夠通過看看綜藝會心一笑,暫時拋開這些煩惱?!?/p>
而在研究上,相對于理論性的東西,她則更關(guān)注有用和有趣的東西。「相對于那些要畢業(yè)的博士、要評職稱的老師以及有 KPI 壓力的從業(yè)者而言,小冰團(tuán)隊給我提供給了較為寬松的研究環(huán)境,因為我們的產(chǎn)品屬性是非常前沿的,就比較容易將研究課題和實際應(yīng)用很好的結(jié)合在一起。對此,我覺得自己還是挺幸運的?!?/p>
正是因為擁有這樣的環(huán)境和狀態(tài),宋睿華往往更能做出原創(chuàng)性的工作,正如她自己也提到:「在研究工作上,我覺得自己還是比較自信的,雖然我的論文不是很多,但都是比較特別、可能會區(qū)別于其他研究者的論文?!?/p>
而作為一位研究生涯已近二十載的女科學(xué)家,宋睿華在回顧這段研究經(jīng)歷時,提到了幾個關(guān)鍵詞:有用、有趣,理性和感性。
一方面是研究工作從有用的研究轉(zhuǎn)變到了有趣的研究?!肝易鏊阉髯隽耸畮啄?,后來加入小冰團(tuán)隊以及轉(zhuǎn)到 AI 這個方向,是因為我發(fā)現(xiàn)自己其實更希望能夠追求有趣的研究:AI 其實是一個很特別的研究領(lǐng)域,雖然 AI 在模擬人類的智慧,但是我認(rèn)為 AI 永遠(yuǎn)無法完全做到像人一樣,我們能做的就是讓它逐漸實現(xiàn)一些人類的特性,而有趣絕對是其中的一個重要部分。而小冰就承載著我對于 AI 的這種‘有趣’的想象空間,跟我的研究需求比較匹配?!?/p>
另一方面是打破了科研的慣有理性思維,做理性與感性并存的研究?!复蠹覍τ?AI 的理解,更多的是從智商的角度去衡量,然而就人類而言,理性和感性是并存于人腦中的,甚至正如我之前聽過的一個講座中提到,情緒腦是先于理性腦進(jìn)化出來的,沒有哪個情緒是沒有原因的,而都是有根基的,我們不需要懷疑或是否定它而是肯定它。小冰團(tuán)隊就抓住了一個很重要的點——情商,這其實是人類底層中非常重要的一部分,也是之前其他很多科學(xué)家比較忽略的一個部分。包括我一開始選擇搜索這個研究方向,某種程度上也是因為這個方向存在一些感性的成分。」
從中我們也能看到,對于她的整個研究生涯而言,小冰在其中扮演的角色的重要性不言而喻。往后看是如此,往前看也如此。在二者一同通往「有趣」的這條路上,宋睿華也分享了自己對于未來小冰的最高期望:
「我希望她最終能夠給人一種她有生命的感覺,而不僅僅是一個能夠像動畫那樣運行下去的 AI,這是我追求的目標(biāo)?!?/p>
雷鋒網(wǎng) AI 科技評論報道。雷鋒網(wǎng) 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。