3
本文作者: 硅谷鋒向標(biāo) | 2015-09-17 12:48 |
你可能聽(tīng)說(shuō)過(guò)這樣一個(gè)故事:1979年,當(dāng)年輕的喬布斯拜訪(fǎng)施樂(lè)公司位于Palo Alto的PARC研究中心時(shí),他看到了施樂(lè)新發(fā)明的的圖形用戶(hù)界面(GUI)。相比起傳統(tǒng)的文本界面,程序圖標(biāo)、窗口化、下拉菜單和絢麗的圖像效果把喬布斯狠狠震撼了一把。
“仿佛蒙在我眼睛上的紗布被掲開(kāi)了一樣?!薄秵滩妓箓鳌分腥绱嗣枋鰡滩妓巩?dāng)時(shí)的感受,“我看到了計(jì)算機(jī)產(chǎn)業(yè)的未來(lái)。”
喬布斯回到蘋(píng)果后,他立刻下令研究人員開(kāi)始著手模仿他剛看到的一切。這一技術(shù)在隨后上市的Macintosh上首次被應(yīng)用,并取得了轟動(dòng)效果。
PC歷史上的一個(gè)新時(shí)代也從此展開(kāi):圖形用戶(hù)界面開(kāi)始成為主流的交互方式,無(wú)論是第一臺(tái)Macintosh,還是最近上市的iPhone 6s,都無(wú)一例外地采用了圖形用戶(hù)界面。
其實(shí),這個(gè)故事還有一個(gè)很少有人知道的分支:就在喬布斯拜訪(fǎng)PARC的同時(shí),有另一支團(tuán)隊(duì)也在研究另外一種完全不同的人機(jī)交互方式,這種方式今天被稱(chēng)為“對(duì)話(huà)式界面”。該團(tuán)隊(duì)設(shè)想了這樣一個(gè)世界:在數(shù)十年后,當(dāng)計(jì)算機(jī)的功能足夠強(qiáng)大,用戶(hù)可以用通用的人類(lèi)語(yǔ)言與計(jì)算機(jī)進(jìn)行交互,幫助解決問(wèn)題。
在PARC領(lǐng)導(dǎo)自然語(yǔ)言研究團(tuán)隊(duì)的科學(xué)家叫Ronald Kaplan。Ronald的團(tuán)隊(duì)在上世紀(jì)70年代就設(shè)計(jì)了一個(gè)系統(tǒng), 能讓用戶(hù)以自然語(yǔ)言與計(jì)算機(jī)交換信息和訂購(gòu)機(jī)票。但對(duì)Ronald的團(tuán)隊(duì)來(lái)說(shuō),首當(dāng)其沖的就是成本問(wèn)題?!胺?wù)每個(gè)客戶(hù)的成本.......嗯,我猜大概要上百萬(wàn)美元吧?!盧onald如是說(shuō)。不僅如此,他們還需要更快、可以更好進(jìn)行分布式計(jì)算、更聰明和更高效的電腦。Ronald認(rèn)為,按摩爾定律,這或許需要15年的時(shí)間才能達(dá)到他們的要求。
事實(shí)上,他們等了將近40年
今天的Ronald Kaplan是一家叫做Nuance Communication公司的副總裁。Nuance不僅是蘋(píng)果Siri和福特專(zhuān)為手機(jī)配備的SYNC車(chē)載多功能通訊娛樂(lè)系統(tǒng)和的技術(shù)提供方,其合作伙伴更是涉及幾乎每個(gè)科技細(xì)分領(lǐng)域。但Nuance逐步發(fā)現(xiàn),近幾年有越來(lái)越多的人開(kāi)始進(jìn)入這一領(lǐng)域,無(wú)論是Amazon、Google還是微軟這樣的巨頭或是其他創(chuàng)業(yè)公司,都在試圖改進(jìn)Ronald和其團(tuán)隊(duì)近40年的研究成果:他們相信,總有一天你可以像和你的朋友對(duì)話(huà)一樣和各種設(shè)備對(duì)話(huà),而這些設(shè)備會(huì)正確理解和執(zhí)行你所說(shuō)的一切。這些新工具將會(huì)幕布那些圖形化用戶(hù)界面無(wú)法滿(mǎn)足用戶(hù)的安全和愉悅需求,反過(guò)來(lái),這些日漸增長(zhǎng)的對(duì)話(huà)式界面交互也使得你與設(shè)備之間更加親密和個(gè)人化。
但事實(shí)是:語(yǔ)音接口的效果仍然不盡如人意。
例如,不少公司已經(jīng)使用這一技術(shù)來(lái)做簡(jiǎn)單的客戶(hù)服務(wù),但在實(shí)際使用中,我仍然經(jīng)常需要放下電話(huà)用虛擬鍵盤(pán)輸入生日信息等內(nèi)容(可能和我的廣東腔英語(yǔ)有關(guān))。
至于Siri,如果是一些諸如問(wèn)路之類(lèi)的簡(jiǎn)單問(wèn)題倒是可以對(duì)付,但如果你的問(wèn)題邏輯太復(fù)雜把Siri逼急了,Siri也會(huì)無(wú)恥地給告訴你,外事不決問(wèn)Google,然后丟一個(gè)頁(yè)面給你讓你自己看去。像Tony Stark一樣和人工智能JAVIS那樣對(duì)話(huà)的場(chǎng)景,也只能出現(xiàn)在電影里。
不過(guò),這一切總在朝好的方向發(fā)展。
今年6月初,SoundHound的首席執(zhí)行官Keyvan Mohajer對(duì)外展示了一個(gè)從其2005年初創(chuàng)之時(shí)就一直在打磨作品。在此之前,我們對(duì)SoundHound的理解是一個(gè)流行音樂(lè)識(shí)別應(yīng)用,如果你對(duì)著手機(jī)哼上幾句歌,SoundHound就會(huì)識(shí)別這首歌曲的名稱(chēng)。但這款叫“獵犬”(Hound)的原型則更進(jìn)一步:一開(kāi)始,Keyvan問(wèn)的是一些簡(jiǎn)單的問(wèn)題,例如現(xiàn)在在柏林的時(shí)間、日本的人口等。突然Keyvan冒出一句:“它們之間相距多遠(yuǎn)?”根據(jù)之前的問(wèn)題,“獵犬”對(duì)此作出了正確的回答:“大約5536英里”。
在接下來(lái)的測(cè)試中,“獵犬”成功回答了諸如計(jì)算按揭貸款的數(shù)額以及“告訴我首都有Space Neddle這個(gè)建筑物的那個(gè)國(guó)家有多少人口?”之類(lèi)的問(wèn)題,對(duì)于Keyvan一口氣連珠炮發(fā)問(wèn)的多個(gè)問(wèn)題,一般人或許都需要想一陣才能反映過(guò)來(lái),但對(duì)于“獵犬”來(lái)說(shuō)同樣不在話(huà)下。就其表現(xiàn)而言,仍然處于內(nèi)側(cè)階段的“獵犬”或許是迄今為止速度最快、功能最全的語(yǔ)音識(shí)別系統(tǒng)。獵犬的牛逼之處在于可以同時(shí)進(jìn)行語(yǔ)音識(shí)別和自然語(yǔ)言處理,但對(duì)其他類(lèi)似系統(tǒng)而言,要迎頭趕上或許只是時(shí)間問(wèn)題。
對(duì)于上個(gè)世紀(jì)七十年代的Ronald來(lái)說(shuō),他們所頭疼的“門(mén)檻技術(shù)”現(xiàn)在已經(jīng)是任何一家語(yǔ)音識(shí)別公司都能輕易掌握的東西。
今天的對(duì)話(huà)式界面技術(shù)是一個(gè)經(jīng)典的跨界融合:技術(shù)計(jì)算能力的增長(zhǎng)、語(yǔ)音識(shí)別、移動(dòng)通信、云計(jì)算和神經(jīng)網(wǎng)絡(luò)都在同一階段達(dá)到一個(gè)臨界點(diǎn),最終使得這一領(lǐng)域的研究者開(kāi)發(fā)出足夠好、足夠便宜和無(wú)處不在的實(shí)時(shí)對(duì)話(huà)界面。
而這種交互方式的發(fā)展,也進(jìn)一步推進(jìn)了那些沒(méi)有屏幕的聯(lián)網(wǎng)設(shè)備(例如路由器或者煙霧報(bào)警器之類(lèi)),畢竟對(duì)于這些設(shè)備,我們需要的是一種不需要按鈕、菜單和圖標(biāo)的自然交互方式。
而在另一方面,由喬布斯發(fā)揚(yáng)光大的GUI世界正處于一個(gè)令人尷尬的瓶頸期。
圖形用戶(hù)界面要求每一個(gè)動(dòng)作和功能都有一個(gè)圖標(biāo)或者菜單選項(xiàng),但即便像我們每天都要使用的Photoshop或者Excel,你所熟悉的可能也就只有最常用的幾個(gè)操作,真要完全掌握所有功能足以把大多數(shù)人逼瘋。Ronald也承認(rèn),現(xiàn)在的圖文用戶(hù)界面已經(jīng)幾乎達(dá)到了天花板。
如果想要再進(jìn)一步,你可能不得不讓虛擬助理來(lái)幫你解決問(wèn)題——不管是iOS 9、Android 6、Windows 10還是Siri、Google Now和Cortana,巨頭們都在通過(guò)虛擬助理的方式幫助用戶(hù)提高效率。哦對(duì)了,另外一家不做操作系統(tǒng)但具有十億級(jí)用戶(hù)的巨頭Facebook也有智能助手Ask M。
對(duì)于這些虛擬助理而言,他們的出現(xiàn)并不是要替代觸摸屏或者圖形用戶(hù)界面,但技術(shù)的進(jìn)步會(huì)在很大程度上繞開(kāi)GUI,例如不少00后已經(jīng)懶得打字而直接用麥克風(fēng)輸入文本,而對(duì)于像老年人或者部分殘障人士(例如視力障礙)來(lái)說(shuō)至關(guān)重要。
這是另一個(gè)創(chuàng)業(yè)故事:2010年,24歲的有志青年Maury被醫(yī)生告知,他的視力在衰減并最終會(huì)失明。Maury意識(shí)到,他不得不考慮如何在看不到東西的情況下使用電腦,而這也是美國(guó)2000多萬(wàn)視力障礙人士會(huì)遇到的問(wèn)題?,F(xiàn)有的解決方案是一種叫做“Screen Reader”(屏幕閱讀器)的技術(shù),已經(jīng)有30年的歷史,但隨著數(shù)字化環(huán)境越來(lái)越復(fù)雜(很大程度是Android的錯(cuò)),這一技術(shù)已經(jīng)跟不上時(shí)代。
發(fā)現(xiàn)了這一需求,Maury開(kāi)始創(chuàng)辦了一家叫做Conversant Labs的公司,針對(duì)視力障礙人士開(kāi)發(fā)能夠用語(yǔ)音來(lái)操作的應(yīng)用和服務(wù)。Conversant的第一款產(chǎn)品叫做SayShopping,可以幫助視力障礙人士通過(guò)語(yǔ)音在Target上買(mǎi)東西,在下一步,Maury還計(jì)劃在今年年底前完成一個(gè)能為iOS應(yīng)用添加對(duì)話(huà)互動(dòng)的框架,便于開(kāi)發(fā)者開(kāi)發(fā)針對(duì)視力障礙人士的產(chǎn)品。
另一個(gè)例子是Amazon的Echo。在剛面世時(shí),有人這么評(píng)價(jià)Echo:這款產(chǎn)品希望同時(shí)扮演無(wú)線(xiàn)音樂(lè)播放器和虛擬助手兩種角色,但不管哪個(gè)角色都表現(xiàn)一般。但隨著使用時(shí)間的增加,Echo的自動(dòng)學(xué)習(xí)能力開(kāi)始顯現(xiàn)出效果,逐步適應(yīng)使用者的說(shuō)話(huà)速度、模式和偏好,更符合用戶(hù)的需求。
這也是對(duì)話(huà)式界面和圖形用戶(hù)界面的不同:你的使用時(shí)間越多,它就會(huì)和你更親近。毫無(wú)疑問(wèn),開(kāi)發(fā)虛擬助手的巨頭們也注意到了這一點(diǎn),例如微軟就給其虛擬助手Cortana(中國(guó)官方名稱(chēng)“小娜”)一個(gè)鄰家女孩般的個(gè)性形象。
不管是蘋(píng)果、Google、微軟、Nuance或者其他這一領(lǐng)域的創(chuàng)業(yè)公司,他們的結(jié)論都是一致的:基于語(yǔ)音接口的個(gè)人代理的出現(xiàn)可以了解你的喜好、你的日常行為、你的表達(dá)方式、你的習(xí)慣和進(jìn)展程度,從而幫助你更高效地去使用各種App和設(shè)備。
這就好比我們生活中的水和空氣,不引人注意又無(wú)處不在,一旦你已經(jīng)習(xí)慣,它就會(huì)成為你生活中不可或缺的一部分,再也無(wú)法分開(kāi)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。