0
本文作者: siskin15 | 2015-01-06 07:30 |
半個(gè)世紀(jì)之前,我們?cè)陔娪啊?/span>2001太空漫游》中初次遇見了感覺敏銳的計(jì)算機(jī)Hal 9000。而50年之后,我們基本能用聲音指揮計(jì)算機(jī),更期望他們不只聽見我們,還要聽懂我們。但為了真正改善我們的生活,移動(dòng)設(shè)備除了處理所說的話,還要處理我們的意圖,以及我們所處情境。
開車時(shí),手機(jī)不應(yīng)期望你去觸碰它;睡覺時(shí),它要清楚要把來電直接送至語音信箱,除非是緊急來電,而且它也應(yīng)該能弄清楚來電原因;自拍時(shí),你應(yīng)該只用說“拍張自拍照”就好了。簡(jiǎn)單地說,智能手機(jī)應(yīng)該名副其實(shí)。
第二代Moto X的Moto Voice與Moto Assist軟件就以此為目標(biāo),而公司產(chǎn)品管理高級(jí)總監(jiān)Mark Rose也對(duì)開發(fā)過程作出了闡釋。
手機(jī)要具有適應(yīng)性與反饋性,為此Moto X就得時(shí)刻聽取來自用戶以及情境氛圍暗示的口令。這種行為由軟件與硬件間復(fù)雜的相互作用產(chǎn)生,來電時(shí),如果是非必須接聽,那么它就會(huì)淡入屏幕背景,而這一動(dòng)作則是來自手機(jī)的傳感器以及軟件的結(jié)果。它們會(huì)同時(shí)分析輸入信息,引發(fā)立即回應(yīng)。這一切的妙處都發(fā)生在界面的幕后。
Rose說:“所有這些進(jìn)程都會(huì)通過某種方式連接和分離,無縫使用。所以從用戶的角度說,只需對(duì)它說話,它就會(huì)為你辦事了?!?/p>
讓智能手機(jī)聽從指令是一項(xiàng)巨大挑戰(zhàn),麥克風(fēng)的信號(hào)必須過濾掉背景雜音,比如附近的交談聲、音樂聲、電視節(jié)目的聲音。
想想人類是如何在潛意識(shí)里運(yùn)用腦力,比如在人聲嘈雜的聚會(huì)上,人腦就會(huì)自動(dòng)無視所有其他人的聊天聲,只關(guān)注自己參與的對(duì)話。經(jīng)過訓(xùn)練后,Moto X能在其他人的雜音中識(shí)別出用戶聲音,而這涉及到性別、口音以及各種語言的計(jì)算機(jī)處理。
Rose對(duì)此表示:“測(cè)試與改善語音性能尤為艱難,人們是通過訓(xùn)練才理解的語音,但在移動(dòng)設(shè)備上使其奏效則存在著很多細(xì)微差別。我們已進(jìn)行了很廣的內(nèi)部測(cè)試,但真正的工作是在把軟件推向公眾之后。到那時(shí)我們擁有更大的樣本規(guī)模來改善技術(shù)?!?/p>
所謂的情境感知源自設(shè)備一系列紅外傳感器、加速計(jì),以及麥克風(fēng)對(duì)于用戶樣本數(shù)據(jù)的協(xié)調(diào)。當(dāng)用戶對(duì)麥克風(fēng)說話,或是在屏幕前面揮手,這些輸入數(shù)據(jù)會(huì)經(jīng)過“情境引擎”軟件處理。軟件會(huì)推測(cè)用戶在當(dāng)下所做的是什么,之后再?zèng)Q定最佳回應(yīng)。在很多情況下,正確的反應(yīng)也許就是不打擾用戶。例如,在駕駛的時(shí)候,Moto X就能調(diào)至純語音命令。
當(dāng)絕大多數(shù)人在使用自己的設(shè)備,思考它們會(huì)如何反應(yīng)的時(shí)候,Moto X軟件設(shè)計(jì)團(tuán)隊(duì)花費(fèi)了很多時(shí)間研究被稱之為“無用戶交互”的東西。這是一個(gè)有趣的設(shè)計(jì)問題:當(dāng)你在絕大多數(shù)時(shí)間不與手機(jī)互動(dòng),會(huì)發(fā)生什么?而Rose對(duì)此給出的答案就是,手機(jī)應(yīng)該能想清楚這問題。
拿Rose的例子來解釋就會(huì)非常清晰。某天早晨6點(diǎn),正當(dāng)他在上班路上時(shí),用口令給遠(yuǎn)在加州的妻子發(fā)了一條信息,告訴她現(xiàn)在室外有多冷。她回復(fù)道,”你知道我這里是凌晨4點(diǎn)嗎?“他回復(fù)說,”我沒意識(shí)到你的手機(jī)會(huì)叫醒你,我的手機(jī)就不做這種事?!?/p>
via medium
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。