0
本文作者: 呂倩 | 2018-01-23 12:02 |
雷鋒網(wǎng)按:如今風(fēng)靡海內(nèi)外的各款智能音箱,均有一個(gè)喚醒詞,包括“小度小度”“若琪”“叮咚叮咚”等。他們?yōu)槭裁唇羞@些名字?本文是來自百度AI 交互設(shè)計(jì)院(微信:gh_8d606ce3c1a5)的投稿,他們通過實(shí)驗(yàn)的方式、從數(shù)據(jù)角度,分析這些喚醒詞的特征,告訴你,智能語音交互產(chǎn)品該“叫”什么名字。雷鋒網(wǎng)對文章作了不改變原意的編輯。
在討論名字之前,首先對語音交互過程中的一些定義做一個(gè)簡單的介紹。
據(jù)雷鋒網(wǎng)了解,語音交互的過程與平時(shí)人與人之間交流的方式非常相似,有問有答。比如某個(gè)陰天,你對同事呼喊稱:“小明”,小明聽到了抬頭看你表示在聽,你接著問“今天會下雨么?”小明打開手機(jī)查了一下今天的天氣預(yù)報(bào),然后回答你說“天氣預(yù)報(bào)說下午3-4點(diǎn)有雷陣雨”。
智能音箱亦如此,其語音交互流程被劃分為五個(gè)環(huán)節(jié) – 喚醒、響應(yīng)、輸入、理解、反饋。其中喚醒是每一次用戶與語音產(chǎn)品交互的第一個(gè)接觸點(diǎn),喚醒環(huán)節(jié)的體驗(yàn)在整個(gè)語音交互流程中至關(guān)重要,它的體驗(yàn)好壞將直接影響用戶對產(chǎn)品的“第一印象”。
同時(shí),盡管是“智能”語音交互產(chǎn)品,機(jī)器仍沒有人類聰明。據(jù)雷鋒網(wǎng)了解,對于目前市面上常見的語音交互產(chǎn)品來說,一個(gè)眼神或者一個(gè)動作還不能引起它的注意,因此需要定義一個(gè)將產(chǎn)品從待機(jī)狀態(tài)切換到工作狀態(tài)的詞語,即所謂的“喚醒詞”。
同樣是上文所提到的“問天氣”案例。通過呼喊“小明”的名字,來引起他的注意,而對于智能語音交互產(chǎn)品,也需要通過叫出“名字”,也就是喚醒詞來激活設(shè)備。以智能音箱產(chǎn)品為例,“小度小度”是喚醒渡鴉raven H的喚醒詞,“Hey Google”是喚醒Google Home的喚醒詞,“Alexa”是喚醒Echo的喚醒詞。
據(jù)雷鋒網(wǎng)了解,影響語音喚醒體驗(yàn)的因素包含兩個(gè)維度——輸入和輸出。輸入環(huán)節(jié)的影響因素包括喚醒詞、喚醒方式,輸出環(huán)節(jié)的影響因素包括喚醒響應(yīng)速度、喚醒反饋方式、喚醒成功率和誤喚醒率。
而對于用戶來說,喚醒詞是語音喚醒輸入環(huán)節(jié)中較為重要的影響因素,且一個(gè)好的喚醒詞,會直接影響喚醒率。
針對喚醒詞,主要通過以下兩個(gè)實(shí)驗(yàn)進(jìn)行了研究:
實(shí)驗(yàn)一:現(xiàn)有喚醒詞組合方式研究
實(shí)驗(yàn)二:喚醒詞語音要素研究
首先,對市場上各類語音交互設(shè)備喚醒詞的組合方式進(jìn)行拆解,發(fā)現(xiàn)喚醒詞均是在一個(gè)簡單“名字”的基礎(chǔ)上加以變化而構(gòu)成,此外,“名字”本身也具備不同的構(gòu)成方式。在實(shí)驗(yàn)中,為用戶提供不同組合方式的喚醒詞,由用戶根據(jù)其個(gè)人喜好程度在5點(diǎn)量表上進(jìn)行評價(jià)(1-非常不喜歡、2-不喜歡、3-一般、4-喜歡、5-非常喜歡)。
實(shí)驗(yàn)結(jié)果表明,不同組合方式下,用戶的喜好程度不同:
1)在以“名字”為基礎(chǔ)的不同組合方式中,“名字+名字”的疊詞式組合方式最受用戶喜歡,而“品牌+名字”的組合方式最不被用戶喜歡。
2)另外,就“名字”本身而言,“小+字”的名字最受用戶喜歡。這點(diǎn)也與漢語人名命名習(xí)慣相符,《漢語人名用字的統(tǒng)計(jì)分析(鄭淑花,2010)》顯示,“小”字在人名命名十大常用字之中。
據(jù)雷鋒網(wǎng)了解,音節(jié)是聽覺上最容易分辨出來的語音單位,也是最自然的語音單位,漢字中一個(gè)漢字讀音就是一個(gè)音節(jié),每個(gè)基本音節(jié)都是由聲調(diào)、聲母和韻母三個(gè)部分構(gòu)成。
理想條件下,對喚醒詞每一音節(jié)的聲調(diào)、聲母、韻母進(jìn)行研究,但是由于音節(jié)數(shù)的增加,研究變量數(shù)將大幅度增長,導(dǎo)致無法通過一次實(shí)驗(yàn)來完成。
另外,通過文獻(xiàn)查閱,發(fā)現(xiàn)人們在起漢語人名時(shí),會將尾音節(jié)的發(fā)音情況列入考量,同時(shí),漢語人名/寵物名統(tǒng)計(jì)研究中也多見其對尾音節(jié)發(fā)音情況的統(tǒng)計(jì)。
因此,綜合文獻(xiàn)和前文實(shí)驗(yàn)的結(jié)論,本次實(shí)驗(yàn)中以喚醒詞尾音節(jié)為研究對象,選取“小+字”的構(gòu)詞結(jié)構(gòu),變換尾音節(jié),進(jìn)行喚醒詞的發(fā)音偏好實(shí)驗(yàn)。同時(shí)為避免用戶受漢字本身字義的影響,實(shí)驗(yàn)中用戶看到的喚醒詞均為標(biāo)有聲調(diào)的拼音。在實(shí)驗(yàn)中,要求用戶根據(jù)其個(gè)人喜好程度在5點(diǎn)量表上對喚醒詞進(jìn)行評價(jià)(1-非常不喜歡、2-不喜歡、3-一般、4-喜歡、5-非常喜歡)。
實(shí)驗(yàn)結(jié)果表明:
1)聲調(diào)方面,用戶最喜歡陰平(1聲);另外相較“仄聲”(3聲上聲、4聲去聲統(tǒng)稱為“仄”),用戶更加喜歡“平聲”(1聲陰平、2聲陽平統(tǒng)稱為“平”)。
2)聲母方面,用戶更加喜歡尾音聲母為零聲母,而包含了z、c、s的舌尖前音最不被用戶所喜歡。
3)韻母方面,從韻母發(fā)音時(shí)的開口口型來看,用戶更喜歡開口口型較大的齊齒呼和開口呼;另外從韻母結(jié)構(gòu)來看,音節(jié)韻母為單韻母的詞最受用戶的喜歡。
本文主要圍繞智能語音交互設(shè)備的喚醒詞展開研究,從喚醒詞組合方式和語音要素兩個(gè)方面探討了影響用戶體驗(yàn)的因素,發(fā)現(xiàn):
1)現(xiàn)有喚醒詞組成方式方面:
在以“名字”為基礎(chǔ)的不同組合方式中,“名字+名字”的疊詞式組合方式最受用戶喜歡,而“品牌+名字”的組合方式最不被用戶喜歡;
就“名字”本身而言,“小+字”的名字最受用戶喜歡。
2)語音要素方面:
聲調(diào):用戶最喜歡陰平,同時(shí)相較“仄聲”,用戶更加喜歡“平聲”;
聲母:用戶更加喜歡尾音聲母為零聲母,而包含了z、c、s的舌尖前音最不被用戶所喜歡;
韻母: 按照韻母發(fā)音時(shí)的口型開口情況來看,用戶更喜歡開口口型較大的齊口呼和開口呼;另外按照韻母結(jié)構(gòu)來看,音節(jié)韻母為單韻母的詞最受用戶的喜歡。
基于本文的研究,雷鋒網(wǎng)讀者們是否已經(jīng)掌握如何構(gòu)造一個(gè)好的喚醒詞的方法了?以下是結(jié)合收集的用戶自定義喚醒詞及本文研究結(jié)論,為喚醒詞作出的分類,供讀者們應(yīng)用參考。
需要注意的是,本文是從用戶視角出發(fā),對喚醒詞進(jìn)行了科學(xué)的研究和探討,但是實(shí)際在設(shè)計(jì)喚醒詞時(shí),需要考慮的因素還有很多,如:喚醒詞是否過于常見導(dǎo)致語音設(shè)備容易被誤喚醒,喚醒詞與品牌之間是否具有關(guān)聯(lián)。另外,受當(dāng)前語音技術(shù)的限制,現(xiàn)有的喚醒詞多以4音節(jié)詞居多,但未來隨著語音技術(shù)的進(jìn)步,喚醒詞的長度存在變短的趨勢,在設(shè)計(jì)喚醒詞時(shí)還應(yīng)考慮其可優(yōu)化的空間等等。
特別注明:由于實(shí)驗(yàn)設(shè)定的條件和樣本數(shù)量等限制因素,本次實(shí)驗(yàn)研究結(jié)論或許不能代表所有智能產(chǎn)品用戶在家居環(huán)境的全部感受。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。