4
雖然語音識別被認為是目前應(yīng)用最多的人機交互方式之一,但它的體驗似乎并不理想,識別速度慢、準確率又低,這是很多用戶對語音識別的印象。然而,研究人員的測試表明,和手機屏幕上手動打字相比,語音識別能更快的、更準確的組織文本消息。
來自斯坦福大學、華盛頓大學以及百度的計算機科學家最近做出了一項測試:以iPhone作為硬件設(shè)備進行了中英文打字比賽實驗,一方是以百度硅谷人工智能實驗室去年發(fā)布的“Deep Speech 2”軟件為代表,另一方是32名年齡介于19歲至32歲的打字高手,錄入速度和準確率都由后臺測試軟件記錄。
斯坦福大學計算機科學系教授詹姆斯·蘭迪表示,“這些人從小打字,所以我們讓語音識別軟件與這些人所擅長的打字比拼”。
結(jié)果顯示,不論是英語還是中文,語音識別的速度以及準確率都比傳統(tǒng)鍵盤輸入要好。
英語:語音識別比打字快三倍,并且錯誤率低20.4%;中文普通話:語音比打字快了2.8倍,錯誤率則低了63.4%。
參與研究的斯坦福大學計算機科學系博士研究生阮珊珊表示,“我們之前知道語音識別的效果還不錯,預期的識別速度會比鍵盤打字快一些,但結(jié)果且讓人驚訝,這一速度幾乎快了3倍?!?/p>
當然百度的Deep Speech 2并不只是個例,對其它語音識別軟件來說同樣適用。蘭迪表示,“過去兩至三年間,得益于大數(shù)據(jù)和深度(人工智能)學習,語音識別確實改善不少,可以取得更快和更精確的結(jié)果?!?/p>
所以這些研究人員認為,其他一些新版本高準確度語音識別軟件也能達到上述效果。
推薦閱讀:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。