丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
AIoT 正文
發(fā)私信給程弢
發(fā)送

3

思必馳雷雄國:語音識(shí)別將是萬億級物聯(lián)網(wǎng)設(shè)備的標(biāo)配 | 萬物互聯(lián)創(chuàng)新大會(huì)

本文作者: 程弢 2016-11-14 23:50
導(dǎo)語:小至智能音響,大到風(fēng)力發(fā)電機(jī),這些物聯(lián)網(wǎng)設(shè)備的交互方式都會(huì)在未來得到改變,而語音識(shí)別就是這一改變的動(dòng)力來源,

思必馳雷雄國:語音識(shí)別將是萬億級物聯(lián)網(wǎng)設(shè)備的標(biāo)配 | 萬物互聯(lián)創(chuàng)新大會(huì)

你一定有所意識(shí),人工智能的應(yīng)用已經(jīng)逐漸滲透到生活的方方面面,并開始影響、改變?nèi)藗兊母鞣N習(xí)慣。在人工智能覆蓋的眾多應(yīng)用里,語音識(shí)別無疑是最接地氣也是落地最快的,例如,語音助手已經(jīng)成為了智能手機(jī)的標(biāo)配。

不過,語音識(shí)別的下一個(gè)戰(zhàn)場并不是智能手機(jī)行業(yè),國內(nèi)外企業(yè)已經(jīng)紛紛把目光投向了市場空間更大的物聯(lián)網(wǎng)領(lǐng)域,這是語音識(shí)別乃至人工智能領(lǐng)域的一個(gè)最新的動(dòng)向。在昨天的第二屆萬物互聯(lián)創(chuàng)新大會(huì)上,思必馳副總裁雷雄國分享了語音識(shí)別公司的下一個(gè)突破口以及面臨的挑戰(zhàn)。

語音識(shí)別將成為萬億級的物聯(lián)網(wǎng)設(shè)備的標(biāo)配

其實(shí)上午有聊到很多的例子,訊飛聽見的語音識(shí)別其實(shí)已經(jīng)達(dá)到一個(gè)很高的水平。怎么樣才能讓未來機(jī)器為人服務(wù),能夠幫人完成任務(wù)這件事情,事實(shí)上還有很長的路要走。我們回頭來看互聯(lián)網(wǎng)以及交互方式的發(fā)展,能夠看到一個(gè)比較清晰的脈絡(luò)。

我們已經(jīng)完成了從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)的跨越,下一個(gè)階段將是物聯(lián)網(wǎng)(IoT),而在這個(gè)發(fā)展過程中,用戶數(shù)基數(shù)是呈倍數(shù)增長的。雷雄國認(rèn)為,圍繞硬件形態(tài)以及聯(lián)網(wǎng)的形態(tài),在上述轉(zhuǎn)變過程中,交互模式也在不斷的發(fā)生變化。

傳統(tǒng)的PC端,無外乎網(wǎng)頁的搜索,文字形的。再到手機(jī)端是通過觸屏的方式,甚至有一些帶語音交互的APP,甚至包括手機(jī)自帶的一些語音服務(wù),都逐步從實(shí)驗(yàn)室走向大眾消費(fèi)者。

舉個(gè)例子,蘋果早在iPhone 4s上就加入了語音工具siri,在此之后,siri在每一代iPhone中都有質(zhì)的提升。

從最開始命令式的控制,到最后聊天式,再到現(xiàn)在蘋果未來大的方向,它真正能夠達(dá)到一個(gè)助理、個(gè)人秘書的產(chǎn)品發(fā)展方向。

不過,智能手機(jī)市場已經(jīng)遇到了天花板,語音識(shí)別公司也必須做出戰(zhàn)略上的改變。那么手機(jī)之后,還有什么設(shè)備會(huì)集成語音識(shí)別的功能呢?

雷雄國給出的答案是所有物聯(lián)網(wǎng)設(shè)備,小至智能音響,大到汽車、風(fēng)力發(fā)電機(jī),這些設(shè)備的交互方式都會(huì)因語音識(shí)別在未來得到改變。而這樣的改變也是必然趨勢,“因?yàn)樗赡軟]有屏幕,或者屏幕非常小,這個(gè)時(shí)候語音的交互顯得尤為重要?!?/p>

毫無疑問,如果每一臺(tái)物聯(lián)網(wǎng)設(shè)備都植入語音識(shí)別功能,那么以萬億級出貨量的物聯(lián)網(wǎng)市場來算,這將會(huì)是一個(gè)巨大的市場空間。

挑戰(zhàn):如何從聽見到聽懂?

這和語音交互密不可分,可以說語音交互第一個(gè)入口就是語音識(shí)別,語音交互能夠得到快速的發(fā)展得益于聲學(xué)模型、語言模型以及聲學(xué)處理這三個(gè)核心技術(shù)的逐步成熟,以及移動(dòng)互聯(lián)網(wǎng)時(shí)代收集的大量數(shù)據(jù)。

不過,雷雄國也坦言,雖然語音識(shí)別已經(jīng)達(dá)到非常高的可用化程度,但要從聽見到聽懂,還有很多挑戰(zhàn)要克服。

例如,對于人說話習(xí)慣的適應(yīng),以及在人使用這個(gè)設(shè)備時(shí)不同的場景,不同的噪音環(huán)境都會(huì)有比較大的條件。在這些深入垂直領(lǐng)域需要更多的技術(shù)人員,以及創(chuàng)業(yè)的團(tuán)隊(duì),甚至像BAT這些大公司投入比較大的力量,把這些核心技術(shù)攻關(guān)掉。

從學(xué)術(shù)角度講,有一種語義不確定性,即同一句話,它能夠代表的意思根據(jù)上下文,根據(jù)你所在的用戶使用場景,會(huì)是非常大的不一樣。

雷雄國表示,圍繞這個(gè)不確定性,在學(xué)術(shù)界語音識(shí)別公司要從語義,以及從多輪交互上,甚至在統(tǒng)計(jì)模型上做一些比較深入的解決方案出來,才能準(zhǔn)確的識(shí)別信息;另外,深度神經(jīng)網(wǎng)絡(luò)也將在語音識(shí)別問題上發(fā)揮重要作用。

除此之外,在機(jī)器人以及其它形態(tài)的智能硬件中,因?yàn)榻换ゾ嚯x會(huì)比手機(jī)更遠(yuǎn),所以還需要加入一些原廠降噪的核心技術(shù),同時(shí)在應(yīng)用場景上需要把一些回音對消做上去,這樣使得整個(gè)交互場景更加的人性化,體驗(yàn)會(huì)更好。

具體來講,從聽見到聽懂的過程就是人機(jī)對話。雷雄國表示,人機(jī)對話可以分成三類:第一類,閑聊式的,舉個(gè)例子,用戶說“我餓了”,siri會(huì)跟你說,你餓了就去吃飯唄,它的應(yīng)用場景非常有限;第二是問答式對話,例如,用戶問現(xiàn)在是幾點(diǎn)鐘了,語音助手就會(huì)給出確定的回答;第三類是最熱的任務(wù)式對話,它會(huì)結(jié)合你個(gè)人很多信息,然后綜合去判斷接下來怎么樣去做歸零,完成一個(gè)任務(wù)。

這是一個(gè)完全不同的場景,例如你還是說我餓了,任務(wù)式對話會(huì)問你要吃什么菜,什么口味,大概是什么價(jià)位,以及你能夠承受送貨的時(shí)間是多少,等等這一系列的對話,通過這種對話式交互之后,最后才幫你解決問題,這是對話式交互核心要素。

雷雄國介紹,在任務(wù)對話模式下,要完成“我餓了”到實(shí)現(xiàn)定餐的閉環(huán),有兩個(gè)核心點(diǎn):第一是語義,一定要理解“我餓了”,他并沒有說要買什么東西,一定要理解他在這個(gè)情景下需要定餐;第二,對于這個(gè)意圖的跟蹤,多輪次的交互要結(jié)合上下文,甚至在縱向緯度需要結(jié)合你的日常,例如,未來我們可能會(huì)和阿里后臺(tái)一些數(shù)據(jù)做一些對接,對于你餓了的習(xí)慣做一些多緯度的決策依據(jù),做更人性化的自然語言交互。

這和傳統(tǒng)一輪式的語音交互(語音輸入進(jìn)去,理解后給一個(gè)反饋)有很大的區(qū)別,我們需要有關(guān)于對話的管理,以及對于環(huán)境和當(dāng)前對話所在的知識(shí)理解更為系列的后臺(tái)知識(shí)庫,圍繞這些知識(shí)庫做不同的反饋。最終的效果就是,不同的人說相同的話,機(jī)器也能給出不同的反饋。

中國為何造不出Echo?

在眾多語音識(shí)別和智能硬件的結(jié)合案例里,亞馬遜的Echo無疑是最受追捧的一個(gè)產(chǎn)品。但遺憾的是,中國有大量的智能硬件公司,也有不少優(yōu)秀的語音識(shí)別企業(yè),卻并沒有一款像Echo這樣的產(chǎn)品。

雷雄國認(rèn)為這主要有兩個(gè)原因:

其中一個(gè)很重要的原因是交互并沒有做好,我們知道亞馬遜在做Echo這件事情上面投入非常大,第一是2C產(chǎn)品本身的事情上。萬眾創(chuàng)新,雙創(chuàng)的這兩年里死了非常多的創(chuàng)業(yè)企業(yè),這里說明一件事情,要把硬件2C產(chǎn)品做好是非常難的一件事。

第二,人工智能整個(gè)語音交互,以及它背后不僅僅是語音識(shí)別,包括語義,包括你們聽懂它之后,里面的內(nèi)容和服務(wù)都是非常大的挑戰(zhàn)。我們能夠欣喜的看到國內(nèi)有出類似的產(chǎn)品,但是并沒有把這個(gè)熱潮,把這個(gè)產(chǎn)品做成一個(gè)爆款。

綜合這兩個(gè)原因,我們可以理解為語音識(shí)別的落地需要以模式創(chuàng)新和技術(shù)創(chuàng)新為基礎(chǔ),盡管要做到這兩點(diǎn)道阻且長,但可以確定的是,未來語音識(shí)別將無處不在,也是最有效地交互方式之一。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

略懂技術(shù)的小編

關(guān)注一切有未來感的產(chǎn)品及技術(shù)!
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說