0
本文作者: 張夢(mèng)華 | 2017-06-09 07:56 |
雷鋒網(wǎng)按:6 月 8 日下午, Rokid 創(chuàng)始人兼 CEO Misa 與媒體分享了其對(duì) AI 和智能音箱未來(lái)兩年發(fā)展趨勢(shì)的思考。以下是其演講和采訪實(shí)錄,雷鋒網(wǎng)做了不改變?cè)獾膭h減。
很多人問(wèn)我,這么多公司在做智能音箱,你是怎么想的?對(duì) Rokid 來(lái)說(shuō),我們做兩件事情,一個(gè)是 AI 大腦,一個(gè)是 AI 交互。
書(shū)和電影里,包括一些宣傳和半業(yè)內(nèi)人士,經(jīng)常跟大家講 AI,但其實(shí) AI 能做的事情沒(méi)那么多,它就是提升效率和體驗(yàn),偏工具化,跟你用算盤沒(méi)什么不同,只不過(guò)效率更高、更智能一些。今天主要是跟大家分享一些我現(xiàn)在的想法,我把它叫做 AI 的全面升級(jí)。
所謂 AI 的全面升級(jí),其中第一個(gè)趨勢(shì)就是 AI 開(kāi)始從感知到認(rèn)知。
認(rèn)知是什么概念呢?它主要分三個(gè)方面。
首先是個(gè)體認(rèn)知,比如剛才高鵬(Rokid 北京 A-lab 負(fù)責(zé)人)講到的聲紋識(shí)別,就是當(dāng)家里不同的人跟若琪(Rokid 發(fā)布的新款智能機(jī)器人)講話的時(shí)候,它能識(shí)別出是誰(shuí)。我相信語(yǔ)音技術(shù)中的個(gè)體認(rèn)知就像智能手機(jī)里的觸屏一樣,將會(huì)引發(fā)產(chǎn)業(yè)的大革命。
其次是環(huán)境的認(rèn)知,一個(gè) AI 產(chǎn)品可以對(duì)自己所處的環(huán)境作出認(rèn)知,比如判斷現(xiàn)在是在客廳、廚房、車上、餐廳或者什么地方。
然后是對(duì)事務(wù)的認(rèn)知,也有人把它叫意圖認(rèn)知,就是當(dāng)你跟它溝通時(shí)候,機(jī)器大概能知道你要干什么。你可以給它一個(gè)具體的任務(wù),比如“我要聽(tīng)歌”,可能有時(shí)候任務(wù)沒(méi)那么細(xì),像“我要從杭州去北京”,非常簡(jiǎn)單的一句話,但是涵蓋了很多東西:可能我需要買機(jī)票,訂酒店,叫車,預(yù)定餐廳,還有可能會(huì)見(jiàn)朋友,這個(gè)叫事務(wù)的認(rèn)知,不久的未來(lái)也會(huì)發(fā)生。
個(gè)體認(rèn)知對(duì)未來(lái)到底有什么影響?它可以把很多功能執(zhí)行變得更簡(jiǎn)單,使體驗(yàn)更流暢。比如用戶要給某人留言,原來(lái)的做法是:我是誰(shuí)誰(shuí),幫我留言給誰(shuí)誰(shuí)。未來(lái)這個(gè)就會(huì)非常簡(jiǎn)單,就像剛才視頻里一個(gè)媽媽問(wèn)機(jī)器幾點(diǎn),機(jī)器發(fā)現(xiàn)這個(gè)是媽媽的時(shí)候,會(huì)把爸爸給她的留言直接報(bào)出來(lái)。
第二個(gè)趨勢(shì)是未來(lái) AI 會(huì)全面云端化。
AI 的全面云端化包括幾個(gè)方面:第一,所有共享的知識(shí)都在云端,音樂(lè)內(nèi)容、百科內(nèi)容、用戶要問(wèn)的問(wèn)題等;第二,個(gè)性化的知識(shí)也會(huì)存儲(chǔ)在云端;第三,任務(wù)的狀態(tài)會(huì)云端化。什么叫任務(wù)的狀態(tài)?一件事,我讓機(jī)器做了一半,它會(huì)在云端記住我做到哪了,下次啟動(dòng)后要求它繼續(xù)做的時(shí)候,它可以繼續(xù)做。
第三個(gè)趨勢(shì)就是從單設(shè)備到多設(shè)備的互動(dòng)。
未來(lái)用戶家里面肯定不會(huì)只有一個(gè) AI 設(shè)備,因此就會(huì)面臨多機(jī)協(xié)作的問(wèn)題——幾個(gè)機(jī)器協(xié)商誰(shuí)最適合接這個(gè)任務(wù)。
還有一個(gè)趨勢(shì)是多維互動(dòng)?,F(xiàn)在我們用語(yǔ)音跟這個(gè)產(chǎn)品互動(dòng),而未來(lái),不僅僅是語(yǔ)音,攝像頭、手勢(shì)、甚至一些傳感器都可以進(jìn)行互動(dòng)。
原來(lái)大家都是使用 AI 產(chǎn)品的某一種特定功能,而接下來(lái)它會(huì)進(jìn)入一個(gè)全新的階段。個(gè)性的覺(jué)醒,多維的互動(dòng),狀態(tài)的遷移......這些到最后又將引發(fā)場(chǎng)景的遷移,并行成無(wú)處不在的個(gè)性 AI。
我們可以想象,一個(gè)無(wú)處不在的 AI 將會(huì)跨設(shè)備,跨地域,并且不再拘泥于某一個(gè)具體形象。它可以是手機(jī),可以是汽車,也可以是電視。這,才是未來(lái)。
記者:相比Google Home,Echo 和 Home Pod,Rokid 外星人的價(jià)格是他們的兩倍還多,考慮過(guò)市場(chǎng)的接受度嗎?
Misa:不能這樣比,應(yīng)該用月石跟他們比。這樣比就像用保時(shí)捷跟夏利比一樣,這是兩類完全不同的產(chǎn)品,外星人是帶完整顯示交互設(shè)計(jì)和燈光體驗(yàn)的產(chǎn)品,跟他們是兩個(gè)東西。
記者:第一款產(chǎn)品是有顯示屏的,現(xiàn)在去掉了顯示屏,怎么完成這種轉(zhuǎn)變的?
Misa:之前我們確實(shí)覺(jué)得需要有顯示屏。我們認(rèn)為語(yǔ)音只是交互方式的一種,要看到東西,呈現(xiàn)更多的信息,才更方便交互。不過(guò)后來(lái)我們發(fā)現(xiàn),用戶家里本來(lái)就已經(jīng)有多塊屏幕,不需要再多一塊屏。
記者:月石增加了聲紋識(shí)別的功能,這也是 Google Home 的一個(gè)亮點(diǎn),但它的體驗(yàn)并不是太好,錯(cuò)誤率很高,Rokid 在聲紋識(shí)別這方面能做到什么程度?
Misa:如果回顧歷史,可以看到,從來(lái)沒(méi)有一項(xiàng)技術(shù)是100%成功的,等到一個(gè)技術(shù)發(fā)展到100%的時(shí)候,早就被更廉價(jià)的80%的技術(shù)干掉了。很多產(chǎn)品都是邊發(fā)展邊改進(jìn)技術(shù)。聲紋技術(shù)也并沒(méi)有成熟到100%準(zhǔn)確,但是怎么樣用一個(gè)不是100%準(zhǔn)確的東西做出近乎100%準(zhǔn)確的體驗(yàn),這方面有很多保密的東西,不能講太多。
記者:怎么看待同類產(chǎn)品間的競(jìng)爭(zhēng)?
Misa:現(xiàn)在還集中在產(chǎn)品跟技術(shù)層面,未來(lái)會(huì)是多維度的。技術(shù)和用戶對(duì)產(chǎn)品的接觸達(dá)到一定程度,會(huì)有整個(gè)生態(tài)的多層面競(jìng)爭(zhēng),會(huì)比手機(jī)的競(jìng)爭(zhēng)更復(fù)雜。
記者:Rokid 未來(lái)的對(duì)手應(yīng)該都不是小公司,甚至包括用戶規(guī)模以億計(jì)的公司,在用戶基數(shù)和數(shù)據(jù)積累方面應(yīng)該比你們有很大優(yōu)勢(shì)?
Misa:數(shù)據(jù)規(guī)模上,也對(duì)也不對(duì)。建立語(yǔ)音技術(shù)上的數(shù)據(jù)規(guī)模,需要做不斷的積累,比如方言,就得慢慢積累。AI 對(duì)數(shù)據(jù)的需求,沒(méi)有大家想的那么巨大。比如聽(tīng)音樂(lè),有多少種說(shuō)法呢?我要聽(tīng)什么,給我放什么,來(lái)一首什么......兩只手?jǐn)?shù)得過(guò)來(lái)。如果一個(gè)場(chǎng)景是受限場(chǎng)景,或者相對(duì)的封閉場(chǎng)景,數(shù)據(jù)規(guī)模沒(méi)有那么大,到一定程度就差不多。接下來(lái)增加一倍、十倍的量,提升的也很有限。
記者:Rokid 想做智能家居的控制中心,但很多智能家居廠商更傾向于建立自己的生態(tài),不愿意對(duì)外開(kāi)放,這個(gè)問(wèn)題 Rokid 怎么解決?
Misa:我們相信兩個(gè)力量。第一相信市場(chǎng)的力量,只要最后的玩家不是一家,一定會(huì)趨向于協(xié)作。只有一種場(chǎng)景下是趨向于封閉的,就是一家獨(dú)大,沒(méi)有競(jìng)爭(zhēng)者,這一家來(lái)定所有規(guī)則,這里還不包括有潛在競(jìng)爭(zhēng)者。
比如我們跟米家在對(duì)接,對(duì)接得很好,即便我們知道小米會(huì)有類似的產(chǎn)品推出。你不開(kāi)放,別人開(kāi)放,你就有可能因此被打敗。成熟的市場(chǎng)總體來(lái)講都是開(kāi)放的,只是有些東西會(huì)保守,比如數(shù)據(jù)不會(huì)開(kāi)放。以美國(guó)為例,蘋(píng)果和谷歌有競(jìng)爭(zhēng),你有沒(méi)有發(fā)現(xiàn)互相封殺的情況?沒(méi)有,甚至Google Assistant 還有ios版本。最后大家協(xié)作是最好的方式。
記者:你覺(jué)得國(guó)內(nèi)智能音箱的爆發(fā)期大概將在什么時(shí)候出現(xiàn)?
Misa:兩年,兩年就可以爆發(fā)。2019年我相信會(huì)有質(zhì)的變化。AI 發(fā)展非??欤l(shuí)也不敢想象兩年后會(huì)是什么樣子。
記者:對(duì)于智能音箱品牌來(lái)說(shuō),達(dá)到多少銷量可以順利完成商品化?
Misa:5萬(wàn)臺(tái)是一個(gè)門檻。國(guó)內(nèi)的智能音箱市場(chǎng)也就幾百萬(wàn),5萬(wàn)臺(tái)就證明幾個(gè)產(chǎn)品里面有一臺(tái)是你的了。
來(lái)自雷鋒網(wǎng)報(bào)道。
智能音箱系列報(bào)道:
《亞馬遜的秘密部隊(duì)和差點(diǎn)成笑話的Amazon Echo》
《靈隆科技魏強(qiáng):“智能音箱”可能會(huì)消失》
《DuerOS+小魚(yú)在家,陸奇說(shuō)要做一件科技巨頭都沒(méi)干成的事》
《李志飛:想在中國(guó)復(fù)制 Echo 的成功,肯定都不靠譜》
《Echo發(fā)了快三年,為什么中國(guó)還是沒(méi)一款智能的音箱?》
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。