丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給陳孝良
發(fā)送

0

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

本文作者: 陳孝良 2017-03-09 18:34
導語:語音交互涉及了非常復雜的技術(shù)鏈條,美國頂尖的科技公司,INTEL、ARM、谷歌、亞馬遜、Facebook等都紛紛牽頭成立了自己的產(chǎn)業(yè)聯(lián)盟。

雷鋒網(wǎng)按:本文作者常樂,來自微信公眾號“聲學在線”(ID:soundonline)。

美國調(diào)查公司VoiceLabs在本年初發(fā)布了《2017年語音報告》,報告中對目前美國智能語音市場進行了調(diào)查,特別是亞馬遜Alexa和谷歌Google Home的開發(fā)者和消費者。報告中預測2017年將有2450萬臺以語音為主要交互方式的智能硬件產(chǎn)品發(fā)貨,市場總量將達到3300萬臺,市場規(guī)模超過200億美元。

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

↑ 語音為主的智能硬件產(chǎn)品

隨著亞馬遜的智能音箱Echo銷量逼近千萬,蘋果的智能耳機AirPods登頂美國無線耳機市場榜首,亞馬遜Alexa在美國CES展上大放異彩,國內(nèi)各個科技公司也紛紛開始了進入語音交互領(lǐng)域。

無論是IT科技巨頭阿里、百度、騰訊、科大訊飛等,還是陸續(xù)出現(xiàn)的思必馳、聲智科技、云知聲、三角獸、驀然、Rokid等創(chuàng)業(yè)公司,智能語音產(chǎn)品和語音助手成為競相追隨的熱門話題,儼然形成了一股全行業(yè)研究亞馬遜Echo的熱潮。根據(jù)聲智科技提供的數(shù)據(jù),國內(nèi)已經(jīng)有超過200多家公司正在研發(fā)類似Echo的智能音箱。

然而,就在國內(nèi)科技公司還在模仿Echo之時,國外的科技巨頭已經(jīng)開始進一步搶奪全球語音交互市場的控制權(quán)。無論是行業(yè)標準的定制,還是戰(zhàn)略專利的布局,抑或是音頻數(shù)據(jù)集的開放,以及各種產(chǎn)業(yè)生態(tài)聯(lián)盟的搭建,一切都在悄然的進行中。

智能語音交互的行業(yè)標準之爭拉開帷幕

3月6日,微軟在其官網(wǎng)上發(fā)布了新版本的語音平臺測試標準,即2.1版本。微妙的是,就在微軟發(fā)布消息的同時,我們驚喜的發(fā)現(xiàn),亞馬遜的官方網(wǎng)站上也已經(jīng)推出了其語音測試的最新標準,智能語音交互的行業(yè)標準之爭已經(jīng)開始“漸入佳境”。

微軟指出,目前語音平臺支持Windows 10中的所有語音體驗,如Cortana和Dictation,而其最新的測試標準適用于所有使用微軟語音平臺的音頻輸入設(shè)備。其中,直接影響的設(shè)計參數(shù),包括語音識別精度和語音處理算法的性能。目前,微軟還沒有把該測試標準作為設(shè)備認證必不可少的環(huán)節(jié)。然而,隨著測試標準日益規(guī)范化,平臺用戶數(shù)增多,未來的結(jié)果一切都不言而喻。

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

↑ 測試環(huán)境搭建圖

區(qū)別于微軟,亞馬遜也為其所有采用Alexa開發(fā)的智能語音產(chǎn)品設(shè)立了相應測試標準,然而,此測試并未公開,還是采用黑盒測試的方式,用戶需提交產(chǎn)品給亞馬遜進行相應測試。其產(chǎn)品通過認證測試后,搭載Alexa的智能語音交互產(chǎn)品才可獲得Alexa認證,并在Alexa Smart Home商店出售。

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

↑ 目前通過測試獲得認證的企業(yè)

語音交互市場專利布局競爭更為激烈

一直以來,一旦掌握行業(yè)標準制定的主導權(quán)也就掌握了整個市場的控制權(quán)。與其有同樣魅力的便是專利。當今的激烈市場競爭中,專利早已經(jīng)成為市場競爭的一柄利劍。

從1月19日國家知識產(chǎn)權(quán)局公布的數(shù)據(jù)顯示:過去的2016年,我國國家知識產(chǎn)權(quán)局共受理發(fā)明專利申請133.9萬件,同比增長21.5%,這已經(jīng)是我國第6個年頭專利受理量居世界首位。同時,國外專利的申請情況也保持良好的增長勢頭,2016年通過《專利合作條約》(PCT)途徑提交的國際申請4.50萬件。然而,雖然專利整體保持良好的發(fā)展態(tài)勢,但是,在語音交互領(lǐng)域國內(nèi)的專利布局與國外尚存差距。

眾所周知,語音交互涉領(lǐng)域廣泛,是一門多項技術(shù)融合的交叉學科,涉及到信號處理、模式識別、概率論與信息論、發(fā)聲機理和聽覺機理、神經(jīng)網(wǎng)絡,語音識別,機器學習等。其中,語音以及音頻的編解碼(G10L),電數(shù)字數(shù)據(jù)處理(G06F),電話通信(H04M),這三個領(lǐng)域?qū)@鄯e數(shù)量最多,比例高達80%。

從德溫特世界專利索引數(shù)據(jù)庫平臺收錄的自1963年以來全世界40多個專利機構(gòu)的基本發(fā)明的數(shù)據(jù)來看,語音識別的相關(guān)專利約2萬件。

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

↑ 根據(jù)CNKI自1985年后收錄的中國專利的數(shù)據(jù)來檢索關(guān)鍵詞語音識別情況

其中,截止到2015年,僅“語音識別”累積專利申請量方面來看,前五位的為IBM,NEC,微軟,Nuance和東芝,分別為749件,508件,506件,415件,406件。而從2010年至2015年的語音識別專利的申請量來看,除了IBM被Google替代,降至第7名,其他幾位仍然保有專利數(shù)量的優(yōu)勢,排名順序是Nuance,谷歌,微軟,東芝,NEC,分別為206件,178件,141件,102件。

巨頭形成的專利防御攻勢仍然迅猛,而業(yè)界所關(guān)心的后起之秀也來勢洶洶,2010至2015年,僅“語音識別”方面,谷歌布局專利178件、蘋果布局專利25件、亞馬遜布局專利33件。

對于國外的科技公司來說專利之間的斗法更加劍拔弩張,專利壁壘正在逐漸形成。從《中國知識產(chǎn)權(quán)報》發(fā)布的數(shù)據(jù)來看,截止至2017年1月,蘋果公司在語音領(lǐng)域的專利申請量為695件,而谷歌公司為1261件。從語音領(lǐng)域?qū)@季址矫婵?,兩家公司在語音領(lǐng)域的技術(shù)除了自主研發(fā)外,還通過并購語音類相關(guān)企業(yè)或者收購語音技術(shù)相關(guān)專利來加強專利儲備。

2013年蘋果公司收購語音識別公司NovaurisTechnologies。經(jīng)過收購,蘋果公司獲取了該公司的4件語音專利。通過這4件專利,蘋果Siri由可通過簡單識別單個詞句來理解上下文,發(fā)展到通過識別超過2.45億個短語來輔助理解上下文的功能,從而大幅度提升語音系統(tǒng)的理解力。

為了應對蘋果公司帶來的激烈競爭,谷歌公司采用了專利“圍剿”戰(zhàn)術(shù)。2013年,谷歌公司收購了Wavii公司的一件專利,該專利技術(shù)使得谷歌公司的語音搜索識別正確率提高了25%。同年,又收購了SR Tech Group公司的兩件關(guān)于語音識別的專利,并購入雅虎公司的一件名為“背景會話上下文搜索技術(shù)”的專利,通過購買專利,谷歌公司擁有了完整的語音識別引擎。

目前,中國的語音識別企業(yè)專利布局還主要是在國內(nèi),國際領(lǐng)域的專利布局情況和國外企業(yè)對比,確實還存在巨大差距。不過,國內(nèi)企業(yè)的知識產(chǎn)權(quán)意識也越來越強烈,百度,科大訊飛,聲智科技等在近幾年的專利申請上也有不錯的作為。

對比于市場銷量帶來的直接經(jīng)濟效益,知識產(chǎn)權(quán)的價值還不能充分體現(xiàn)。然而,在提高公司效益,搶占市場,保持公司可持續(xù)發(fā)展時,知識產(chǎn)權(quán)的價值不可小覷,專利作為企業(yè)不得不向公眾透露以獲取獨占權(quán)的關(guān)鍵信息,對其進行詳細、周密、綜合的分析,可以從中獲得巨大的商業(yè)價值,特別是在國際市場競爭中。

谷歌開放音頻數(shù)據(jù)集,用意不言而喻

3月8日,谷歌開放了一個大規(guī)模的音頻數(shù)據(jù)集 AudioSet。該數(shù)據(jù)集包含了 632 類的音頻類別,收集了2084320 條人工標記的每段 10 秒的YouTube視頻中的聲音剪輯片段(包括 527 個標簽)。

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

這些特定音頻是使用基于元數(shù)據(jù),上下文(例如,鏈接)和內(nèi)容分析的搜索來標記的。聲音內(nèi)容十分廣泛,包括人類的聲音和動物的聲音,各種類別樂曲的聲音和每天日常環(huán)境中的各種聲音等。谷歌聲稱:此次開放這個數(shù)據(jù)庫的目的就是為了滿足學術(shù)研究的需求。

從此前ImageNet廣泛數(shù)據(jù)集的開放效果來看,大部分識別圖像中的目標研究已經(jīng)從中獲益。而此次,對于利用AudioSet公開數(shù)據(jù)集訓練機器學習模型的語音識別研究者或者技術(shù)公司來說,無疑是獲益匪淺。然而目前,國內(nèi)的科技巨頭還沒有開源音頻數(shù)據(jù)集的動作,哪家公司可以有魄力的貢獻資源,我們還要翹首以待?

組建產(chǎn)業(yè)聯(lián)盟,試圖瓜分市場蛋糕

毫無疑問,通過語言交流獲取知識是人類最有效的學習方式。從PC時代的鍵盤鼠標過渡到移動互聯(lián)網(wǎng)的觸屏操控,下一個AI時代,無疑將會是以語音、體感等多種感知融合的新的獲取方式,而語音交互作為天然的人機交互入口,勢必是對信息生態(tài)與未來生活的一種重構(gòu)。

誠然,語音交互涉及了非常復雜的技術(shù)鏈條,包括了聲學處理、語音識別、語義理解和語音合成等核心技術(shù)。需要產(chǎn)業(yè)鏈上下游相互合作,需要產(chǎn)業(yè)伙伴相互合作。目前,美國頂尖的科技公司,INTEL、ARM、谷歌、亞馬遜、Facebook等都紛紛牽頭成立了自己的產(chǎn)業(yè)聯(lián)盟。

隨著智能語音交互領(lǐng)域不斷發(fā)展,國際化的競爭也會日趨激烈。如何積極搶占全球智能語音交互的主導權(quán)?必然是組成產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟,把握國際標準的制定、積極做好專利戰(zhàn)略布局,才能緊抓國內(nèi)外同步創(chuàng)新的契機,不再重復PC和移動互聯(lián)網(wǎng)時代的遺憾。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

反思仿制Echo的熱潮:為什么國外巨頭要布局AI交互?

分享:
相關(guān)文章

專欄作者

聲智科技創(chuàng)始人兼CEO,中科院聲學所博士
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說