0
本文作者: 包永剛 | 2018-05-18 19:10 |
5月17日,科大訊飛在深圳舉辦了名為「AI·飛無界」的新品發(fā)布會。三年前,科大訊飛首次將AIUI推向市場,去年AIUI開放平臺的發(fā)布,那么今年的AIUI3.0將有哪些值得期待的革新?另外,發(fā)布會上還發(fā)布了魔飛2.0、AIoT、iFLY OS,其中的免費厚禮到底是什么?
科大訊飛消費者BG執(zhí)行總裁于繼棟
科大訊飛消費者BG執(zhí)行總裁于繼棟在發(fā)布會上首先回顧了訊飛開放平臺以及AIUI發(fā)展的歷程,他表示,從2011年訊飛開放平臺開放之后我們經(jīng)歷了很長的發(fā)展階段。從具體的數(shù)據(jù)看,2013年開放平臺開發(fā)者注冊數(shù)為3.9萬,2015年達(dá)到12.1萬,2017年有51.2萬,到了2018年5月16日,開發(fā)者注冊數(shù)量已經(jīng)達(dá)到了80萬人。當(dāng)然開放平臺以及AIUI平臺都是全領(lǐng)域覆蓋,涵蓋教育、通訊、機器人、購物等。于繼棟同時透露,科大訊飛AI的合作伙伴已經(jīng)超過5萬。
從開發(fā)者的陣營來看,移動端開發(fā)者的增長的數(shù)量占比最大,其中包括微信小程序以及其他外部API和Java小程序調(diào)用的快速增長。另外,Windows以及Linux陣營的開發(fā)者的快速增加分別代表著辦公場景和智能硬件領(lǐng)域AI正在逐漸落地。
于繼棟還分享了一組數(shù)據(jù),目前,每天在訊飛開放平臺上產(chǎn)生的語音交互次數(shù)超過45億次,交互次數(shù)比較多的前幾大應(yīng)用是,移動端超過40億次,音響超過4000萬次,電視超過2600萬次,車載超過2000萬次,商用機器人超過300萬次。
科大訊飛開放平臺的AI功能
AIUI 3.0 :三大革新
不過,即便AIUI已經(jīng)有大量的開發(fā)者和用戶,但于繼棟表示:“自2015年AIUI正式發(fā)布以來,我們看到無數(shù)開發(fā)者為追求真正優(yōu)秀的產(chǎn)品、最真實自然的人機交互、零失誤的語音識別而奮斗。為了更好地為開發(fā)者賦能,我們將這些追求納入心愿單,在AIUI3.0中帶來了三大革新?!?/p>
革新1:半監(jiān)督優(yōu)化
半監(jiān)督優(yōu)化能夠通過系統(tǒng)分析產(chǎn)品日志,了解各種熱門說法并推薦給開發(fā)者,并由分析產(chǎn)品日志和聚類算法推薦用戶想要的其它技能,幫助開發(fā)者不斷改進產(chǎn)品和提升效率。
同時,對于說法的回復(fù),允許開發(fā)者有多種處理方式,如使用系統(tǒng)推薦的技能,如閑聊技能進行回答,自己定義業(yè)務(wù)進行回答,或者接入廣告進行推薦。
AIUI3.0 開放式交互
革新2:開放式對話
在語音交互中,封閉式對話以機器為中心,易于控制,但是交互自然度低,開放式對話以人為中心,更接近自然的交流方式,同時語義消歧的難度也更大。
AIUI3.0能夠做到開放式交互,讓交互更貼近自然,并且不斷地演進和優(yōu)化效果,這也是AIUI3.0的一大優(yōu)勢。
革新3:全鏈路打通&動態(tài)詞匯
要聽懂用戶,語義理解能力和語音識別準(zhǔn)確度兩手都要硬。
AIUI打通了語音識別、語義理解以及語音合成全鏈路個性化網(wǎng)絡(luò),提高各類場景下的理解能力和識別率;同時擁有基于場景動態(tài)詞匯技術(shù),讓用戶說出所看到內(nèi)容都能被準(zhǔn)確識別,達(dá)到所見即所說。
當(dāng)然,AIUI3.0除了上述功能外,還有自定義問答、自定義技能、對話托管、云函數(shù)、可嵌入開發(fā)者WiFi soc的二麥在線交互模塊等特性。AIUI平臺的技能也已經(jīng)達(dá)到了120多個,內(nèi)容超過60種。
因此,基于AIUI 3.0 集成的語音喚醒、語音識別、語義理解、語音合成、IoT 等核心技術(shù),優(yōu)化的技能平臺,整合硬件、SDK、WebAPI、芯片、小程序等接入平臺,科大訊飛構(gòu)成了一張豐富的系統(tǒng)架構(gòu)全景圖。
魔飛(MORFEI ):增加2個新功能
魔飛是科大訊飛在2017年6月發(fā)布的一款麥克風(fēng)成品開發(fā)方案,魔飛1.0的雙環(huán)八麥購行解決了傳統(tǒng)拾音設(shè)備只能放在桌面上的問題,通過與AIUI配合,提供了快速開發(fā)的能力,科大訊飛也已經(jīng)通過魔飛1.0與許多開發(fā)者共同探索了很多家居的產(chǎn)品。
不過,魔飛的產(chǎn)品經(jīng)理涂康宏表示,魔飛1.0之后,我們發(fā)現(xiàn)有一些地方還有待提升,如回聲消除。今年上半年我們大幅優(yōu)化了回聲消除和藍(lán)牙回踩,使它的效果在原有的基礎(chǔ)上提升了100%,另外通過優(yōu)化整個系統(tǒng)架構(gòu),使系統(tǒng)變得更加穩(wěn)定,功耗也降低了50%。
魔飛2.0
當(dāng)然,除了已有功能的優(yōu)化,魔飛2.0還增加了分布式和能量跟隨兩個創(chuàng)新功能。
分布式能力:過去,用戶對多臺設(shè)備進行喚醒時,命令執(zhí)行會引發(fā)多臺設(shè)備同時被喚醒的尷尬局面?,F(xiàn)在,多臺設(shè)備在同一個局域網(wǎng)和賬戶號下,喊出「魔飛魔飛」喚醒詞時,所有在局域網(wǎng)內(nèi)的設(shè)備會進行喚醒分值計算,離用戶最近的那一臺設(shè)備優(yōu)先響應(yīng)用戶喚醒。
能量跟隨能力:過去,設(shè)備被喚醒之后麥克風(fēng)陣列會根據(jù)聲源的位置指定一個固定的波束方向,除非用戶再次喚醒設(shè)備,否則波束方向不會改變?,F(xiàn)在,波束可以根據(jù)用戶的位置和聲源地移動,動態(tài)的調(diào)整播出方向,給用戶帶來更自然的交互體驗。
涂康宏還表示,魔飛2.0超越了固定的硬件形態(tài)的局限,軟核化使其可以安裝在各類硬件設(shè)備中,能巧妙融入起居環(huán)境中。
所以魔飛2.0開放了全鏈路,開放音頻、文本、語義、合成四種接口。還有聲紋喚醒接口的開放,讓魔飛能在喚醒后瞬間知道用戶身份,使開發(fā)者可以快速調(diào)用聲紋信息,圍繞用戶搭建個性化場景推薦。
發(fā)布會的現(xiàn)場,科大訊飛還舉辦了一場語音技能開發(fā)的挑戰(zhàn),4 位開發(fā)者用了大概1小時的時間分別完成了程序員字典、我唱你猜、新電影推薦、會場抽獎的技能開發(fā),并通過現(xiàn)場配置好的魔飛麥克風(fēng),現(xiàn)場也成功演示和驗證。
AIoT:實現(xiàn)更多智能IoT設(shè)備的互聯(lián)互通
數(shù)據(jù)顯示,2014年到2018年終端設(shè)備的數(shù)量正急速增長,2018年硬件終端規(guī)模將達(dá)到19億,其中手機端占比約92%,8%預(yù)示著智能硬件時代的到來。但智能不僅是交互的升級,還是萬物相互連接產(chǎn)生的巨大能量。為了滿足開發(fā)者對智能設(shè)備間互通互聯(lián)的期待,訊飛智能物聯(lián)云AIoT也由此誕生。
訊飛智能物聯(lián)云AIoT
據(jù)雷鋒網(wǎng)了解,訊飛智能物聯(lián)云AIoT有云及霧兩大能力:
云能力提供開放、聚合、智能的云服務(wù)平臺。
霧能力是通過霧計算使整體系統(tǒng)不受網(wǎng)絡(luò)波動的影響,響應(yīng)時間快;這種分布式的能力能充分利用設(shè)備原有空閑的計算資源,降低系統(tǒng)成本。
這兩大能力被整合到 PaaS 級的開發(fā)平臺里,為開發(fā)者提供AI接口和開放設(shè)備連接,創(chuàng)建個性化智能場景。開發(fā)者既可以從第三方云端接入AIoT,也可以設(shè)備直連。
現(xiàn)場,訊飛的團隊也通過廚房的場景,為大家展示了基于訊飛智能物聯(lián)云AIoT的設(shè)備互聯(lián)互通和多模態(tài)人機交互的能力。
iFLY OS:一份免費的厚禮
新品發(fā)布的最后,于繼棟向大家展示了一份“厚禮”——系統(tǒng)級解決方案iFLYOS。iFLYOS 整合了訊飛語音喚醒、語音識別、語音合成、語義理解這四大基礎(chǔ)技術(shù)能力并免費開放給開發(fā)者,并且整合了 1300 萬首咪咕高清音樂、20 萬部海豚有聲內(nèi)容、以及 3 萬部院線大片。
系統(tǒng)級解決方案
另外,iFLYOS 還提供了 API 開放接口、開源了端代碼、兼容亞馬遜 AVS 可以讓亞馬遜設(shè)備快速接入訊飛方便開發(fā)者的開發(fā)。
不過,由于iFLYOS在發(fā)布會現(xiàn)場于繼棟才公布開啟內(nèi)測,所以這個系統(tǒng)級解決方案的更多細(xì)節(jié)還等待科大訊飛的逐步公開,雷鋒網(wǎng)也將為你持續(xù)關(guān)注。
新的100項AI能力正在開放
于繼棟發(fā)布完四款新品之后,在深圳28℃的夜晚,科大訊飛執(zhí)行總裁胡郁卻穿著西裝站上臺做了題為《賦能開發(fā)者 創(chuàng)造新時代》的分享。對此,他解釋道:“2010年我們訊飛開放平臺剛剛成立,在那年的發(fā)布會上我穿的就是這套西裝??赡芎芏嘈』锇橐舶l(fā)現(xiàn)了,這套西裝的扣子和袖口已經(jīng)磨損,但沒有關(guān)系,正是因為那些過往的歷史時刻,才成就了我們的今天?!?/p>
科大訊飛執(zhí)行總裁胡郁
對于為何看好語音技術(shù),胡郁表示,90% 信息輸出依靠語音,80% 信息輸入依靠視覺,人與機器之間的交互也通過人的語音語言和機器的顯示屏形成一個循環(huán)。因此他堅信基于視覺呈現(xiàn)的語音交互技術(shù)是未來的發(fā)展方向。他還舉了一些例子,如跑步等移動場景人們佩戴耳機的無視覺呈現(xiàn)的語音交互;車載環(huán)境對著后視鏡的弱視覺呈現(xiàn)的語音交互;還有家庭環(huán)境在電視、投影等屏幕前的強視覺呈現(xiàn)的語音交互等。
基于視覺呈現(xiàn)的語音交互技術(shù)是未來的發(fā)展方向
胡郁回顧了科大訊飛的發(fā)展歷程,也提到了突顯核心技術(shù)對于企業(yè)長久發(fā)展的重要性。說到這里,他表示,很長一段時間科大訊飛的盈利能力遭到外界的質(zhì)疑,其中很重要的一個原因就是科大訊飛每年在開發(fā)者平臺和核心技術(shù)上的投入是上億級的。他指出,2017 年科大訊飛的技術(shù)投入占總營收比重高達(dá) 61.61%,技術(shù)開發(fā)團隊的人數(shù)增長率則高達(dá) 56.04%,均大幅高于 2016 年。
胡郁在發(fā)布會上還表示科大訊飛開放平臺將在2018年度內(nèi)開放新的100項AI能力,打造AI全領(lǐng)域開放平臺。
科大訊飛AIUI智能硬件合作伙伴數(shù)量加速增長
小結(jié)
科大訊飛此次的「AI·飛無界」新品發(fā)布會帶來了四款新品,從軟件開發(fā)平臺AIUI3.0、硬件麥克風(fēng)成品開發(fā)方案魔飛2.0到訊飛智能物聯(lián)云AIoT再到系統(tǒng)級解決方案iFLY OS,從軟件到硬件,從單品到系統(tǒng),科大訊飛基于其核心技術(shù)為開發(fā)者準(zhǔn)備好了一整套的解決方案。
這對于開發(fā)者而言,門檻以及成本的降低無疑具有巨大的吸引力,特別是在有了iFLY OS之后,能讓更多的開發(fā)者讓創(chuàng)意變成產(chǎn)品。而AIoT能解決困擾物聯(lián)網(wǎng)發(fā)展的智能設(shè)備之間互聯(lián)互通難題,這無論是對AI落地還是IoT的發(fā)展而言都是積極的消息。科大訊飛也能與開發(fā)者共建一個更大的語音技術(shù)生態(tài)。
至于科大訊飛此次為何將AIUI的發(fā)布會選在深圳而不是北京,雷鋒網(wǎng)認(rèn)為其中的原因是深圳具有相對完備的硬件產(chǎn)業(yè)鏈,也有大量的智能硬件開發(fā)者,發(fā)布會展示區(qū)搭載科大訊飛語音技術(shù)的多個機器人展商就來自深圳,這意味著科大訊飛很看好語音技術(shù)在智能安防、智能家居、智能機器人、可穿戴等智能硬件中的普及,也希望通過與深圳的開發(fā)者共同推動AI的落地。
現(xiàn)在關(guān)注“雷鋒網(wǎng)”微信公眾號(leiphone-sz),回復(fù)關(guān)鍵詞【2018】,隨機抽送價值 3999 元的參會門票 3 張
相關(guān)文章:
科大訊飛年度發(fā)布會:重磅推出 10 款 AI+產(chǎn)品、AIUI 2.0,AI 賦能各行各業(yè)
科大訊飛胡郁:中國坐擁「登山型」和「沖浪型」企業(yè),將在中美人工智能角逐中勝出
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。