丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李詩(shī)
發(fā)送

0

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

本文作者: 李詩(shī) 2018-09-03 15:09
導(dǎo)語(yǔ):2018年,CV賽道趨于平靜,NLP卻格外熱鬧。

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

自然語(yǔ)言處理(Natural Language Processing,以下簡(jiǎn)稱NLP)作為人工智能的核心技術(shù)之一,最早開(kāi)始進(jìn)行商業(yè)落地。近兩年,計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別技術(shù)突飛猛進(jìn),僅憑單點(diǎn)技術(shù)就誕生出估值超過(guò)十億美元的四大AI獨(dú)角獸公司,廣泛應(yīng)用在安防、醫(yī)療、零售等領(lǐng)域,撬動(dòng)起萬(wàn)億市場(chǎng)。然而,NLP技術(shù)的發(fā)展和商業(yè)落地明顯更為緩慢,或許是一直沒(méi)有找到剛需場(chǎng)景的原因。

雷鋒網(wǎng)發(fā)現(xiàn),2018年,NLP技術(shù)在不少場(chǎng)景煥發(fā)新的活力,例如,智能語(yǔ)音交互與IOT平臺(tái)的結(jié)合、翻譯機(jī)、AI教育、AI創(chuàng)作等領(lǐng)域。

智能語(yǔ)音交互+IoT

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

2017年智能音箱掀起一陣熱潮,也帶動(dòng)了更大范圍上智能語(yǔ)音交互與物聯(lián)網(wǎng)平臺(tái)的結(jié)合。

2018年,各大公司都在建立IoT平臺(tái),例如:小米IoT開(kāi)發(fā)者平臺(tái)、阿里云Link、百度“天工”、京東Alpha-IoT、QQ物聯(lián)平臺(tái)、微軟Azure IoT,這些公司也都有自己的智能語(yǔ)音助手。小米、阿里、百度、微軟等已經(jīng)明確將智能語(yǔ)音+IoT看作IoT平臺(tái)以及對(duì)話式人工智能發(fā)展的關(guān)鍵。

2018年以來(lái),對(duì)話式人工智能、智能終端在微軟的戰(zhàn)略地位明顯攀升。5月21日,微軟在北京召開(kāi)2018人工智能大會(huì),微軟全球執(zhí)行副總裁、人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋強(qiáng)調(diào)了微軟新的世界觀:智能云和智能邊緣。

微軟Azure是微軟專為人工智能打造的云平臺(tái),為了成為最佳的人工智能云平臺(tái),還將與以下四個(gè)方向結(jié)合:認(rèn)知服務(wù)、對(duì)話式人工智能、開(kāi)放平臺(tái)與工具、實(shí)時(shí)人工智能基礎(chǔ)設(shè)施。其中,運(yùn)行于Azure的認(rèn)知服務(wù)包括了語(yǔ)音、視覺(jué)、語(yǔ)言、機(jī)器翻譯等24項(xiàng)人工智能技術(shù)能力,將以API的形式提供給開(kāi)發(fā)者。而對(duì)話式人工智能則是微軟的語(yǔ)音、語(yǔ)言、搜索等多項(xiàng)能力的集大成者,能直接在各種終端落地。

微軟的對(duì)話式人工智能主要包括微軟小娜和微軟小冰。而微軟小冰近年來(lái)逐漸占上風(fēng),成為微軟對(duì)話式人工智能的代表。7月26日,微軟小冰正式升級(jí)到第六代,“全雙工語(yǔ)音交互感官”和“共感模型”大大提升其對(duì)話能力,還發(fā)展了寫(xiě)詩(shī)、作詞作曲演唱、文字摘要、撰寫(xiě)新聞等各項(xiàng)語(yǔ)言處理能力。微軟小冰可以說(shuō)是微軟目前NLP和語(yǔ)音交互的集大成者,在技術(shù)上遠(yuǎn)遠(yuǎn)領(lǐng)先其他對(duì)手。目前微軟小冰已經(jīng)將自己的技術(shù)能力全面開(kāi)放,尋求多方面商業(yè)合作,不容小覷。

與微軟相比,對(duì)話式人工智能在百度AI戰(zhàn)略中的地位還要更高。在百度大力發(fā)展AI以來(lái),百度的人工智能戰(zhàn)略逐步清晰,主要聚焦在三個(gè)方面布局:信息流、對(duì)話式人工智能系統(tǒng)DuerOS、自動(dòng)駕駛Apollo。

2017年,百度打造了對(duì)話式人工智能操作系統(tǒng)DuerOS,為合作伙伴提供核心技能和行業(yè)解決方案,可以接入機(jī)器人、手機(jī)、電視、音箱、汽車等多種硬件設(shè)備,同時(shí)激勵(lì)開(kāi)發(fā)者在平臺(tái)上開(kāi)發(fā)更多的技能。

據(jù)百度2018年第二季度財(cái)報(bào)顯示,6月份,DuerOS語(yǔ)音喚醒超過(guò)4億次。截至2018年7月底,搭載DuerOS的智能設(shè)備激活數(shù)量已突破1億臺(tái)。同時(shí),DuerOS的合作伙伴數(shù)量已經(jīng)超過(guò)200家,搭載DuerOS落地的主控設(shè)備超過(guò)110多款。DuerOS幾乎全部覆蓋了電視、手機(jī)、音箱、兒童設(shè)備、汽車等各類場(chǎng)景,而且每個(gè)領(lǐng)域DuerOS都和國(guó)內(nèi)頭部廠商達(dá)成了合作,如華為P20、P20 Pro、vivo X21、NEX,OPPO FindX等。

再來(lái)看小米。小米集團(tuán)人工智能與云平臺(tái)副總裁崔寶秋曾表示:從 2016 年起,AI 是成為小米未來(lái)十年的核心戰(zhàn)略,在 AI 上投入再多都不為過(guò)。不過(guò)從實(shí)際層面上來(lái)說(shuō),小米 AI 目前兩大重點(diǎn)還是在旗下的智能手機(jī)和小愛(ài)同學(xué)上。

在崔寶秋看來(lái),小愛(ài)同學(xué)就是AI與IoT結(jié)合的產(chǎn)品。在AI+IoT上,小愛(ài)同學(xué)已經(jīng)取得了一定的成績(jī)。8月15日,小米宣布截至7月底,小愛(ài)同學(xué)月活躍設(shè)備超過(guò)3000萬(wàn)。今年7月小愛(ài)同學(xué)喚醒超過(guò)10億次,累計(jì)喚醒已超過(guò)50億次。

小愛(ài)同學(xué)目前已經(jīng)可以語(yǔ)音控制10大類、30多款,共計(jì)8500萬(wàn)智能設(shè)備,使用最多的三個(gè)場(chǎng)景分別是:音樂(lè)、有聲讀物的點(diǎn)播;閑聊;智能設(shè)備控制(包括開(kāi)關(guān)燈、電視機(jī)開(kāi)關(guān)、插坐)。

幾乎沒(méi)有硬件基礎(chǔ)的阿里,在2018年初也宣布全面進(jìn)軍IoT,智能語(yǔ)音交互是其打造IoT的一大關(guān)鍵點(diǎn)。在阿里達(dá)摩院機(jī)器智能技術(shù)研究院語(yǔ)音交互智能實(shí)驗(yàn)室首席科學(xué)家鄢志杰看來(lái),語(yǔ)音是最自然的與 IoT 交互的方式,語(yǔ)音交互智能是 AI 與大眾最近的接觸,語(yǔ)音交互智能將成為 IoT 與互聯(lián)網(wǎng)內(nèi)容和服務(wù)的橋梁。

除了天貓精靈、榮威智聯(lián)網(wǎng)汽車、海爾人工智能電視等,鄢志杰還把智能語(yǔ)音帶到了公共空間。此前國(guó)內(nèi)的語(yǔ)音交互主要是近場(chǎng)交互,場(chǎng)景局限于安靜的室內(nèi)。鄢志杰團(tuán)隊(duì)通過(guò)對(duì)語(yǔ)音交互硬件的麥克風(fēng)陣列、還添加了攝像頭來(lái)識(shí)別說(shuō)話人,解決室外語(yǔ)音對(duì)話問(wèn)題。目前,已經(jīng)推出語(yǔ)音點(diǎn)餐機(jī)、上海語(yǔ)音地鐵售票機(jī)等。與其他公司不同,阿里做智能語(yǔ)音交互+IoT的特點(diǎn)在于其豐富的商業(yè)場(chǎng)景。

翻譯機(jī)

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

2018年NLP領(lǐng)域一個(gè)值得注意的趨勢(shì)是:多款翻譯機(jī)面市。此前,我們較為熟悉的是谷歌、百度、網(wǎng)易等在線翻譯,而今年我們看到了很多做硬件的翻譯機(jī)產(chǎn)品。翻譯機(jī)的火爆主要有幾點(diǎn)原因:首先,深度學(xué)習(xí)帶來(lái)翻譯水平的提升,能夠更好地解決對(duì)話中翻譯問(wèn)題,而過(guò)去由于手機(jī)硬件限制,我們無(wú)法在移動(dòng)設(shè)備上運(yùn)行深度學(xué)習(xí)模型,翻譯機(jī)成為外出剛需。此外,實(shí)時(shí)的語(yǔ)音轉(zhuǎn)文字和文字轉(zhuǎn)語(yǔ)音功能的成熟,也起到促進(jìn)作用。

2017年3月,科大訊飛推出曉譯翻譯機(jī),無(wú)屏、支持中英互譯、離線互譯、支持Wifi和SIM卡連接,價(jià)格高達(dá)2799元,隨后2017年9月,科大訊飛推出“譯唄”,無(wú)屏、不支持離線翻譯,價(jià)格降低為1399元。2018年4月,科大訊飛推出曉譯翻譯機(jī)2.0,帶觸屏、攝像頭、支持20種語(yǔ)言在線互譯,中英離線翻譯,價(jià)格為2999元。

2017年9月,分音塔科技推出準(zhǔn)兒翻譯機(jī),支持31種語(yǔ)言互譯,不支持離線翻譯,售價(jià)1288元;2017年10月,網(wǎng)易提出有道翻譯蛋,帶觸屏、支持27種語(yǔ)言在線翻譯,不支持離線翻譯,價(jià)格638元;2017年12月,百度發(fā)布途鴿翻譯機(jī),無(wú)屏、支持4種語(yǔ)言互譯,定價(jià)2399元;2018年3月,搜狗推出旅行翻譯寶,帶觸屏、攝像頭;支持24種語(yǔ)言在線翻譯,中英離線互譯,售價(jià)1498元;2018年5月,小米生態(tài)鏈企業(yè)香蕉出行提出魔芋AI翻譯機(jī),無(wú)屏、支持14種語(yǔ)言、不支持離線翻譯,售價(jià)249元。

可見(jiàn),翻譯機(jī)的功能和形態(tài)還處于探索階段,有無(wú)屏幕、帶不帶攝像頭、支持多少種語(yǔ)言、能否離線翻譯都能影響其價(jià)格。其中,離線翻譯對(duì)于硬件設(shè)備的要求很高,對(duì)成本的影響大。

我們知道,在線翻譯可以使用云端機(jī)器翻譯,而離線翻譯能使用的機(jī)器學(xué)習(xí)就很有限,此前,在線翻譯的效果遠(yuǎn)遠(yuǎn)優(yōu)于離線翻譯。想要獲得好的離線翻譯,自然需要在硬件和軟件上下更大的功夫。

雷鋒網(wǎng)了解到,2018年6月13日,谷歌發(fā)布離線神經(jīng)機(jī)器翻譯技術(shù)( Neural Machine Translation),使得離線狀態(tài)下 ,也能用AI翻譯,且支持59種語(yǔ)言。據(jù)了解,神經(jīng)機(jī)器翻譯(NMT)是機(jī)器翻譯的一種方法,它使用大型人工神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)單詞序列的可能性,通常在單個(gè)整合模型中對(duì)整個(gè)句子進(jìn)行建模。這一技術(shù),或許將會(huì)對(duì)翻譯機(jī)造成一定的影響。

AI+教育

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

2017到2018年,AI+教育成為人工智能集體攻堅(jiān)的傳統(tǒng)領(lǐng)域。AI+教育不少的場(chǎng)景和產(chǎn)品都運(yùn)用了NLP的技術(shù),例如:中文分詞、智能閱卷、知識(shí)圖譜等。

以語(yǔ)音+語(yǔ)義技術(shù)為核心,結(jié)合云計(jì)算、大數(shù)據(jù),科大訊飛在AI+教育上取得了不少成果,教育也成為科大訊飛重要的營(yíng)收來(lái)源之一。據(jù)科大訊飛2018年上半年財(cái)報(bào)顯示, 2018年上半年,教育板塊的營(yíng)收6.58億元,同比增長(zhǎng)16.35%。

科大訊飛在智慧教育領(lǐng)域,已經(jīng)打造了包含智慧考試、智慧校園、智慧課堂、智慧教學(xué)、智慧管理在內(nèi)的一體化智慧教育產(chǎn)品體系,在全國(guó)31個(gè)省、自治區(qū)、直轄市及新加坡等海外市場(chǎng)廣泛應(yīng)用,與13000余所學(xué)校建立合作,服務(wù)師生超過(guò)8000萬(wàn)。

其主要的場(chǎng)景有校園管理:建設(shè)校本資源庫(kù),構(gòu)建優(yōu)質(zhì)資源實(shí)時(shí)更新、共建共享的生態(tài)圈,實(shí)現(xiàn)學(xué)校優(yōu)質(zhì)、特色教學(xué)資源的積累和共享;AIUI語(yǔ)義:集成語(yǔ)音識(shí)別、語(yǔ)義理解相關(guān)能力,結(jié)合后端信源,直接通過(guò)語(yǔ)音調(diào)用相關(guān)內(nèi)容信息,達(dá)到天氣預(yù)報(bào)、風(fēng)險(xiǎn)預(yù)警等信息及時(shí)播報(bào);語(yǔ)義理解:通過(guò)語(yǔ)音處理,進(jìn)行語(yǔ)義理解,了解用戶意圖,并通過(guò)云端知識(shí)庫(kù)交互達(dá)到信息的及時(shí)傳達(dá);私有云更加定制化的信息確保答案更加精準(zhǔn)有效;漢語(yǔ)水平等級(jí)考試:系統(tǒng)基于國(guó)家普通話水平測(cè)試大綱,可準(zhǔn)確的對(duì)考生命題說(shuō)話之外的所有測(cè)試題型進(jìn)行自動(dòng)評(píng)測(cè)。

在智能閱卷方面,2017年11月20日,新東方與科大訊飛聯(lián)合成立的合資公司“東方訊飛”發(fā)布第一款基于AI的智能學(xué)習(xí)產(chǎn)品RealSkill,實(shí)現(xiàn)雅思、托??忌谡Z(yǔ)與寫(xiě)作的智能評(píng)分與批改。

雷鋒網(wǎng)還注意到,除了英語(yǔ)之外,NLP技術(shù)在中文閱讀領(lǐng)域也已經(jīng)能商業(yè)化。2018年8月,中文少兒分級(jí)閱讀平臺(tái)“考拉閱讀”宣布完成2000萬(wàn)美金B(yǎng)輪融資。此次融資將主要用于考拉閱讀原創(chuàng)“中文分級(jí)閱讀系統(tǒng)ER Framework”的優(yōu)化升級(jí)、優(yōu)質(zhì)閱讀內(nèi)容的生產(chǎn)聚合及市場(chǎng)規(guī)模的擴(kuò)大。

考拉閱讀的中文分級(jí)閱讀標(biāo)準(zhǔn)(ER Framework )借鑒了國(guó)外的“詞、句”的分析思想,基于ER Framework的分級(jí)閱讀標(biāo)準(zhǔn)在「詞」、「句」的基礎(chǔ)上再加入「字」、「段」、「篇」三個(gè)維度,即從「字詞句段篇」五大維度提取幾十個(gè)特征來(lái)表達(dá)中文的難度,并實(shí)現(xiàn)段落、主題等的分析。如在「字」其下還有常用性、構(gòu)形、組合性三個(gè)特征,「句」則有句法結(jié)構(gòu)、語(yǔ)義邏輯、修辭表達(dá)和嵌套深度四個(gè)特征等等。文分級(jí)閱讀系統(tǒng) ER Framework,將中文文本按照難度進(jìn)行量化分級(jí),并匹配學(xué)生不同的閱讀能力,進(jìn)而提供個(gè)性化的閱讀內(nèi)容及語(yǔ)文學(xué)習(xí)解決方案。

AI創(chuàng)作

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

機(jī)器可以做很多理性的東西,那么它可以做一些創(chuàng)造性的東西嗎?雖然人類對(duì)創(chuàng)造性的要求很高,梵高的畫(huà)作、貝多芬的交響曲、李白杜甫的詩(shī)詞,這些在人類歷史長(zhǎng)河中閃閃發(fā)光的文化遺產(chǎn)是人類創(chuàng)造性的體現(xiàn)。即使是對(duì)人工智能抱有長(zhǎng)遠(yuǎn)期望的李開(kāi)復(fù),也并不認(rèn)為AI能夠具備創(chuàng)造性。

但是,微軟卻一直在堅(jiān)持AI創(chuàng)作的嘗試,在近兩年取得了不少成果。

微軟小冰除了對(duì)話能力外,還具備寫(xiě)詩(shī)、寫(xiě)歌詞、作曲、演唱等能力,這些都是NLP技術(shù)的延伸。雷鋒網(wǎng)曾報(bào)道,2018年5月,微軟小冰宣布“演唱深度學(xué)習(xí)模型完成第四次重大升級(jí),演唱水平接近人類,且開(kāi)始向作詞、作曲、演唱全面發(fā)展。其與知乎合作的新曲“我知我新”就是由小冰作詞加演唱。

據(jù)介紹,第四次迭代版本有三大更新:首先,加入換氣聲自動(dòng)合成能力,歌聲與氣息融合,聽(tīng)起來(lái)更自然更有感染力。其次,第四次迭代本在在深度學(xué)習(xí)建模中增加控制的方式,字與字、音符與音符之間的過(guò)渡更加連貫順暢。最后,通過(guò)進(jìn)一步優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以及大幅度補(bǔ)充的訓(xùn)練數(shù)據(jù),使小冰并行學(xué)習(xí)來(lái)自不同人類歌手的演唱風(fēng)格,進(jìn)一步脫離手工參數(shù)輸入,自行完成演繹。

小冰作詞與小冰創(chuàng)作詩(shī)歌相同的生成模型——基于LSTM的seq2seq模型,但是訓(xùn)練數(shù)據(jù)從詩(shī)歌換成了歌詞,小冰利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)超過(guò)1000萬(wàn)行的歌詞語(yǔ)料,并在此基礎(chǔ)上訓(xùn)練,再通過(guò)多感官誘發(fā)創(chuàng)作靈感,生成歌詞。

AI創(chuàng)作需要更強(qiáng)的自然語(yǔ)言生成能力,目前大部分的對(duì)話式人工智能并不具備,很多回答的語(yǔ)句還是提前輸入的,或者是通過(guò)搜索提取的。微軟的自然語(yǔ)言生成能力也已經(jīng)融入到了對(duì)話式人工智能中,在發(fā)布”全雙工語(yǔ)音交互感官“技術(shù)時(shí),微軟小冰就已經(jīng)具備”自然語(yǔ)言生成模型“,微軟小冰的所有回復(fù)都是自己生成的,有別于傳統(tǒng)的基于模塊、搜索來(lái)進(jìn)行回復(fù)。

微軟重視AI創(chuàng)作,是希望AI能與人聯(lián)合創(chuàng)造。AI進(jìn)入內(nèi)容生產(chǎn)領(lǐng)域,并不是要替代人類,而是成為人類的助手,不僅僅是在一般的領(lǐng)域,創(chuàng)作領(lǐng)域其實(shí)也是可以做到的。其實(shí)每個(gè)人都有創(chuàng)作的欲望,只不過(guò)有些人有藝術(shù)的天分,成為了畫(huà)家、音樂(lè)人、作家,而有些人沒(méi)有這樣的能力。AI就可以幫助每個(gè)普通人,讓他們都有創(chuàng)作一些個(gè)性化的內(nèi)容的能力。

雖然寫(xiě)詩(shī)和唱歌還沒(méi)有明顯大規(guī)模商業(yè)化,但是另外小冰講故事和小冰的文字摘要能力卻已經(jīng)大規(guī)模落地。小冰的兒童有聲讀物自動(dòng)生成技術(shù)成果,已獲得超過(guò)400萬(wàn)小時(shí)的收聽(tīng)量,小冰姐姐講故事有聲讀物已經(jīng)覆蓋國(guó)內(nèi)90%以上的兒童早教機(jī)器人和80%在線收聽(tīng)平臺(tái)。

微軟小冰將機(jī)器人寫(xiě)稿技術(shù)運(yùn)用到金融領(lǐng)域,可以說(shuō)是找到了一個(gè)更為剛需的場(chǎng)景。王永東介紹,在過(guò)去的248天里,小冰低調(diào)地采用化名與萬(wàn)得資訊和華爾街見(jiàn)聞進(jìn)行了合作,對(duì)金融領(lǐng)域中全部26個(gè)類別的公告進(jìn)行攻堅(jiān)和測(cè)試,通過(guò)金融文本生成摘要,向金融機(jī)構(gòu)、財(cái)經(jīng)APP和個(gè)人投資者提供摘要服務(wù)。目前,小冰的文本生成技術(shù)已經(jīng)覆蓋國(guó)內(nèi)約90%金融機(jī)構(gòu)、75%經(jīng)批準(zhǔn)的合格境外投資機(jī)構(gòu)和約40%的國(guó)內(nèi)個(gè)人投資者。

在金融信息服務(wù)領(lǐng)域,速度意味著金錢,與人類相比,人工智能在這一點(diǎn)上優(yōu)勢(shì)明顯。王永東介紹,微軟小冰可以在企業(yè)公告發(fā)布的同時(shí),用20秒左右的時(shí)間生成高質(zhì)量的摘要。未來(lái),小冰在金融領(lǐng)域會(huì)還會(huì)拓展產(chǎn)品線,提供更多的金融服務(wù)。

除了微軟小冰之外,雷鋒網(wǎng)還曾報(bào)道過(guò)IBM會(huì)辯論的機(jī)器人。2018年6月,IBM Research推出AI系統(tǒng)Project Debator,在舊金山IBM辦公室,人工智能在一場(chǎng)辯論賽中擊敗了人類頂尖辯手,它的對(duì)手是以色列國(guó)際辯論協(xié)會(huì)主席Dan Zafrir和2016年以色列國(guó)家辯論冠軍Noa Ovadia。據(jù)IBM官方介紹,Project Debater是第一個(gè)可以在復(fù)雜話題上與人類辯論的AI系統(tǒng)。Project Debater通過(guò)處理大量文本,就特定主題構(gòu)建出有良好結(jié)構(gòu)的演講,提供清晰明確的目的,并反駁其對(duì)手。最終,Project Debater將通過(guò)提供引人注目的,以證據(jù)為基礎(chǔ)的論點(diǎn)并限制情感、偏見(jiàn)或模棱兩可的影響來(lái)幫助人們推理。目前,Project Debater如何進(jìn)行商業(yè)落地,還不得而知。

AI語(yǔ)音芯片火熱

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

智能音箱、智能家居等硬件產(chǎn)品的火爆已經(jīng)驗(yàn)證了智能語(yǔ)音交互與IoT結(jié)合的趨勢(shì),這個(gè)新的趨勢(shì)也對(duì)芯片這樣的底層硬件提出了全新的要求。此前,智能音箱中的AI推理和運(yùn)算都是在云端完成,反應(yīng)的速度較為緩慢,延遲明顯。

云知聲創(chuàng)始人/CEO 黃偉表示,“在 AIoT 市場(chǎng)加速爆發(fā)的今天,云端方案在網(wǎng)絡(luò)、帶寬、能耗、隱私以及邊緣計(jì)算等方面的限制,使得面向物聯(lián)網(wǎng)的 AI 芯片成為必然選擇?!?/p>

5月16日,云知聲在北京發(fā)布了首款面向物聯(lián)網(wǎng)領(lǐng)域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,出門(mén)問(wèn)問(wèn)在北京發(fā)布了旗下首款A(yù)I語(yǔ)音芯片模組問(wèn)芯Mobvoi A1;6月26日,Rokid在杭州發(fā)布了旗下AI語(yǔ)音專用SoC芯片KAMINO18;同一時(shí)間,思必馳CEO高始興確認(rèn)公司正在打造AI語(yǔ)音芯片,預(yù)計(jì)今年下半年流片;7月4日,深圳微納感知計(jì)算技術(shù)有限公司(微納感知)聯(lián)合杭州中天微系統(tǒng)有限公司(中天微系統(tǒng))宣布即將在今年下半年發(fā)布智能語(yǔ)音芯片,杭州中天微系統(tǒng)不久前被阿里巴巴全資收購(gòu)。

這些AI語(yǔ)音芯片都有相似的目的,例如:為語(yǔ)音交互硬件提供跨設(shè)備形態(tài)的 AI 感知能力和本地推理能力;深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),提升運(yùn)算能力;降低數(shù)據(jù)帶寬要求等。

其實(shí),AI語(yǔ)音芯片,NLP都是語(yǔ)音公司豎向發(fā)展的需求。近幾年,以科大訊飛、云知聲、思語(yǔ)音識(shí)別的公司發(fā)展很快,語(yǔ)音識(shí)別的發(fā)展也帶動(dòng)了自然語(yǔ)言處理相關(guān)的發(fā)展。然而現(xiàn)階段,語(yǔ)音識(shí)別、語(yǔ)音合成、智能設(shè)備接入、智能設(shè)備喚醒等問(wèn)題都已經(jīng)基本解決,再過(guò)兩三年或許就能徹底解決,“聽(tīng)見(jiàn)”的問(wèn)題解決后,下一步自然就是“聽(tīng)懂”,在“聽(tīng)懂”的方面,自然語(yǔ)言處理技術(shù)任重而道遠(yuǎn)。

思必馳CEO高始興曾告訴智東西,思必馳在創(chuàng)業(yè)之初,整個(gè)研究團(tuán)隊(duì)最早做的就是語(yǔ)音識(shí)別、人機(jī)對(duì)話,但2007年那個(gè)時(shí)間節(jié)點(diǎn),移動(dòng)互聯(lián)網(wǎng)浪潮還沒(méi)有興起,更不要說(shuō)AI應(yīng)用了,沒(méi)有需求則“技術(shù)無(wú)用武之地”。但隨著物聯(lián)網(wǎng)階段到來(lái),語(yǔ)音交互的需求開(kāi)始爆發(fā)?!霸诩夹g(shù)創(chuàng)新上,思必馳核心會(huì)圍繞人機(jī)對(duì)話來(lái)展開(kāi)”,高始興談到,盡管現(xiàn)在思必馳的語(yǔ)音技術(shù)已經(jīng)落地很多終端,效果也不錯(cuò),但是整個(gè)人機(jī)交互體驗(yàn)還是不夠的,還要下功夫提升用戶體驗(yàn)。

巨頭之下,創(chuàng)業(yè)機(jī)遇

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場(chǎng)景

NLP技術(shù)比CV技術(shù)更難,目前幾乎都是大公司才有精力做NLP技術(shù)的研發(fā),在算力、數(shù)據(jù)、人才上都是創(chuàng)業(yè)公司無(wú)法比擬的。但是,由于NLP包含眾多研究?jī)?nèi)容:中文自動(dòng)分詞、詞性標(biāo)注、句法分析、自然語(yǔ)言生成、文本分類、信息檢索、對(duì)話系統(tǒng)、文字校對(duì)、自動(dòng)摘要等。這些技術(shù)都在逐步地商業(yè)化,但是因?yàn)楦鱾€(gè)領(lǐng)域所采用的數(shù)據(jù)、技術(shù)都有很大區(qū)別,并不會(huì)有一個(gè)統(tǒng)一的技術(shù)出現(xiàn),每個(gè)領(lǐng)域都還有創(chuàng)業(yè)公司生存的空間。

  • 手機(jī)智慧識(shí)屏

三角獸是一家典型的NLP創(chuàng)業(yè)公司,三角獸的三位創(chuàng)始人中,一位是度秘中控負(fù)責(zé)人王卓然,一位是微軟小冰創(chuàng)始人之一亓超。自2016年三角獸成立起,公司就致力于基于自然語(yǔ)言處理技術(shù),為各個(gè)領(lǐng)域打造人機(jī)交互解決方案。

三角獸目前已經(jīng)完成B輪1.1億人民幣融資,主要致力于四項(xiàng)技術(shù)能力:語(yǔ)義理解、開(kāi)放域聊天、多輪對(duì)話、跨域中控,落地智能客服、智能手機(jī)方案和智能硬件三大方向。

智能手機(jī)方案是三角獸較為獨(dú)特的落地場(chǎng)景,據(jù)介紹,最新發(fā)布的OPPO R15和VIVO X21,以及今年一些品牌新機(jī)的“智慧識(shí)屏”功能,都由三角獸提供。該功能貫通系統(tǒng)層,覆蓋包括微信、微博、各種app和短信,對(duì)手機(jī)任何一段文字進(jìn)行語(yǔ)義解析,并推出數(shù)個(gè)卡片滿足用戶,一步到位解決用戶獲取信息和服務(wù)的需求。此前,三角獸還為羅永浩的錘子手機(jī)提供“Bigbang”功能,可以使大段文字——不管它們是以圖像還是文字的方式存在,不管它們是中文還是英文——都可以被切割成語(yǔ)義相關(guān)的詞或字,從而可以被更加方便地選擇和編輯。

  • 多模態(tài)情感識(shí)別

竹間智能成立于2016年,創(chuàng)始人簡(jiǎn)仁賢曾是微軟亞洲工程院最高級(jí)別的負(fù)責(zé)人之一,其參與和向其匯報(bào)的項(xiàng)目包括了Bing亞洲地區(qū)的戰(zhàn)略與合作伙伴關(guān)系,微軟的虛擬助手小娜以及亞洲地區(qū)的商業(yè)變現(xiàn)業(yè)務(wù)。

竹間智能的核心業(yè)務(wù)是文本分析、自然語(yǔ)義理解、情感計(jì)算。竹間智能主要有兩條產(chǎn)品線,一條是類腦對(duì)話機(jī)器人,包含了客服機(jī)器人、導(dǎo)購(gòu)機(jī)器人、金融機(jī)器人、營(yíng)銷機(jī)器人、個(gè)人助理、品牌IP機(jī)器人等;一條是多模態(tài)情感識(shí)別系統(tǒng),包括情緒識(shí)別分析系統(tǒng)、人臉表情識(shí)別系統(tǒng)、印象分析系統(tǒng)、廣告效果分析系統(tǒng)、呼叫中心質(zhì)檢系統(tǒng)、課堂情緒分析系統(tǒng)等。

對(duì)話機(jī)器人的應(yīng)用場(chǎng)景可以區(qū)分為C端和B端,C端直接服務(wù)于客戶,對(duì)用戶體驗(yàn)要求非常高,這個(gè)領(lǐng)域重要由巨頭占領(lǐng)。服務(wù)于B端需要做得更為垂直,最多的是做客服、導(dǎo)購(gòu)機(jī)器人,需要為垂直領(lǐng)域提供不同的解決方案。在這個(gè)領(lǐng)域我們也看到很多創(chuàng)業(yè)公司,例如:小i機(jī)器人、云問(wèn)機(jī)器人、智能一點(diǎn)、助理來(lái)也等。這個(gè)領(lǐng)域已經(jīng)不算是藍(lán)海,NLP公司需要尋求更多的差異化。

竹間智能的多模態(tài)情感識(shí)別系統(tǒng)做到了差異化的競(jìng)爭(zhēng),其不止可以識(shí)別文字情感、語(yǔ)音情感還添加了視覺(jué)情感,將三者融合起來(lái)做多模態(tài)的情感識(shí)別。在竹間智能CTO翁嘉頎看來(lái),人機(jī)交互分為三個(gè)層次,最底層是自然語(yǔ)言處理,第二層是意圖理解,第三層是理解背后的涵義,目前業(yè)界還停留在前兩個(gè)階段,要做到第三個(gè)階段,情感計(jì)算不可避免。目前,竹間智能的多模態(tài)情感識(shí)別也已經(jīng)創(chuàng)新性地應(yīng)用在了新零售場(chǎng)景。

  • 企業(yè)知識(shí)傳播

思必馳是國(guó)內(nèi)領(lǐng)先的語(yǔ)音技術(shù)廠商,專注智能終端領(lǐng)域,為智能車載、智能家居、智能玩具/機(jī)器人、智能穿戴、智能手機(jī)等打造自然語(yǔ)言交互產(chǎn)品方案,目前已經(jīng)接入上億智能終端。今年7月思必弛宣布推出針對(duì)企業(yè)智能服務(wù)的定制平臺(tái)——會(huì)話精靈(talkinggenie, http://ba.dui.ai),定位為企業(yè)知識(shí)傳播,利用啟發(fā)式對(duì)話技術(shù)和復(fù)雜結(jié)構(gòu)知識(shí)管理技術(shù)為大眾企業(yè)提供更流暢的知識(shí)和信息的溝通方式。

初敏談到,思必馳現(xiàn)在的主戰(zhàn)場(chǎng)是智能設(shè)備、IoT,都是圍繞著人的生活中的各種娛樂(lè)、出行、會(huì)議,輔助人的日常生活。但是現(xiàn)階段,智能語(yǔ)音設(shè)備的底層問(wèn)題,如接入、喚醒、對(duì)話,都已經(jīng)基本解決,未來(lái)兩三年可能會(huì)徹底解決,那么智能語(yǔ)音設(shè)備廠家之間的差距就變小了。思必馳現(xiàn)在換了一種思路來(lái)思考智能語(yǔ)音設(shè)備的發(fā)展,在她看來(lái)現(xiàn)在需要的是更多的企業(yè)將自己的服務(wù)交付給智能語(yǔ)音設(shè)備,以后可能不會(huì)只有一個(gè)通用型的音箱,會(huì)有很多專用場(chǎng)景,在不同的場(chǎng)景解決不同的問(wèn)題。

在對(duì)話式人工智能以及NLP領(lǐng)域,巨頭擁有著多年的技術(shù)積累、平臺(tái)優(yōu)勢(shì),微軟、百度都在開(kāi)放對(duì)話式人工智能平臺(tái)和技能,在這種情況下,創(chuàng)業(yè)公司再去做平臺(tái)或者底層技術(shù)并不現(xiàn)實(shí),需要結(jié)合多種NLP技術(shù),需要差異化的場(chǎng)景和更為垂直的領(lǐng)域。

小結(jié)

2018年,計(jì)算機(jī)視覺(jué)賽道已經(jīng)趨于平靜,NLP賽道卻十分熱鬧。NLP研究的內(nèi)容領(lǐng)域眾多,包括:中文自動(dòng)分詞、詞性標(biāo)注、句法分析、自然語(yǔ)言生成、文本分類、信息檢索、信息抽取、文字校對(duì)、問(wèn)答系統(tǒng)、機(jī)器翻譯、自動(dòng)摘要、文字蘊(yùn)涵等等,每一個(gè)領(lǐng)域都很艱深,沒(méi)有一個(gè)通用的技術(shù)能解決所有問(wèn)題,其技術(shù)難度遠(yuǎn)大于計(jì)算機(jī)視覺(jué)。

暢想未來(lái)的NLP,我們會(huì)想到:能暢聊的對(duì)話機(jī)器人、精準(zhǔn)的實(shí)時(shí)翻譯、會(huì)閱讀寫(xiě)作的AI。2018年,以上這些愿景都在一步步實(shí)現(xiàn)。雷鋒網(wǎng)觀察到,2018年,智能語(yǔ)音交互與IOT平臺(tái)的結(jié)合、翻譯機(jī)、AI教育、AI創(chuàng)作等領(lǐng)域是NLP技術(shù)的熱門(mén)應(yīng)用場(chǎng)景,巨頭和大公司都在扎堆布局。同時(shí),為了更深入布局,不少巨頭和語(yǔ)音公司都開(kāi)始做物聯(lián)網(wǎng)/語(yǔ)音芯片。除此之外,NLP創(chuàng)業(yè)公司也在積極探索適合自己的垂直領(lǐng)域,例如三角獸的智慧手機(jī)識(shí)屏方案、竹間智能的多模態(tài)情感識(shí)別、思必馳的企業(yè)智慧服務(wù)。當(dāng)然,這篇盤(pán)點(diǎn)文主要依靠雷鋒網(wǎng)編輯這一年來(lái)行業(yè)報(bào)道所見(jiàn),如有不全或者遺漏之處,歡迎告知。

除了這些細(xì)分領(lǐng)域的新進(jìn)展之外,大公司的競(jìng)爭(zhēng)格局也很有意思??梢钥吹剑m然微軟、谷歌、百度等巨頭在NLP上積累難以超越,不少公司也有望憑借后發(fā)之力向巨頭發(fā)起挑戰(zhàn),比如憑借語(yǔ)音技術(shù)在教育、政務(wù)、醫(yī)療等各個(gè)領(lǐng)域遍地開(kāi)花的科大訊飛;憑借搜索和輸入法為核心,打造自然交互與知識(shí)計(jì)算的搜狗;依靠信息流、智能推薦、NLP技術(shù)對(duì)百度窮追猛趕的今日頭條。在下一篇文章中,雷鋒網(wǎng)編輯將會(huì)詳細(xì)說(shuō)說(shuō)這些公司的在NLP領(lǐng)域的競(jìng)合,歡迎聯(lián)系編輯提供觀點(diǎn)和意見(jiàn)。

相關(guān)文章:

專訪鄢志杰:阿里全面進(jìn)軍 IoT,語(yǔ)音交互能做什么、將做什么?

專訪小米崔寶秋:AI 是小米未來(lái)十年的核心戰(zhàn)略

小米人工智能與云平臺(tái)副總裁崔寶秋:智能手機(jī) + IoT 為 AI 打造無(wú)限生態(tài) | CCF-GAIR 2018

第六代微軟小冰少女初長(zhǎng)成,撈金能力大提升

京東AI研究院何曉冬:如何讓AI通過(guò)NLP技術(shù)理解人類?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報(bào)道、行業(yè)交流請(qǐng)加微信“Hanass”
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)