丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給李詩
發(fā)送

0

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

本文作者: 李詩 2018-09-03 15:09
導(dǎo)語:2018年,CV賽道趨于平靜,NLP卻格外熱鬧。

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

自然語言處理(Natural Language Processing,以下簡稱NLP)作為人工智能的核心技術(shù)之一,最早開始進(jìn)行商業(yè)落地。近兩年,計算機(jī)視覺、語音識別技術(shù)突飛猛進(jìn),僅憑單點技術(shù)就誕生出估值超過十億美元的四大AI獨角獸公司,廣泛應(yīng)用在安防、醫(yī)療、零售等領(lǐng)域,撬動起萬億市場。然而,NLP技術(shù)的發(fā)展和商業(yè)落地明顯更為緩慢,或許是一直沒有找到剛需場景的原因。

雷鋒網(wǎng)發(fā)現(xiàn),2018年,NLP技術(shù)在不少場景煥發(fā)新的活力,例如,智能語音交互與IOT平臺的結(jié)合、翻譯機(jī)、AI教育、AI創(chuàng)作等領(lǐng)域。

智能語音交互+IoT

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

2017年智能音箱掀起一陣熱潮,也帶動了更大范圍上智能語音交互與物聯(lián)網(wǎng)平臺的結(jié)合。

2018年,各大公司都在建立IoT平臺,例如:小米IoT開發(fā)者平臺、阿里云Link、百度“天工”、京東Alpha-IoT、QQ物聯(lián)平臺、微軟Azure IoT,這些公司也都有自己的智能語音助手。小米、阿里、百度、微軟等已經(jīng)明確將智能語音+IoT看作IoT平臺以及對話式人工智能發(fā)展的關(guān)鍵。

2018年以來,對話式人工智能、智能終端在微軟的戰(zhàn)略地位明顯攀升。5月21日,微軟在北京召開2018人工智能大會,微軟全球執(zhí)行副總裁、人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋強(qiáng)調(diào)了微軟新的世界觀:智能云和智能邊緣。

微軟Azure是微軟專為人工智能打造的云平臺,為了成為最佳的人工智能云平臺,還將與以下四個方向結(jié)合:認(rèn)知服務(wù)、對話式人工智能、開放平臺與工具、實時人工智能基礎(chǔ)設(shè)施。其中,運行于Azure的認(rèn)知服務(wù)包括了語音、視覺、語言、機(jī)器翻譯等24項人工智能技術(shù)能力,將以API的形式提供給開發(fā)者。而對話式人工智能則是微軟的語音、語言、搜索等多項能力的集大成者,能直接在各種終端落地。

微軟的對話式人工智能主要包括微軟小娜和微軟小冰。而微軟小冰近年來逐漸占上風(fēng),成為微軟對話式人工智能的代表。7月26日,微軟小冰正式升級到第六代,“全雙工語音交互感官”和“共感模型”大大提升其對話能力,還發(fā)展了寫詩、作詞作曲演唱、文字摘要、撰寫新聞等各項語言處理能力。微軟小冰可以說是微軟目前NLP和語音交互的集大成者,在技術(shù)上遠(yuǎn)遠(yuǎn)領(lǐng)先其他對手。目前微軟小冰已經(jīng)將自己的技術(shù)能力全面開放,尋求多方面商業(yè)合作,不容小覷。

與微軟相比,對話式人工智能在百度AI戰(zhàn)略中的地位還要更高。在百度大力發(fā)展AI以來,百度的人工智能戰(zhàn)略逐步清晰,主要聚焦在三個方面布局:信息流、對話式人工智能系統(tǒng)DuerOS、自動駕駛Apollo。

2017年,百度打造了對話式人工智能操作系統(tǒng)DuerOS,為合作伙伴提供核心技能和行業(yè)解決方案,可以接入機(jī)器人、手機(jī)、電視、音箱、汽車等多種硬件設(shè)備,同時激勵開發(fā)者在平臺上開發(fā)更多的技能。

據(jù)百度2018年第二季度財報顯示,6月份,DuerOS語音喚醒超過4億次。截至2018年7月底,搭載DuerOS的智能設(shè)備激活數(shù)量已突破1億臺。同時,DuerOS的合作伙伴數(shù)量已經(jīng)超過200家,搭載DuerOS落地的主控設(shè)備超過110多款。DuerOS幾乎全部覆蓋了電視、手機(jī)、音箱、兒童設(shè)備、汽車等各類場景,而且每個領(lǐng)域DuerOS都和國內(nèi)頭部廠商達(dá)成了合作,如華為P20、P20 Pro、vivo X21、NEX,OPPO FindX等。

再來看小米。小米集團(tuán)人工智能與云平臺副總裁崔寶秋曾表示:從 2016 年起,AI 是成為小米未來十年的核心戰(zhàn)略,在 AI 上投入再多都不為過。不過從實際層面上來說,小米 AI 目前兩大重點還是在旗下的智能手機(jī)和小愛同學(xué)上。

在崔寶秋看來,小愛同學(xué)就是AI與IoT結(jié)合的產(chǎn)品。在AI+IoT上,小愛同學(xué)已經(jīng)取得了一定的成績。8月15日,小米宣布截至7月底,小愛同學(xué)月活躍設(shè)備超過3000萬。今年7月小愛同學(xué)喚醒超過10億次,累計喚醒已超過50億次。

小愛同學(xué)目前已經(jīng)可以語音控制10大類、30多款,共計8500萬智能設(shè)備,使用最多的三個場景分別是:音樂、有聲讀物的點播;閑聊;智能設(shè)備控制(包括開關(guān)燈、電視機(jī)開關(guān)、插坐)。

幾乎沒有硬件基礎(chǔ)的阿里,在2018年初也宣布全面進(jìn)軍IoT,智能語音交互是其打造IoT的一大關(guān)鍵點。在阿里達(dá)摩院機(jī)器智能技術(shù)研究院語音交互智能實驗室首席科學(xué)家鄢志杰看來,語音是最自然的與 IoT 交互的方式,語音交互智能是 AI 與大眾最近的接觸,語音交互智能將成為 IoT 與互聯(lián)網(wǎng)內(nèi)容和服務(wù)的橋梁。

除了天貓精靈、榮威智聯(lián)網(wǎng)汽車、海爾人工智能電視等,鄢志杰還把智能語音帶到了公共空間。此前國內(nèi)的語音交互主要是近場交互,場景局限于安靜的室內(nèi)。鄢志杰團(tuán)隊通過對語音交互硬件的麥克風(fēng)陣列、還添加了攝像頭來識別說話人,解決室外語音對話問題。目前,已經(jīng)推出語音點餐機(jī)、上海語音地鐵售票機(jī)等。與其他公司不同,阿里做智能語音交互+IoT的特點在于其豐富的商業(yè)場景。

翻譯機(jī)

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

2018年NLP領(lǐng)域一個值得注意的趨勢是:多款翻譯機(jī)面市。此前,我們較為熟悉的是谷歌、百度、網(wǎng)易等在線翻譯,而今年我們看到了很多做硬件的翻譯機(jī)產(chǎn)品。翻譯機(jī)的火爆主要有幾點原因:首先,深度學(xué)習(xí)帶來翻譯水平的提升,能夠更好地解決對話中翻譯問題,而過去由于手機(jī)硬件限制,我們無法在移動設(shè)備上運行深度學(xué)習(xí)模型,翻譯機(jī)成為外出剛需。此外,實時的語音轉(zhuǎn)文字和文字轉(zhuǎn)語音功能的成熟,也起到促進(jìn)作用。

2017年3月,科大訊飛推出曉譯翻譯機(jī),無屏、支持中英互譯、離線互譯、支持Wifi和SIM卡連接,價格高達(dá)2799元,隨后2017年9月,科大訊飛推出“譯唄”,無屏、不支持離線翻譯,價格降低為1399元。2018年4月,科大訊飛推出曉譯翻譯機(jī)2.0,帶觸屏、攝像頭、支持20種語言在線互譯,中英離線翻譯,價格為2999元。

2017年9月,分音塔科技推出準(zhǔn)兒翻譯機(jī),支持31種語言互譯,不支持離線翻譯,售價1288元;2017年10月,網(wǎng)易提出有道翻譯蛋,帶觸屏、支持27種語言在線翻譯,不支持離線翻譯,價格638元;2017年12月,百度發(fā)布途鴿翻譯機(jī),無屏、支持4種語言互譯,定價2399元;2018年3月,搜狗推出旅行翻譯寶,帶觸屏、攝像頭;支持24種語言在線翻譯,中英離線互譯,售價1498元;2018年5月,小米生態(tài)鏈企業(yè)香蕉出行提出魔芋AI翻譯機(jī),無屏、支持14種語言、不支持離線翻譯,售價249元。

可見,翻譯機(jī)的功能和形態(tài)還處于探索階段,有無屏幕、帶不帶攝像頭、支持多少種語言、能否離線翻譯都能影響其價格。其中,離線翻譯對于硬件設(shè)備的要求很高,對成本的影響大。

我們知道,在線翻譯可以使用云端機(jī)器翻譯,而離線翻譯能使用的機(jī)器學(xué)習(xí)就很有限,此前,在線翻譯的效果遠(yuǎn)遠(yuǎn)優(yōu)于離線翻譯。想要獲得好的離線翻譯,自然需要在硬件和軟件上下更大的功夫。

雷鋒網(wǎng)了解到,2018年6月13日,谷歌發(fā)布離線神經(jīng)機(jī)器翻譯技術(shù)( Neural Machine Translation),使得離線狀態(tài)下 ,也能用AI翻譯,且支持59種語言。據(jù)了解,神經(jīng)機(jī)器翻譯(NMT)是機(jī)器翻譯的一種方法,它使用大型人工神經(jīng)網(wǎng)絡(luò)來預(yù)測單詞序列的可能性,通常在單個整合模型中對整個句子進(jìn)行建模。這一技術(shù),或許將會對翻譯機(jī)造成一定的影響。

AI+教育

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

2017到2018年,AI+教育成為人工智能集體攻堅的傳統(tǒng)領(lǐng)域。AI+教育不少的場景和產(chǎn)品都運用了NLP的技術(shù),例如:中文分詞、智能閱卷、知識圖譜等。

以語音+語義技術(shù)為核心,結(jié)合云計算、大數(shù)據(jù),科大訊飛在AI+教育上取得了不少成果,教育也成為科大訊飛重要的營收來源之一。據(jù)科大訊飛2018年上半年財報顯示, 2018年上半年,教育板塊的營收6.58億元,同比增長16.35%。

科大訊飛在智慧教育領(lǐng)域,已經(jīng)打造了包含智慧考試、智慧校園、智慧課堂、智慧教學(xué)、智慧管理在內(nèi)的一體化智慧教育產(chǎn)品體系,在全國31個省、自治區(qū)、直轄市及新加坡等海外市場廣泛應(yīng)用,與13000余所學(xué)校建立合作,服務(wù)師生超過8000萬。

其主要的場景有校園管理:建設(shè)校本資源庫,構(gòu)建優(yōu)質(zhì)資源實時更新、共建共享的生態(tài)圈,實現(xiàn)學(xué)校優(yōu)質(zhì)、特色教學(xué)資源的積累和共享;AIUI語義:集成語音識別、語義理解相關(guān)能力,結(jié)合后端信源,直接通過語音調(diào)用相關(guān)內(nèi)容信息,達(dá)到天氣預(yù)報、風(fēng)險預(yù)警等信息及時播報;語義理解:通過語音處理,進(jìn)行語義理解,了解用戶意圖,并通過云端知識庫交互達(dá)到信息的及時傳達(dá);私有云更加定制化的信息確保答案更加精準(zhǔn)有效;漢語水平等級考試:系統(tǒng)基于國家普通話水平測試大綱,可準(zhǔn)確的對考生命題說話之外的所有測試題型進(jìn)行自動評測。

在智能閱卷方面,2017年11月20日,新東方與科大訊飛聯(lián)合成立的合資公司“東方訊飛”發(fā)布第一款基于AI的智能學(xué)習(xí)產(chǎn)品RealSkill,實現(xiàn)雅思、托??忌谡Z與寫作的智能評分與批改。

雷鋒網(wǎng)還注意到,除了英語之外,NLP技術(shù)在中文閱讀領(lǐng)域也已經(jīng)能商業(yè)化。2018年8月,中文少兒分級閱讀平臺“考拉閱讀”宣布完成2000萬美金B(yǎng)輪融資。此次融資將主要用于考拉閱讀原創(chuàng)“中文分級閱讀系統(tǒng)ER Framework”的優(yōu)化升級、優(yōu)質(zhì)閱讀內(nèi)容的生產(chǎn)聚合及市場規(guī)模的擴(kuò)大。

考拉閱讀的中文分級閱讀標(biāo)準(zhǔn)(ER Framework )借鑒了國外的“詞、句”的分析思想,基于ER Framework的分級閱讀標(biāo)準(zhǔn)在「詞」、「句」的基礎(chǔ)上再加入「字」、「段」、「篇」三個維度,即從「字詞句段篇」五大維度提取幾十個特征來表達(dá)中文的難度,并實現(xiàn)段落、主題等的分析。如在「字」其下還有常用性、構(gòu)形、組合性三個特征,「句」則有句法結(jié)構(gòu)、語義邏輯、修辭表達(dá)和嵌套深度四個特征等等。文分級閱讀系統(tǒng) ER Framework,將中文文本按照難度進(jìn)行量化分級,并匹配學(xué)生不同的閱讀能力,進(jìn)而提供個性化的閱讀內(nèi)容及語文學(xué)習(xí)解決方案。

AI創(chuàng)作

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

機(jī)器可以做很多理性的東西,那么它可以做一些創(chuàng)造性的東西嗎?雖然人類對創(chuàng)造性的要求很高,梵高的畫作、貝多芬的交響曲、李白杜甫的詩詞,這些在人類歷史長河中閃閃發(fā)光的文化遺產(chǎn)是人類創(chuàng)造性的體現(xiàn)。即使是對人工智能抱有長遠(yuǎn)期望的李開復(fù),也并不認(rèn)為AI能夠具備創(chuàng)造性。

但是,微軟卻一直在堅持AI創(chuàng)作的嘗試,在近兩年取得了不少成果。

微軟小冰除了對話能力外,還具備寫詩、寫歌詞、作曲、演唱等能力,這些都是NLP技術(shù)的延伸。雷鋒網(wǎng)曾報道,2018年5月,微軟小冰宣布“演唱深度學(xué)習(xí)模型完成第四次重大升級,演唱水平接近人類,且開始向作詞、作曲、演唱全面發(fā)展。其與知乎合作的新曲“我知我新”就是由小冰作詞加演唱。

據(jù)介紹,第四次迭代版本有三大更新:首先,加入換氣聲自動合成能力,歌聲與氣息融合,聽起來更自然更有感染力。其次,第四次迭代本在在深度學(xué)習(xí)建模中增加控制的方式,字與字、音符與音符之間的過渡更加連貫順暢。最后,通過進(jìn)一步優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以及大幅度補(bǔ)充的訓(xùn)練數(shù)據(jù),使小冰并行學(xué)習(xí)來自不同人類歌手的演唱風(fēng)格,進(jìn)一步脫離手工參數(shù)輸入,自行完成演繹。

小冰作詞與小冰創(chuàng)作詩歌相同的生成模型——基于LSTM的seq2seq模型,但是訓(xùn)練數(shù)據(jù)從詩歌換成了歌詞,小冰利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)超過1000萬行的歌詞語料,并在此基礎(chǔ)上訓(xùn)練,再通過多感官誘發(fā)創(chuàng)作靈感,生成歌詞。

AI創(chuàng)作需要更強(qiáng)的自然語言生成能力,目前大部分的對話式人工智能并不具備,很多回答的語句還是提前輸入的,或者是通過搜索提取的。微軟的自然語言生成能力也已經(jīng)融入到了對話式人工智能中,在發(fā)布”全雙工語音交互感官“技術(shù)時,微軟小冰就已經(jīng)具備”自然語言生成模型“,微軟小冰的所有回復(fù)都是自己生成的,有別于傳統(tǒng)的基于模塊、搜索來進(jìn)行回復(fù)。

微軟重視AI創(chuàng)作,是希望AI能與人聯(lián)合創(chuàng)造。AI進(jìn)入內(nèi)容生產(chǎn)領(lǐng)域,并不是要替代人類,而是成為人類的助手,不僅僅是在一般的領(lǐng)域,創(chuàng)作領(lǐng)域其實也是可以做到的。其實每個人都有創(chuàng)作的欲望,只不過有些人有藝術(shù)的天分,成為了畫家、音樂人、作家,而有些人沒有這樣的能力。AI就可以幫助每個普通人,讓他們都有創(chuàng)作一些個性化的內(nèi)容的能力。

雖然寫詩和唱歌還沒有明顯大規(guī)模商業(yè)化,但是另外小冰講故事和小冰的文字摘要能力卻已經(jīng)大規(guī)模落地。小冰的兒童有聲讀物自動生成技術(shù)成果,已獲得超過400萬小時的收聽量,小冰姐姐講故事有聲讀物已經(jīng)覆蓋國內(nèi)90%以上的兒童早教機(jī)器人和80%在線收聽平臺。

微軟小冰將機(jī)器人寫稿技術(shù)運用到金融領(lǐng)域,可以說是找到了一個更為剛需的場景。王永東介紹,在過去的248天里,小冰低調(diào)地采用化名與萬得資訊和華爾街見聞進(jìn)行了合作,對金融領(lǐng)域中全部26個類別的公告進(jìn)行攻堅和測試,通過金融文本生成摘要,向金融機(jī)構(gòu)、財經(jīng)APP和個人投資者提供摘要服務(wù)。目前,小冰的文本生成技術(shù)已經(jīng)覆蓋國內(nèi)約90%金融機(jī)構(gòu)、75%經(jīng)批準(zhǔn)的合格境外投資機(jī)構(gòu)和約40%的國內(nèi)個人投資者。

在金融信息服務(wù)領(lǐng)域,速度意味著金錢,與人類相比,人工智能在這一點上優(yōu)勢明顯。王永東介紹,微軟小冰可以在企業(yè)公告發(fā)布的同時,用20秒左右的時間生成高質(zhì)量的摘要。未來,小冰在金融領(lǐng)域會還會拓展產(chǎn)品線,提供更多的金融服務(wù)。

除了微軟小冰之外,雷鋒網(wǎng)還曾報道過IBM會辯論的機(jī)器人。2018年6月,IBM Research推出AI系統(tǒng)Project Debator,在舊金山IBM辦公室,人工智能在一場辯論賽中擊敗了人類頂尖辯手,它的對手是以色列國際辯論協(xié)會主席Dan Zafrir和2016年以色列國家辯論冠軍Noa Ovadia。據(jù)IBM官方介紹,Project Debater是第一個可以在復(fù)雜話題上與人類辯論的AI系統(tǒng)。Project Debater通過處理大量文本,就特定主題構(gòu)建出有良好結(jié)構(gòu)的演講,提供清晰明確的目的,并反駁其對手。最終,Project Debater將通過提供引人注目的,以證據(jù)為基礎(chǔ)的論點并限制情感、偏見或模棱兩可的影響來幫助人們推理。目前,Project Debater如何進(jìn)行商業(yè)落地,還不得而知。

AI語音芯片火熱

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

智能音箱、智能家居等硬件產(chǎn)品的火爆已經(jīng)驗證了智能語音交互與IoT結(jié)合的趨勢,這個新的趨勢也對芯片這樣的底層硬件提出了全新的要求。此前,智能音箱中的AI推理和運算都是在云端完成,反應(yīng)的速度較為緩慢,延遲明顯。

云知聲創(chuàng)始人/CEO 黃偉表示,“在 AIoT 市場加速爆發(fā)的今天,云端方案在網(wǎng)絡(luò)、帶寬、能耗、隱私以及邊緣計算等方面的限制,使得面向物聯(lián)網(wǎng)的 AI 芯片成為必然選擇?!?/p>

5月16日,云知聲在北京發(fā)布了首款面向物聯(lián)網(wǎng)領(lǐng)域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,出門問問在北京發(fā)布了旗下首款A(yù)I語音芯片模組問芯Mobvoi A1;6月26日,Rokid在杭州發(fā)布了旗下AI語音專用SoC芯片KAMINO18;同一時間,思必馳CEO高始興確認(rèn)公司正在打造AI語音芯片,預(yù)計今年下半年流片;7月4日,深圳微納感知計算技術(shù)有限公司(微納感知)聯(lián)合杭州中天微系統(tǒng)有限公司(中天微系統(tǒng))宣布即將在今年下半年發(fā)布智能語音芯片,杭州中天微系統(tǒng)不久前被阿里巴巴全資收購。

這些AI語音芯片都有相似的目的,例如:為語音交互硬件提供跨設(shè)備形態(tài)的 AI 感知能力和本地推理能力;深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),提升運算能力;降低數(shù)據(jù)帶寬要求等。

其實,AI語音芯片,NLP都是語音公司豎向發(fā)展的需求。近幾年,以科大訊飛、云知聲、思語音識別的公司發(fā)展很快,語音識別的發(fā)展也帶動了自然語言處理相關(guān)的發(fā)展。然而現(xiàn)階段,語音識別、語音合成、智能設(shè)備接入、智能設(shè)備喚醒等問題都已經(jīng)基本解決,再過兩三年或許就能徹底解決,“聽見”的問題解決后,下一步自然就是“聽懂”,在“聽懂”的方面,自然語言處理技術(shù)任重而道遠(yuǎn)。

思必馳CEO高始興曾告訴智東西,思必馳在創(chuàng)業(yè)之初,整個研究團(tuán)隊最早做的就是語音識別、人機(jī)對話,但2007年那個時間節(jié)點,移動互聯(lián)網(wǎng)浪潮還沒有興起,更不要說AI應(yīng)用了,沒有需求則“技術(shù)無用武之地”。但隨著物聯(lián)網(wǎng)階段到來,語音交互的需求開始爆發(fā)?!霸诩夹g(shù)創(chuàng)新上,思必馳核心會圍繞人機(jī)對話來展開”,高始興談到,盡管現(xiàn)在思必馳的語音技術(shù)已經(jīng)落地很多終端,效果也不錯,但是整個人機(jī)交互體驗還是不夠的,還要下功夫提升用戶體驗。

巨頭之下,創(chuàng)業(yè)機(jī)遇

2018 NLP領(lǐng)域持續(xù)火爆,廠商挖空心思尋找落地場景

NLP技術(shù)比CV技術(shù)更難,目前幾乎都是大公司才有精力做NLP技術(shù)的研發(fā),在算力、數(shù)據(jù)、人才上都是創(chuàng)業(yè)公司無法比擬的。但是,由于NLP包含眾多研究內(nèi)容:中文自動分詞、詞性標(biāo)注、句法分析、自然語言生成、文本分類、信息檢索、對話系統(tǒng)、文字校對、自動摘要等。這些技術(shù)都在逐步地商業(yè)化,但是因為各個領(lǐng)域所采用的數(shù)據(jù)、技術(shù)都有很大區(qū)別,并不會有一個統(tǒng)一的技術(shù)出現(xiàn),每個領(lǐng)域都還有創(chuàng)業(yè)公司生存的空間。

  • 手機(jī)智慧識屏

三角獸是一家典型的NLP創(chuàng)業(yè)公司,三角獸的三位創(chuàng)始人中,一位是度秘中控負(fù)責(zé)人王卓然,一位是微軟小冰創(chuàng)始人之一亓超。自2016年三角獸成立起,公司就致力于基于自然語言處理技術(shù),為各個領(lǐng)域打造人機(jī)交互解決方案。

三角獸目前已經(jīng)完成B輪1.1億人民幣融資,主要致力于四項技術(shù)能力:語義理解、開放域聊天、多輪對話、跨域中控,落地智能客服、智能手機(jī)方案和智能硬件三大方向。

智能手機(jī)方案是三角獸較為獨特的落地場景,據(jù)介紹,最新發(fā)布的OPPO R15和VIVO X21,以及今年一些品牌新機(jī)的“智慧識屏”功能,都由三角獸提供。該功能貫通系統(tǒng)層,覆蓋包括微信、微博、各種app和短信,對手機(jī)任何一段文字進(jìn)行語義解析,并推出數(shù)個卡片滿足用戶,一步到位解決用戶獲取信息和服務(wù)的需求。此前,三角獸還為羅永浩的錘子手機(jī)提供“Bigbang”功能,可以使大段文字——不管它們是以圖像還是文字的方式存在,不管它們是中文還是英文——都可以被切割成語義相關(guān)的詞或字,從而可以被更加方便地選擇和編輯。

  • 多模態(tài)情感識別

竹間智能成立于2016年,創(chuàng)始人簡仁賢曾是微軟亞洲工程院最高級別的負(fù)責(zé)人之一,其參與和向其匯報的項目包括了Bing亞洲地區(qū)的戰(zhàn)略與合作伙伴關(guān)系,微軟的虛擬助手小娜以及亞洲地區(qū)的商業(yè)變現(xiàn)業(yè)務(wù)。

竹間智能的核心業(yè)務(wù)是文本分析、自然語義理解、情感計算。竹間智能主要有兩條產(chǎn)品線,一條是類腦對話機(jī)器人,包含了客服機(jī)器人、導(dǎo)購機(jī)器人、金融機(jī)器人、營銷機(jī)器人、個人助理、品牌IP機(jī)器人等;一條是多模態(tài)情感識別系統(tǒng),包括情緒識別分析系統(tǒng)、人臉表情識別系統(tǒng)、印象分析系統(tǒng)、廣告效果分析系統(tǒng)、呼叫中心質(zhì)檢系統(tǒng)、課堂情緒分析系統(tǒng)等。

對話機(jī)器人的應(yīng)用場景可以區(qū)分為C端和B端,C端直接服務(wù)于客戶,對用戶體驗要求非常高,這個領(lǐng)域重要由巨頭占領(lǐng)。服務(wù)于B端需要做得更為垂直,最多的是做客服、導(dǎo)購機(jī)器人,需要為垂直領(lǐng)域提供不同的解決方案。在這個領(lǐng)域我們也看到很多創(chuàng)業(yè)公司,例如:小i機(jī)器人、云問機(jī)器人、智能一點、助理來也等。這個領(lǐng)域已經(jīng)不算是藍(lán)海,NLP公司需要尋求更多的差異化。

竹間智能的多模態(tài)情感識別系統(tǒng)做到了差異化的競爭,其不止可以識別文字情感、語音情感還添加了視覺情感,將三者融合起來做多模態(tài)的情感識別。在竹間智能CTO翁嘉頎看來,人機(jī)交互分為三個層次,最底層是自然語言處理,第二層是意圖理解,第三層是理解背后的涵義,目前業(yè)界還停留在前兩個階段,要做到第三個階段,情感計算不可避免。目前,竹間智能的多模態(tài)情感識別也已經(jīng)創(chuàng)新性地應(yīng)用在了新零售場景。

  • 企業(yè)知識傳播

思必馳是國內(nèi)領(lǐng)先的語音技術(shù)廠商,專注智能終端領(lǐng)域,為智能車載、智能家居、智能玩具/機(jī)器人、智能穿戴、智能手機(jī)等打造自然語言交互產(chǎn)品方案,目前已經(jīng)接入上億智能終端。今年7月思必弛宣布推出針對企業(yè)智能服務(wù)的定制平臺——會話精靈(talkinggenie, http://ba.dui.ai),定位為企業(yè)知識傳播,利用啟發(fā)式對話技術(shù)和復(fù)雜結(jié)構(gòu)知識管理技術(shù)為大眾企業(yè)提供更流暢的知識和信息的溝通方式。

初敏談到,思必馳現(xiàn)在的主戰(zhàn)場是智能設(shè)備、IoT,都是圍繞著人的生活中的各種娛樂、出行、會議,輔助人的日常生活。但是現(xiàn)階段,智能語音設(shè)備的底層問題,如接入、喚醒、對話,都已經(jīng)基本解決,未來兩三年可能會徹底解決,那么智能語音設(shè)備廠家之間的差距就變小了。思必馳現(xiàn)在換了一種思路來思考智能語音設(shè)備的發(fā)展,在她看來現(xiàn)在需要的是更多的企業(yè)將自己的服務(wù)交付給智能語音設(shè)備,以后可能不會只有一個通用型的音箱,會有很多專用場景,在不同的場景解決不同的問題。

在對話式人工智能以及NLP領(lǐng)域,巨頭擁有著多年的技術(shù)積累、平臺優(yōu)勢,微軟、百度都在開放對話式人工智能平臺和技能,在這種情況下,創(chuàng)業(yè)公司再去做平臺或者底層技術(shù)并不現(xiàn)實,需要結(jié)合多種NLP技術(shù),需要差異化的場景和更為垂直的領(lǐng)域。

小結(jié)

2018年,計算機(jī)視覺賽道已經(jīng)趨于平靜,NLP賽道卻十分熱鬧。NLP研究的內(nèi)容領(lǐng)域眾多,包括:中文自動分詞、詞性標(biāo)注、句法分析、自然語言生成、文本分類、信息檢索、信息抽取、文字校對、問答系統(tǒng)、機(jī)器翻譯、自動摘要、文字蘊涵等等,每一個領(lǐng)域都很艱深,沒有一個通用的技術(shù)能解決所有問題,其技術(shù)難度遠(yuǎn)大于計算機(jī)視覺。

暢想未來的NLP,我們會想到:能暢聊的對話機(jī)器人、精準(zhǔn)的實時翻譯、會閱讀寫作的AI。2018年,以上這些愿景都在一步步實現(xiàn)。雷鋒網(wǎng)觀察到,2018年,智能語音交互與IOT平臺的結(jié)合、翻譯機(jī)、AI教育、AI創(chuàng)作等領(lǐng)域是NLP技術(shù)的熱門應(yīng)用場景,巨頭和大公司都在扎堆布局。同時,為了更深入布局,不少巨頭和語音公司都開始做物聯(lián)網(wǎng)/語音芯片。除此之外,NLP創(chuàng)業(yè)公司也在積極探索適合自己的垂直領(lǐng)域,例如三角獸的智慧手機(jī)識屏方案、竹間智能的多模態(tài)情感識別、思必馳的企業(yè)智慧服務(wù)。當(dāng)然,這篇盤點文主要依靠雷鋒網(wǎng)編輯這一年來行業(yè)報道所見,如有不全或者遺漏之處,歡迎告知。

除了這些細(xì)分領(lǐng)域的新進(jìn)展之外,大公司的競爭格局也很有意思??梢钥吹?,雖然微軟、谷歌、百度等巨頭在NLP上積累難以超越,不少公司也有望憑借后發(fā)之力向巨頭發(fā)起挑戰(zhàn),比如憑借語音技術(shù)在教育、政務(wù)、醫(yī)療等各個領(lǐng)域遍地開花的科大訊飛;憑借搜索和輸入法為核心,打造自然交互與知識計算的搜狗;依靠信息流、智能推薦、NLP技術(shù)對百度窮追猛趕的今日頭條。在下一篇文章中,雷鋒網(wǎng)編輯將會詳細(xì)說說這些公司的在NLP領(lǐng)域的競合,歡迎聯(lián)系編輯提供觀點和意見。

相關(guān)文章:

專訪鄢志杰:阿里全面進(jìn)軍 IoT,語音交互能做什么、將做什么?

專訪小米崔寶秋:AI 是小米未來十年的核心戰(zhàn)略

小米人工智能與云平臺副總裁崔寶秋:智能手機(jī) + IoT 為 AI 打造無限生態(tài) | CCF-GAIR 2018

第六代微軟小冰少女初長成,撈金能力大提升

京東AI研究院何曉冬:如何讓AI通過NLP技術(shù)理解人類?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報道、行業(yè)交流請加微信“Hanass”
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說