5
本文作者: 叨叨 | 2017-02-28 10:41 |
見慣了手機(jī)耳機(jī),說起一個(gè)能夠播放音樂,又能充當(dāng)虛擬助理“頭機(jī)”,估計(jì)大多數(shù)人是一“頭”霧水。雷鋒網(wǎng) 2月27日 消息,Vinci與其合作伙伴驀然認(rèn)知在京召開發(fā)布會,發(fā)布了1.5代lite版本和Pro版本的“智能頭機(jī)”,后者比前者多了主動降噪、環(huán)境音Mix等功能。而在此前幾天,Vinci宣布完成數(shù)千萬A輪融資,由天奇阿米巴創(chuàng)投領(lǐng)投。
智能頭機(jī)如何玩起?
所謂智能頭機(jī),本質(zhì)是一個(gè)不需要連接音樂播放硬件的耳機(jī),Vinci通過其合作伙伴驀然認(rèn)知的人工智能技術(shù),設(shè)置了虛擬個(gè)人助理小ME,極大提升了交互性,通過助理即可完成聽音樂、查詢天氣、訂餐、打車等功能。Vinci 創(chuàng)始人朱大衛(wèi)認(rèn)為,室外環(huán)境是一個(gè)“on the go”的場景,在該場景下,依靠“手和眼的交互”是非常復(fù)雜的,而Vinci智能頭機(jī)戴上就能播放音樂,摘下就能停止,你只需要用說話就能控制它。
Vinci智能頭機(jī)的實(shí)現(xiàn),離不開卓越的自然語言理解、知識圖譜、技術(shù),而為Vinci提供支持的,則是這家名為“驀然認(rèn)知”的AI初創(chuàng)企業(yè)。
驀然認(rèn)知是一家以認(rèn)知計(jì)算、自然語言理解技術(shù)為核心的人工智能公司。其創(chuàng)始人戴帥湘為前百度NLP主任架構(gòu)師,今年1月完成了1000萬美金A輪融資。
Vinci智能頭機(jī)的實(shí)現(xiàn),歸功于驀然認(rèn)知提供的“信號處理+語音+語義+云端服務(wù)自動對接”一站式智能交互解決方案,也歸功于其國內(nèi)領(lǐng)先的交互決策引擎Mor。
雷鋒網(wǎng)編輯注意到,發(fā)布會現(xiàn)場播放了人類與Mor多輪對話的視頻,從簡單的天氣查詢到較為復(fù)雜的訂餐出行,再到播放音樂、新聞搜索,小驀都能比較輕松的應(yīng)對。即便如此,驀然認(rèn)知聯(lián)合創(chuàng)始人claire卻對現(xiàn)狀并不滿足,經(jīng)過長時(shí)間觀察、思考后,她認(rèn)為,就目前人機(jī)交互現(xiàn)狀而言,存在三個(gè)由技術(shù)局限導(dǎo)致的問題,這些問題會影響從業(yè)者的認(rèn)知,必須解決這三個(gè)問題,才能夠得到一個(gè)真正的人工智能產(chǎn)品。同時(shí),這三個(gè)問題的明晰,也讓Mor有別于其他人工智能產(chǎn)品。
覆蓋的垂直類場景
覆蓋的場景相當(dāng)于我們在對每一個(gè)垂直場景做知識構(gòu)建。類比一下人,人在閱讀浩瀚的書籍之后能夠做到知識的融會貫通,作為人工智能來講,也應(yīng)該具備這樣的能力。而一個(gè)簡單的任務(wù),就會跨 很多垂直領(lǐng)域,更別說復(fù)雜任務(wù)。真正的人工智能并非簡單覆蓋垂直場景,而是去有效利用這些龐大的知識,構(gòu)建機(jī)器知識推理的能力,從而建立強(qiáng)大的知識圖譜,這就是驀然認(rèn)知最突出的核心競爭力。
對話的輪次
對話應(yīng)用的最終的衡量標(biāo)準(zhǔn)是是否高效的幫助人完成任務(wù),但由于每個(gè)人的交互對話習(xí)慣不一樣,有的人習(xí)慣于一句話表達(dá)完所有的信息,有的人喜歡分步式來完成任務(wù)的表達(dá),所以單考慮對話輪次的數(shù)目其實(shí)意義并不大,對話上下文的語義才至關(guān)重要。真正的人工智能在于既能夠給用戶靈活性的對話交互方式,同時(shí)也能精準(zhǔn)的理解用戶意圖,給出精準(zhǔn)的智能決策解決方案。
每個(gè)場景中的規(guī)則
人的思維有著極大的跳躍性和不確定性,通常會開啟一個(gè)話題,下一秒便可能跳轉(zhuǎn)到新的話題。每個(gè)人的對話路徑、思考路徑也是不一樣的。比如找餐館,有的人會率先考慮團(tuán)購信息,有的人想先選菜系。一個(gè)復(fù)雜任務(wù),可能包含著非常多路徑,如果給每一條路徑都設(shè)定一個(gè)規(guī)則,那這就不叫 人工智能了。所以,驀然認(rèn)知在做一個(gè)通用的模型,在關(guān)鍵點(diǎn)處寫下規(guī)則,不論用戶以何種方式進(jìn)行對話,都能夠精準(zhǔn)的理解其意圖。
基于對這三個(gè)問題的思考,智能交互決策M(jìn)or,應(yīng)用起來似乎更為流暢和成熟。
技術(shù)背后,其實(shí)深藏著一個(gè)理念。驀然認(rèn)知創(chuàng)始人戴帥湘將這個(gè)理念總結(jié)為“對話即應(yīng)用 ”,即DAAA (Dialogue as an Application)。要理解這句話,需要從應(yīng)用軟件發(fā)展的歷程來思考,軟件發(fā)展的本身是和其交互方式緊密相關(guān)的,每個(gè)階段的更迭都伴隨著交互介質(zhì)和方式的重要變化。
桌面時(shí)代
在互聯(lián)網(wǎng)普及前,桌面操作系統(tǒng)上需要安裝特定的桌面軟件才能提供各種應(yīng)用服務(wù),數(shù)據(jù)和程序都被打包在軟件的安裝包中,用戶通過鍵盤和鼠標(biāo)進(jìn)行軟件的操作。
瀏覽器時(shí)代
互聯(lián)網(wǎng)的普及,完全改變了上述局面,客戶端軟件逐步被通用的瀏覽器所代替,應(yīng)用通過網(wǎng)頁來分發(fā)和抵達(dá)用戶,用戶的交互主要基于網(wǎng)頁來完成。
移動時(shí)代
隨著移動時(shí)代的到來,智能手機(jī)迅速普及,交互方式從鼠標(biāo)鍵盤變成觸摸滑動,屏幕也突然變得很小,網(wǎng)頁呈現(xiàn)的交互方式突然不再能滿足手機(jī)上的使用,也因?yàn)檐浖_發(fā)商對于數(shù)據(jù)和知識產(chǎn)權(quán)保護(hù)的追求,在手機(jī)上通過APP方式呈現(xiàn)應(yīng)用的方式瞬間便流行起來。
loT時(shí)代
這個(gè)時(shí)代最大的變化是屏幕交互的方式不再是主流,屏幕進(jìn)一步變小,甚至消失,取而代之是更接近人與人之間的交互方式,語音,動作,以及各種傳感器的自動檢測,這其中對話交互將會是最自然,直接和主流的方式。
也因?yàn)槿绱耍诓煌瑘鼍跋虏煌闹悄茉O(shè)備得以出現(xiàn),其可以承載了一種或多種應(yīng)用能力,軟件之間的邊界消失了,所有服務(wù)將通過與用戶語音對話的方式來按需呈現(xiàn),“對話即應(yīng)用”,軟件的客戶端消失了。任何設(shè)備powered by Mor ,即可隨時(shí)隨地與你生活中的任何人、任何事緊密相連。
基于這種理念,戴帥湘的驀然認(rèn)知幫助Vinci實(shí)現(xiàn)了“智能頭機(jī)”的設(shè)想,也在幫助更多垂直領(lǐng)域的企業(yè),將人工智能逐步應(yīng)用化、商業(yè)化,觸及到更多普通用戶。雷鋒網(wǎng)相信,人工智能全面應(yīng)用,已經(jīng)不再是一種想象,而是一種現(xiàn)實(shí)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。