0
本文作者: 呂倩 | 2018-07-01 10:55 | 專(zhuān)題:2018 CCF-GAIR 全球人工智能與機(jī)器人峰會(huì) |
雷鋒網(wǎng)按:2018 全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)在深圳召開(kāi),峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))、香港中文大學(xué)(深圳)承辦,得到了深圳市政府的大力指導(dǎo),是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流盛會(huì),旨在打造國(guó)內(nèi)人工智能領(lǐng)域最具實(shí)力的跨界交流合作平臺(tái)。
6月29日,搜狗CEO 王小川 CCF-GAIR 2018發(fā)表題為《搜狗的AI之路與挑戰(zhàn)》主題演講,他對(duì)張鈸院士所發(fā)表的“人工智能到今天理論框架尚未形成”觀點(diǎn)表示“說(shuō)得很重”,他稱(chēng),目前人工智能仍處于原始階段,但目前包括谷歌、搜狗,國(guó)內(nèi)外大量公司都在持續(xù)大量投入。
搜狗本身是面向消費(fèi)者的公司,因此最大優(yōu)勢(shì)也是擁有海量用戶(hù),使得搜狗有場(chǎng)景去展示AI技術(shù)、收集大量的數(shù)據(jù)。用戶(hù)規(guī)模上,搜狗是第四大中國(guó)互聯(lián)網(wǎng)公司,第二大搜索引擎,第一大中文輸入法,海量的用戶(hù)基于搜狗構(gòu)造實(shí)現(xiàn)AI的良好環(huán)境。
王小川稱(chēng),搜狗構(gòu)造自己的AI 能力,就是以語(yǔ)言為核心,上層是感知系統(tǒng)——包括語(yǔ)音與圖像,下層包括對(duì)話、翻譯、問(wèn)答,這是搜狗整體理解AI的切入點(diǎn)。
2016年,搜狗首家發(fā)布同聲傳譯系統(tǒng),預(yù)計(jì)在2020年達(dá)到優(yōu)秀同聲傳譯效果。而基于翻譯的技術(shù),搜狗于2018年3月與5月推出旅行翻譯寶與錄音翻譯筆。翻譯方面,王小川稱(chēng),搜狗有清晰的場(chǎng)景、輸入法、搜索引擎,另有實(shí)景翻譯功能也在不斷改進(jìn)。
相對(duì)來(lái)講,問(wèn)答與對(duì)話會(huì)更為復(fù)雜——王小川稱(chēng),他判斷AI時(shí)代搜索的未來(lái)會(huì)走向問(wèn)答。未來(lái)用戶(hù)會(huì)更多地用自然語(yǔ)言表達(dá),并由機(jī)器給出答案。王小川用去年搜狗問(wèn)答機(jī)器人汪仔參加的電視節(jié)目《一站到底》舉例稱(chēng),在知識(shí)問(wèn)答體系內(nèi),機(jī)器人已經(jīng)在確定性答案里做得比人類(lèi)更好。
相對(duì)之前IBM的沃森而言,汪仔機(jī)器人進(jìn)步更大——一方面是因?yàn)橥糇腥炭赏ㄟ^(guò)語(yǔ)音溝通,沃森是用文字輸入,同時(shí),搜狗汪仔背后依靠的是基于人工智能技術(shù)的搜狗立知問(wèn)答系統(tǒng)。
據(jù)雷鋒網(wǎng)了解,立知是搜狗搜索研發(fā)的面向未來(lái)的搜索技術(shù),在理解用戶(hù)的問(wèn)題或信息需求后,利用海量網(wǎng)絡(luò)信息及大規(guī)模知識(shí)庫(kù),直接給出答案,方便快捷,適用于多種交互方式。
問(wèn)答之外,搜狗另一個(gè)重要工作就是對(duì)話。王小川稱(chēng),搜狗在對(duì)話方面分成幾個(gè)領(lǐng)域在做——
一是任務(wù)型對(duì)話,即類(lèi)似微軟小冰等智能音箱類(lèi)的;
其次是智能回復(fù),幫助人類(lèi)去跟機(jī)器對(duì)話;
第三是機(jī)器幫助人,讓人回答得更輕松。
王小川以搜狗上市為例稱(chēng),當(dāng)時(shí)很多朋友發(fā)來(lái)祝賀信息,對(duì)象不同、回復(fù)內(nèi)容不同,即需要一個(gè)足夠智能的機(jī)器幫人去判斷對(duì)方是誰(shuí)、回復(fù)什么內(nèi)容格式,因此語(yǔ)音輸入并不足夠,還需要將輸入從填空題變成選擇題。
王小川稱(chēng),目前搜狗已經(jīng)在多個(gè)垂直領(lǐng)域運(yùn)用到這些新技術(shù)——例如客服領(lǐng)域、銷(xiāo)售領(lǐng)域、醫(yī)療領(lǐng)域等。以前傳統(tǒng)對(duì)話系統(tǒng)是機(jī)器與人的互動(dòng),聊天機(jī)器人的需求價(jià)值不清晰,傳統(tǒng)數(shù)據(jù)難積累,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)與評(píng)測(cè)。如今搜狗在輔助對(duì)話里將人與機(jī)器結(jié)合起來(lái),進(jìn)行更科學(xué)的設(shè)計(jì)來(lái)提升效率。
據(jù)雷鋒網(wǎng)了解,這個(gè)項(xiàng)目搜狗從2014年開(kāi)始做,先是在短信里做自動(dòng)回復(fù),用3%搜狗輸入法用戶(hù)做測(cè)試,2016年做到日活800萬(wàn)、月活2000萬(wàn)規(guī)模。之后設(shè)計(jì)手機(jī)短信走向聊天軟件,在句子長(zhǎng)度、句式等方面難度都更大,因此團(tuán)隊(duì)建立更復(fù)雜的系統(tǒng)模型,將聊天做到展現(xiàn)率50%,點(diǎn)擊率10%的規(guī)模。
此外,搜狗更多想法是希望超越目前語(yǔ)料對(duì)話系統(tǒng),核心概念便是引入知識(shí)。例如“有什么好影片推薦”這個(gè)問(wèn)題,答復(fù)就是一個(gè)問(wèn)答系統(tǒng);“得了鼻炎怎么辦”的答復(fù),既可以將醫(yī)療知識(shí)引進(jìn)入,也可以帶來(lái)新的商業(yè)模式。
但是,王小川稱(chēng),目前對(duì)話領(lǐng)域仍有很多問(wèn)題、也很難。例如個(gè)性化風(fēng)格問(wèn)題,例如“不認(rèn)識(shí)、不認(rèn)得、認(rèn)不得、我不認(rèn)識(shí)”四種說(shuō)法,很難區(qū)分出來(lái)。因此搜狗之后會(huì)在系統(tǒng)內(nèi)引入個(gè)性化元素,讓機(jī)器更聰明。此外,本地計(jì)算、隱私問(wèn)題等都需要不斷深入改進(jìn)。
最后,王小川預(yù)告,搜狗將推出顛覆性智能硬件,AI技術(shù)也將推動(dòng)知識(shí)計(jì)算,最終在新硬件入口加上機(jī)器對(duì)于問(wèn)答的理解,合成新的虛擬個(gè)人助理。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章