2
本文作者: haoxiaoru | 2014-10-28 17:30 |
10月27日,在主題為“機(jī)器人重塑未來生活”的百度 The BIG Talk 活動(dòng)上,百度技術(shù)副總裁王海峰博士發(fā)表演講,講述了讓機(jī)器人像人一樣思考需要的三種能力:1.對語言的理解;2.對知識(shí)的掌握;3.對人情感的揣摩。與此同時(shí),王海峰博士結(jié)合百度搜索的豐富案例,深入淺出地向在場觀眾介紹了,這些人工智能領(lǐng)域的基礎(chǔ)技術(shù),如何讓普通人的生活變得更好。
以下為經(jīng)過雷鋒網(wǎng)整理的王海峰演講全文:
王海峰:大家提機(jī)器人,每個(gè)人的腦子里會(huì)出現(xiàn)很多機(jī)器人形象,有的在生產(chǎn)線上做工,有的在家里幫助人們做家務(wù),甚至有的會(huì)在足球場、戰(zhàn)場上出現(xiàn)。應(yīng)該說機(jī)器人的這些機(jī)械技術(shù)和控制技術(shù),已經(jīng)取得了非常多的成果,如何能讓一個(gè)機(jī)器人更像人呢?我們需要讓它有像人一樣的智能,大家剛才看到的小度機(jī)器人,甚至可以答出很多我們很多人答不出來的問題,應(yīng)該說它已經(jīng)有了很高的智能。
機(jī)器人具備了什么樣的能力,就具備了人的能力呢?大家知道人的能力體現(xiàn)在很多方面,聽、說、看、行、學(xué)習(xí),還有很重要的一點(diǎn)就是思考。比如說一個(gè)動(dòng)物他也會(huì)有眼睛可以看,耳朵可以聽,也可以去行動(dòng),甚至它也可以訓(xùn)練出它一些能力,比如說看見一個(gè)什么場景會(huì)采取什么動(dòng)作,這些條件反射的能力。而人最重要的能力是思考,這是人特有的能力。人如何進(jìn)行思考,我們?nèi)绾巫寵C(jī)器人進(jìn)行思考呢?我認(rèn)為需要有三方面的能力,第一個(gè)是對語言的理解,大家知道語言是人特有的一種高級(jí)的智力活動(dòng),僅僅有語言,僅僅可以說話還不夠,我們還需要知道該說什么,這就是背后需要有知識(shí)的支撐,需要對知識(shí)的掌握,知識(shí)的運(yùn)用,以及知識(shí)的推理等等。另一方面,人生活在一個(gè)社會(huì)里,除了跟這些客觀知識(shí)打交道以外,還需要和人打交道。我們同一句話說給不同的人聽的時(shí)候,他的感受是不一樣的,反應(yīng)不一樣,這就需要機(jī)器人能夠?qū)Σ煌娜诉M(jìn)行建模。
我講一個(gè)故事給大家,大家知道間諜是一群很神秘?fù)碛泻軓?qiáng)的能力人,非常善于偽裝自己,打入敵人內(nèi)部讓敵人發(fā)現(xiàn)不了。曾經(jīng)有一個(gè)故事就是一個(gè)女特工,她能力非常強(qiáng),做得非常好,但是她最后暴露了身份,原因是什么?是她在分娩的時(shí)候,不由自主的喊出了母語,被人發(fā)現(xiàn)了。這個(gè)故事說明了什么呢?語言是人思維的一個(gè)基本載體,不同母語不同語言的人,語言的特點(diǎn)會(huì)影響她的思維活動(dòng)。我們學(xué)英語,如果你學(xué)到比較高的境界需要用英語思考,用英語思考相當(dāng)于你的思維模式發(fā)生變化。同樣一句話用中文說和英文說是不同的,例如屏幕上顯示的這些,用中文和英文語序、用詞、肯定和否定不一樣,這說明語言本身會(huì)影響人的思維。當(dāng)一個(gè)人需要和機(jī)器交流的時(shí)候,比如說問它一些問題,問它天氣怎么樣,或者說跟它聊天等等這些呢,其實(shí)都是用語言來進(jìn)行交互的。
我們?nèi)绾巫寵C(jī)器理解語言呢?大家知道語言是人類發(fā)展了很多年發(fā)展出來的,她充分的承載了人類知識(shí)、思維、情感方方面面的積累。語言本身是很復(fù)雜的,用我們都熟悉的中文舉例來說。大家知道中文詞與詞之間沒有空格的,所以說中文面臨第一個(gè)任務(wù)就是分詞。請看屏幕上,“劉清楚楚動(dòng)人”,大家看到這樣六個(gè)字可以很容易知道這個(gè)詞是什么,前面是一個(gè)人名劉清,后面是楚楚動(dòng)人。同樣類似的我們增加了一個(gè)字,“劉華清楚這件事”,這里便不是“劉清”了,而應(yīng)該是“劉華”。再改一點(diǎn),“劉華清楚地重游”,又是另一種分詞結(jié)果又加一個(gè)字,“劉華清楚地記得”,又變成了劉華。下面這個(gè)例子也很有意思的,“你老張著什么急啊”,是說“老張”別著急,。但再看下一句話,“你老張著什么嘴啊”,又不同了。上面的那些應(yīng)該說還是有一個(gè)基本的分法可以分出來的,但是這句話大家看,“乒乓球拍賣完了”,到底是“乒乓球拍”賣完了,還是“乒乓球”“拍賣”完了呢?這兩種說法都是對的,這就是語言的復(fù)雜性,也正是它的魅力所在,中文是一個(gè)非常有魅力的語言。下面看在百度的搜索里一個(gè)真實(shí)的例子,如果大家在百度搜索框里搜索這個(gè)是身高1.80以上的自由泳運(yùn)動(dòng)員,我們會(huì)直接給出這些答案,這么復(fù)雜的一個(gè)搜索,我們想把它理解好,可以找到相應(yīng)的答案。左邊這棵樹,就是我們自然語言處理技術(shù)的基礎(chǔ):語義語法分析,我們可以分析出來詞與詞之間的關(guān)系,從而知道更準(zhǔn)確的理解用戶到底找什么。配合后臺(tái)知識(shí)庫里面存大量的知識(shí)檢索出來,最后得到了這樣的一個(gè)答案。
大家看其實(shí)“謝霆鋒的兒子是誰”和“謝霆鋒是誰的兒子”,這兩句話的字是一樣,但是順序不一樣。如果說用傳統(tǒng)的搜索技術(shù),我們會(huì)對其分詞,算term重要性等等,由算出來的相關(guān)性找到的東西是一樣的。顯然這兩句話問題是不一樣的,我們怎么可以做到這一點(diǎn)呢?需要對語言有很深入的分析,對語義理解,從而知道他們要找的答案是不一樣。大家上百度就可以看到,“謝霆鋒的兒子是誰”,可以給“謝振軒”和“謝振南”,這是基于很深刻的語言的分析、理解技術(shù)。
再說一種就是和上下文相關(guān)的理解,比如說我們“問北京的今天天氣如何”,然后給一個(gè)答案。然后又問“上海呢?”這個(gè)時(shí)候問上海呢,就三個(gè)字,如果說僅看這一句話不知道問的是什么,但是上下文相關(guān)就會(huì)知道問的就是上海的天氣,而且是今天的天氣。
下面一個(gè)例子也是類似的,“我計(jì)劃周日北京飛杭州,幫我訂票”。這個(gè)時(shí)候用戶給了很多的信息,哪一天哪到哪,接下來說“請幫我預(yù)定酒店”,知道是到目的地酒店,哪一天的也知道,這是基于上下文的理解,才能做到這一點(diǎn)。
句和句之間的上下文不夠,還可以用篇章級(jí)的上下文。比如說我們問天空為什么是藍(lán)的,如果我們就是給出一個(gè)經(jīng)典搜索的結(jié)果,百度知道里找到一個(gè)結(jié)果,就像左邊的結(jié)果。但是大家看到直接拿出來的這一句話,不是真正解釋天空為什么是藍(lán)的,展開后才能看完整的解釋。在很長的一大段話里,我把真正最相關(guān)的答案這一部分找出來,摘要就會(huì)是一個(gè)更好的答案。如果我們做到更好,可以給出非常明確的解答。
篇章級(jí)分析應(yīng)該說比句子級(jí)更放大,對一個(gè)事件持續(xù)很長時(shí)間,幾個(gè)月,甚至是幾年的時(shí)間,其中有一些關(guān)鍵的時(shí)間點(diǎn)出現(xiàn)了一些里程碑的事件,我們也可以分析。在更長的時(shí)間段里,更多的數(shù)據(jù)里把這些關(guān)鍵的時(shí)間點(diǎn)發(fā)生的關(guān)鍵事件提取出來,這就是我們說的事件脈絡(luò)。我給這個(gè)例子也是在百度搜索可以看到的,比如說在百度搜索棱鏡門和斯諾登,右側(cè)會(huì)給過去一段時(shí)間跟棱鏡門相關(guān)的重要事件。
剛才我講的所有例子都是中文相關(guān)的。其實(shí)人類的語言,就像剛才我也講了間諜的故事,還會(huì)涉及到其它的語言,除了我們母語以外的其它語言。例如去國外旅游,到歐洲旅游但我不懂當(dāng)?shù)卣Z言,有一個(gè)翻譯器幫我點(diǎn)菜和當(dāng)?shù)厝私涣鳎@是對大家有幫助的。我們針對這種語言的理解,開發(fā)了多語言翻譯系統(tǒng),現(xiàn)在已經(jīng)覆蓋14個(gè)語種,36個(gè)翻譯方向。既可以在網(wǎng)頁和PC打一段文字給你翻譯,包括在手機(jī)可以拿著它直接和人對話,甚至你看到一個(gè)外文菜單不懂,拿著手機(jī)攝象頭一照,百度翻譯就會(huì)自動(dòng)為你把菜單翻譯成中文的,這相當(dāng)于你看到的就是一個(gè)中文菜單而不是用其它語言的菜單了。還有一個(gè)更高的境界,我們擁有語言能力,除了基本的交流和對話等等,我們發(fā)展出一些文學(xué)形式。比如說中國語言發(fā)展的非常好的詩歌,我們基于我們語言翻譯技術(shù),開發(fā)了這樣的一個(gè)寫詩的系統(tǒng)。我給系統(tǒng)輸進(jìn)去照片,自動(dòng)就會(huì)做出一首詩,這是完全自動(dòng)做出來的。比如說這首詩就是“日出日落一天天,人去人生幾十年,人水無聲情不斷,水天一色韻相連?!?/p>
我接下來講知識(shí)挖掘,對應(yīng)人對知識(shí)的學(xué)習(xí),可以從書本上學(xué),老師家長朋友等等很多不同渠道來學(xué)。學(xué)到這些知識(shí)以后,我們構(gòu)建了一個(gè)非常龐大的知識(shí)圖譜,這樣一個(gè)知識(shí)圖譜我們有上億級(jí)別的實(shí)體,比如說桌子一個(gè)實(shí)體,椅子是,攝像機(jī)都也是。每一個(gè)實(shí)體有很多的屬性。這個(gè)凳子是白色的,是什么材質(zhì)的,有很多的屬性,這些屬性已經(jīng)有上百億級(jí)別。而無論是實(shí)體還是屬性,其增長都是線性,更多的會(huì)是什么呢?實(shí)體之間的關(guān)系,實(shí)體之間組合起來,量就會(huì)急劇增加。一個(gè)實(shí)體可以跟很多實(shí)體有不同的關(guān)系,例如一個(gè)人可能跟很多不同的人有關(guān)系,同學(xué)關(guān)系、朋友關(guān)系等等。這時(shí)候會(huì)構(gòu)建更復(fù)雜的網(wǎng)絡(luò),這個(gè)知識(shí)圖譜描述能力更強(qiáng),現(xiàn)在我們已挖掘了千億級(jí)別的關(guān)系在我們的知識(shí)圖譜里。這些一方面從網(wǎng)頁里挖掘,網(wǎng)頁里有很多信息,除了本身文字信息,圖片信息,還有它的排版信息,它的字號(hào)信息,它的連接等等,構(gòu)成了網(wǎng)頁非常豐富的信息,可以挖掘很多基本的知識(shí)出來。
還有文字,又回到我最開始說的語言上來了,語言文字里面蘊(yùn)含很多信息。這樣一句話“奢侈品牌路易威登1854年成立法國巴黎”,我們分析清楚知道里面的語法和語義關(guān)系,我們可以提取很多有用的知識(shí)來。比如說路易威登成立的時(shí)間,成立在哪兒,這是一個(gè)奢侈品牌。包括巴黎是法國的,這些都可以從這樣簡單的一句話里抽取出來,所以說大家看到我們可以抽取到的知識(shí)其實(shí)是非常多。抽取這些知識(shí)以后就涉及到知識(shí)的存儲(chǔ)、檢索和管理,我們把這些知識(shí)大量存在知識(shí)圖譜里,要對知識(shí)相互之間的關(guān)系進(jìn)行計(jì)算?!爸x霆鋒的兒子是誰”,問題理解了是第一步,需要在龐大的庫里找到答案,這就是做相應(yīng)的檢索。這里包括了線下做很多的數(shù)據(jù)處理,以及線上實(shí)時(shí)地去響應(yīng)用戶需求。
知識(shí)推理。講到推理其實(shí)是很復(fù)雜的一件事,比如說破案的時(shí)候有非常復(fù)雜的推理,甚至還有一些直覺在推理里面。我講一個(gè)非常簡單的例子,我們知識(shí)庫里知道很多人的生日。我這里舉了兩個(gè)例子,一個(gè)是劉德華,一個(gè)是李彥宏先生。他們兩個(gè)人的生日我們都能知道,如果問年齡,大家知道年齡是一個(gè)動(dòng)態(tài)的,今年問和明年問,這個(gè)月問和下個(gè)月問,其實(shí)是不一樣的。這時(shí)候不能簡單說把一條某某人的年齡存在那兒,靜態(tài)的放在那兒。而隨著時(shí)間的遷移答案就不對,所以要計(jì)算。這種計(jì)算人看來并不復(fù)雜,但是要讓機(jī)器知道年齡這樣一件事應(yīng)該怎么算,這個(gè)技術(shù)本身讓機(jī)器如何知道,是一個(gè)我們需要做的技術(shù)。大家看到比如說劉德華是9月份生日,所以現(xiàn)在用今年2014年減去61年現(xiàn)在是53歲。李彥宏是11月份生的,現(xiàn)在沒有到過生日的時(shí)候,所以用今年2014減生日1968應(yīng)該是46,但是因?yàn)闆]有過生日就是45,這個(gè)是真正實(shí)時(shí)算出來的。
我們有了龐大的知識(shí)庫以后,我們希望通過擴(kuò)充聯(lián)想不斷豐富知識(shí)庫,讓它有越來越強(qiáng)大的能力。舉這樣一個(gè)例子,上面的這行字“謝霆鋒兒子的母親的前夫的父親”,這句話聽起來拗口,但是實(shí)際上我們把這一個(gè)一個(gè)的關(guān)系分析出來,之后得到這是謝賢,這就是聯(lián)想推理過程。
我們把一些實(shí)體放在庫里以后,怎么解答一些問題呢?比如說我們要找觀賞魚,我們可以先進(jìn)行細(xì)分類,因?yàn)橐粋€(gè)用戶來找觀賞魚的時(shí)候,可能是對觀賞魚的某個(gè)小類更感興趣。里面分很多小的不同的分類,我們?nèi)绻阉智宄?,可能對某一類更加有興趣,這時(shí)要在后臺(tái)要做知識(shí)分類的工作。包括右邊舉了狗品種的例子,美食和小說,這都是在百度真實(shí)實(shí)現(xiàn)的。
還有一類知識(shí),比如我們現(xiàn)在百度一個(gè)搜索結(jié)果,在左側(cè)有很多自然的結(jié)果出來,同時(shí)我們在右側(cè)會(huì)有一些相關(guān)的推薦。張飛右側(cè)會(huì)推跟他相關(guān)的一些趙云、關(guān)羽、諸葛亮等等。例如趙云,下面還有灰色的字,給的是推薦理由。推薦理由也是我們通過自動(dòng)的知識(shí)挖掘把它相關(guān)的,就是張飛和趙云是什么關(guān)系。我們這里給了,大家可以看到寫的是“同事”,這個(gè)同事不是我們?nèi)司幍?,真的是在網(wǎng)上大量的挖掘,挖掘出來最后發(fā)現(xiàn)他們是同事關(guān)系。按道理張飛和趙云在三國時(shí)代沒有同事概念,這就是互聯(lián)網(wǎng)的能力。網(wǎng)友把他來的關(guān)系寫成“同事”被我們挖掘出來了,關(guān)系比較貼切。點(diǎn)了關(guān)羽,進(jìn)了關(guān)羽的搜索頁,推薦了很多人出來,有一個(gè)是貂蟬,貂蟬下面給的理由就是同鄉(xiāng)。我看過三國,聽過三國的評書,看過電視劇,了解很多三國相關(guān)的知識(shí),但是之前真的不知道他們兩個(gè)是同鄉(xiāng)??吹竭@個(gè)結(jié)果以后,我想知道是對是錯(cuò),我在網(wǎng)上做了些調(diào)研,發(fā)現(xiàn)真是說他們兩個(gè)是同鄉(xiāng),機(jī)器可以挖掘出來很多普通人不了解的知識(shí)。
同一個(gè)名字“李娜”,很多人都叫李娜,這個(gè)時(shí)候推薦哪一個(gè)李娜出來,這是一個(gè)問題。比如我的Query是小威,可能就是網(wǎng)球員李娜,給的標(biāo)簽就是“小威的對手”。但是如果搜的就是一首歌呢,我推薦的就是歌手李娜。人的腦袋里也是,你有好幾個(gè)同學(xué)都是同一個(gè)名字,突然說這個(gè)名字,你反應(yīng)出哪一個(gè)人,有和他相關(guān)的一些事情限定:這是中學(xué)同學(xué),那是大學(xué)同學(xué)等等。
除了我剛才講的這些大家比較直觀的看到這些知識(shí)以外,還有一類也是人的高級(jí)智力活動(dòng)。很多人喜歡下棋,有的下圍棋,有的下象棋。國際象棋,很多年以前國際象棋,計(jì)算機(jī)已經(jīng)戰(zhàn)勝人類,圍棋復(fù)雜度高很多,所以我們讓我們的機(jī)器具備了一些下更難的圍棋的能力。我們現(xiàn)在已經(jīng)做到9×9圍棋達(dá)到了職業(yè)選手水平,19×19也可以達(dá)到業(yè)余段位棋手水平。
剛才講了對語言的理解,對知識(shí)的掌握和運(yùn)用,還有剛才我要說就是對人的理解。人可以是對某一個(gè)個(gè)人,即使是兩個(gè)親兄弟,兩個(gè)同學(xué),他們都是不一樣,但是他們有共性。真是兄弟倆一定有很多的共性,如果是同學(xué)兩個(gè)人,也有很多的相似性。所以我們既要對個(gè)體建模,也要對群體建模。比如咱們今天在會(huì)場的這些人,一定是對“科技改變世界”會(huì)有興趣,我們有一些共同的興趣。還有社會(huì)整體趨勢,現(xiàn)在越來越多的人開始使用智能手機(jī),整個(gè)社會(huì)整體在發(fā)生變化。
我舉一個(gè)簡單的例子,這是我們真實(shí)的從百度搜索用戶需求角度,我們做了一些分析,這一分析利用很多我們數(shù)據(jù)挖掘技術(shù),自動(dòng)分析出來的。用戶對一些不同類別的需求,工作時(shí)間和業(yè)余時(shí)間的不同。大家可以看第三到七列是跟游戲相關(guān),藍(lán)色是工作時(shí)間,黃色是業(yè)余時(shí)間。按道理,打游戲應(yīng)該都是業(yè)余時(shí)間的事,但我們看到這張圖,大家可以發(fā)現(xiàn)這很有意思,這種大型游戲工作時(shí)間玩的人不多,但是也有。但是業(yè)余時(shí)間玩的人很多,但大家看網(wǎng)頁游戲,反倒是工作時(shí)間玩的人很多,這個(gè)很有意思,我們一推理可能也一定,就是很多人工作時(shí)間忍不住想玩一下,但是玩大型網(wǎng)游肯定不方便,小游戲一打開玩兩下,網(wǎng)頁游戲很方便,這看上去符合人的直覺,這也是一種建模。這是另一個(gè)模型,我們每天要一日三餐,考慮吃什么,吃川菜,粵菜,做了全國各地不同地區(qū)對不同菜系感興趣的模型,川菜受歡迎的程度很高,除了廣州大家最感興趣的還是粵菜,全國各地很多地方對川菜感興趣。
這是個(gè)性化的例子,這怎么看?如果不同的用戶,一個(gè)用戶是對動(dòng)漫感興趣,一個(gè)是對快遞感興趣。我們搜SF這兩個(gè)字母的時(shí)候,用戶找的東西是不一樣,如果對動(dòng)漫感興趣的可能是找跟動(dòng)漫相關(guān)的,快遞的用戶找的就是順豐速遞,我們根據(jù)個(gè)人不同興趣進(jìn)行推薦,會(huì)推薦不同的東西出來。
剛才講了三方面,語言、知識(shí)、對人的理解,我們結(jié)合起來會(huì)有綜合的思考能力,綜合的思考能力可以從很多方面來展現(xiàn)。大家看了小度機(jī)器人,這樣一個(gè)小度機(jī)器人可以聽人的問題,可以去回答。背后是什么,背后就是對語言的理解,對知識(shí)的掌握,從而形成我們叫“深度問答技術(shù)”。除了小度機(jī)器人,這些技術(shù)應(yīng)用在百度的產(chǎn)品,我們問瀕臨滅絕的動(dòng)物是什么,或者問某一個(gè)片子的片尾曲,百度都可以給出答案?!霸袐D可以吃荔枝嗎”,在座的朋友有多少可以回答這個(gè)問題,其實(shí)這類的問題不同人可能會(huì)有不同的回答,該怎么辦?百度會(huì)告訴你,有多少人認(rèn)為能吃,還會(huì)告訴你相應(yīng)的能吃的原因是什么,認(rèn)為不能吃的原因是什么。包括問“寶寶打嗝怎么辦”,百度會(huì)告訴你怎么辦,會(huì)把這些答案精煉提取出來。
說智能交互,交互有很多形式,剛才我說的問答也是一種交互,對話也是一種交互。我們的機(jī)器不僅具備了語言交互能力,可以識(shí)別聲音,可以識(shí)別圖像,這就是我們所說的我們可以做“多通道、多輪對話的智能交互”。我給大家看這樣一幅圖片,問大家這是什么花?有可能有人會(huì)覺得是櫻花或者是梅花,看上去有一點(diǎn)像。圖片相對花的部分比較小,所以機(jī)器這個(gè)時(shí)候可以很智能的提示用戶說,我看不清楚,照一個(gè)花的特寫。有了特寫以后,因?yàn)楝F(xiàn)場照的,我們可以結(jié)合很多信息,我知道現(xiàn)在是什么時(shí)間照的,通過定位信息知道什么地方照的,春天的時(shí)候在玉淵潭照的很有可能就是櫻花,我們結(jié)合這樣的背景信息可以猜到答案是什么。如果沒有這些信息后臺(tái)我們會(huì)挖掘很多知識(shí),大家記得我們會(huì)挖掘很多知識(shí),知識(shí)會(huì)知道櫻花和梅花之間的區(qū)別,花柄會(huì)有不同。我問用戶有沒有花柄,用戶不知道,我有一個(gè)花柄的特寫,他一看這就是花柄,他說那是有的。實(shí)際我們就知道它是什么花了。剛才舉的是一個(gè)形象的例子,這在百度的產(chǎn)品里已經(jīng)實(shí)現(xiàn)了,大家如果拿手機(jī)就可以拍一個(gè)花,有一個(gè)交互的過程就知道這個(gè)花是什么了。
還有一個(gè)涉及到交互的例子—訂飛機(jī)票。屏幕中的圖片是手機(jī)的一款應(yīng)用,而應(yīng)用的背后承載著百度的智能交互技術(shù),通過對文字及語音的解析和理解,從而調(diào)用后臺(tái)知識(shí)庫里的知識(shí),全自動(dòng)地完成訂票。應(yīng)用的后臺(tái)具有強(qiáng)大的處理能力,模擬出呼叫中心的業(yè)務(wù)人員在與用戶交流的場景,而實(shí)際上,用戶一直在與機(jī)器進(jìn)行互動(dòng)。
開場的時(shí)候我提到了人是有情感的,我們要對人的情感進(jìn)行分析。當(dāng)我們問“玉龍雪山怎么樣”時(shí),百度搜索會(huì)根據(jù)網(wǎng)上的評論信息,匯總統(tǒng)計(jì)好評、中評、差評的數(shù)量,綜合出一個(gè)打分。同理,當(dāng)用戶搜索上海怎么樣時(shí),百度搜索會(huì)整合出用戶對上海這座城市的評價(jià)。當(dāng)用戶搜某一個(gè)型號(hào)的汽車時(shí),就不能簡單地列舉出這款汽車好或不好,因?yàn)椴煌脩舻年P(guān)注點(diǎn)不一樣,有的用戶關(guān)心動(dòng)力,有的用戶關(guān)心操控性,有的用戶關(guān)心內(nèi)飾……百度搜索可以將不同維度下大家對車的評價(jià)進(jìn)行提煉,綜合的對這款車進(jìn)行評價(jià)。
最后說到就是計(jì)算機(jī)領(lǐng)域和人工智能領(lǐng)域非常經(jīng)典的話題,“圖靈測試”,這是人工智能的終極目標(biāo)之一。大家知道圖靈測試的過程就是讓一個(gè)人和一個(gè)機(jī)器同時(shí)同樣的問題,如果測試人不能確認(rèn)被測試者30%的答復(fù)哪個(gè)是人、哪個(gè)是機(jī)器的回答,那么我們就認(rèn)為這臺(tái)機(jī)器就通過了圖靈測試。
“昆明在哪個(gè)省——云南”,人和機(jī)器都能回答出。
“寫出一些有關(guān)‘送別’主題的唐詩”,人可能會(huì)想到,機(jī)器因?yàn)橛兄R(shí)庫的支撐,所以也可以做到。
對兩個(gè)非常復(fù)雜的數(shù)字進(jìn)行四則運(yùn)算,機(jī)器比人快,但是如果機(jī)器瞬間給出答案,反倒讓測試人發(fā)現(xiàn)給出答案的不是人而是機(jī)器。所以,在這個(gè)時(shí)候,機(jī)器會(huì)停頓一會(huì),再給出答案。下面的例子就是下棋,目前圍棋已經(jīng)做得非常好。
大家看到,如果通過這樣一個(gè)圖靈測試,很多的任務(wù)場景和前面我提到的內(nèi)容具有很強(qiáng)的相關(guān)性。如果我們把語言理解能力做得越來越好,把對知識(shí)的掌握和運(yùn)用的能力做得越來越好,同時(shí)加上我們對人的理解能力,機(jī)器可以真的像人一樣思考。(完)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。