0
本文作者: 英特爾中國(guó)研究院 | 編輯:谷磊 | 2017-05-08 11:18 |
雷鋒網(wǎng)按:本文作者宋繼強(qiáng),英特爾中國(guó)研究院院長(zhǎng)。
宋繼強(qiáng)
今天,我們正在擁抱一個(gè)萬物智能互聯(lián)的新世界。越來越多的物和設(shè)備通過網(wǎng)絡(luò)實(shí)現(xiàn)互聯(lián)互通,讓數(shù)據(jù)呈現(xiàn)爆發(fā)之勢(shì)。數(shù)據(jù)洪流洶涌而至,數(shù)據(jù)正在成為技術(shù)領(lǐng)域最重要的驅(qū)動(dòng)力。人工智能、自動(dòng)駕駛、5G 和VR/MR 等一系列前瞻性技術(shù)的出現(xiàn),令我們有機(jī)會(huì)充分釋放這些數(shù)據(jù)的潛能,不斷升級(jí)人類生活體驗(yàn)。
非常高興從今天開始,我們?cè)诶卒h網(wǎng)開設(shè)英特爾中國(guó)研究院專欄。借助這個(gè)平臺(tái),我們希望與大家分享并交流英特爾對(duì)于前瞻技術(shù)趨勢(shì)的觀察,探討萬物智能互聯(lián)的當(dāng)下與未來。作為專欄系列文章的開篇,讓我們先從機(jī)器人、人工智能的視角切入,探究數(shù)據(jù)洪流時(shí)代的產(chǎn)業(yè)機(jī)遇。
融合 AI 與 SI 推進(jìn)智能機(jī)器人產(chǎn)業(yè)
機(jī)器人作為人工智能最重要的應(yīng)用領(lǐng)域,一直飽受關(guān)注。好萊塢大片中經(jīng)常出現(xiàn)的智能機(jī)器人為大眾設(shè)置了很高的預(yù)期,而現(xiàn)實(shí)的服務(wù)機(jī)器人的智能能力遠(yuǎn)未達(dá)標(biāo)。伴隨著近來深度學(xué)習(xí)催熱的這一波人工智能大潮,智能機(jī)器人產(chǎn)業(yè)如何破局是一個(gè)很重要的問題。我認(rèn)為兩個(gè)方面非常關(guān)鍵:一個(gè)是人工智能(AI: Artificial Intelligence)與智能交互(SI: Smart Interaction)深度融合;另一個(gè)是智能機(jī)器人的安全性。關(guān)于安全性我們留到以后再談,今天重點(diǎn)探討AI與SI的融合。
AI 在學(xué)術(shù)界有一個(gè)比較常用的定義,就是要了解智能的實(shí)質(zhì),并且要能夠生產(chǎn)出一種像人一樣,以智慧的方式對(duì)外界輸入作出反應(yīng)的智能機(jī)器。這個(gè)學(xué)科的最終目的是讓機(jī)器具有智能的反應(yīng)能力,所以智能機(jī)器人可以看做是人工智能的終極目標(biāo)。
了解智能的實(shí)質(zhì)有兩種辦法:
一種是通過哲學(xué)或者心理學(xué)的方法,從外部觀察人的行為來推測(cè)人是以怎樣的智能方式在思考;
另外一種是把人腦切開看看神經(jīng)解剖結(jié)構(gòu),并且通過腦活動(dòng)檢測(cè)技術(shù)和精心設(shè)計(jì)的實(shí)驗(yàn)來發(fā)現(xiàn)智能活動(dòng)的規(guī)律。
當(dāng)我們對(duì)智能有了一個(gè)認(rèn)識(shí)(未必正確、但至少有了模型),那怎樣把機(jī)器變得智能就需要數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家、自動(dòng)化專家去鉆研。所以,人工智能相關(guān)的學(xué)科很多,除了軟的理論、模型和算法,還需要依賴硬件落地,比如說需要芯片去給它提供強(qiáng)有力的計(jì)算和存儲(chǔ)。對(duì)于機(jī)器人這種智能體,還需要有復(fù)雜的系統(tǒng)控制技術(shù)支撐。
現(xiàn)在這一波人工智能的熱潮,實(shí)際上也是受益于目前最新的計(jì)算和存儲(chǔ)的改進(jìn)。神經(jīng)網(wǎng)絡(luò)技術(shù)來自于腦的神經(jīng)元結(jié)構(gòu)啟發(fā),但它跟腦的處理過程完全不一樣。它是通過大規(guī)模的數(shù)據(jù)去訓(xùn)練,然后機(jī)器從數(shù)據(jù)中學(xué)習(xí)一些內(nèi)在的規(guī)律,形成一個(gè)模型,再用這個(gè)模型去推測(cè)新的數(shù)據(jù)。這稱為一個(gè)機(jī)器學(xué)習(xí)的過程,它需要很多的存儲(chǔ)和計(jì)算能力,而我們現(xiàn)在正處于一個(gè)非常適合它大發(fā)展的時(shí)代。
為什么非常合適呢?因?yàn)槭芤嬗谀柖?,過去20年硬件的能力獲得大幅發(fā)展,其中單位成本的計(jì)算能力提高1.5萬倍、存儲(chǔ)能力提高3萬倍。通訊技術(shù)從有線發(fā)展到無線,現(xiàn)在正向5G邁進(jìn)。這意味著我們不僅可以讓智能機(jī)器具有強(qiáng)大的大腦,在需要的時(shí)候還可以靈活利用云端的能力。云、端結(jié)合釋放持續(xù)學(xué)習(xí)和改善的能力。
而 AI 的算法像深度學(xué)習(xí),通過統(tǒng)計(jì)和大數(shù)據(jù)迎來一個(gè)非常大的飛躍,它在圖像識(shí)別還有語音識(shí)別上已經(jīng)超越了人類的能力。而且我們看到更大的數(shù)據(jù)也成為了可能,例如一輛無人駕駛汽車一天就產(chǎn)生4TB 的數(shù)據(jù),而且是不同源的、異構(gòu)的數(shù)據(jù)。有了這些數(shù)據(jù)以后就要考慮怎樣去處理它來產(chǎn)生實(shí)時(shí)的價(jià)值,提供可靠、高質(zhì)量的服務(wù)。
現(xiàn)在深度學(xué)習(xí)一枝獨(dú)秀,但是處理這么多種數(shù)據(jù)完成目標(biāo)任務(wù)只靠這一類算法是不夠的。所以,NN+X 就代表要讓神經(jīng)網(wǎng)絡(luò)加各種新的技術(shù),并且要正視人工智能算法的局限性。引用一下機(jī)器人界也是人工智能學(xué)界的大牛 Rodney Brooks 教授(人工智能專家,行為學(xué)派杰出代表,美國(guó)國(guó)家工程院院士,iRobot、Rethink Robotics 創(chuàng)始人,Baxter 之父,MIT CSAIL前主任)的觀點(diǎn),他主張先不去管用什么樣的邏輯模型或者什么樣的神經(jīng)網(wǎng)絡(luò)模型去模擬人的思維過程,而要通過實(shí)際的智能體去感知,然后去研究怎樣通過全系統(tǒng)優(yōu)化去做出正確的反應(yīng)。他認(rèn)為特別是產(chǎn)業(yè)界不要沉迷于某一種技術(shù),重要的是根據(jù)實(shí)際需要去使用技術(shù),為人類提供價(jià)值。他認(rèn)為第一輪AI可以提供的價(jià)值是在五年左右,在輔助駕駛和自動(dòng)駕駛這個(gè)領(lǐng)域,第二輪就是十年左右,可以在助老機(jī)器人領(lǐng)域提供很大的社會(huì)價(jià)值。
關(guān)于在機(jī)器中加入智能能力,整個(gè)產(chǎn)業(yè)界是在分三步走。
首先是把一些不聯(lián)網(wǎng)的設(shè)備連了網(wǎng),連網(wǎng)以后設(shè)備就有了信息傳遞和更新的能力,同時(shí)它也可以結(jié)合社交服務(wù)提供客戶價(jià)值。但這個(gè)還不算多么智能,只算把設(shè)備互聯(lián)了。
第二步就是我們現(xiàn)在所處的智能設(shè)備這個(gè)級(jí)別,其實(shí)就是手機(jī)上能夠提供的這些智能服務(wù),把視覺、聽覺識(shí)別的能力加進(jìn)去,再結(jié)合數(shù)據(jù)挖掘技術(shù)和知識(shí)庫提供服務(wù)。這些智能機(jī)器能夠聽和看,但還不是聽懂和看懂。
終極目標(biāo)是第三步,就是自主機(jī)器。
現(xiàn)在我們基本上已經(jīng)跨越了第二步,正在向第三步邁進(jìn)。但這個(gè)發(fā)展過程不是線性的,因?yàn)閺牡诙降降谌綍?huì)越來越復(fù)雜,不僅要理解環(huán)境和行為,還要能理解人的情緒。因?yàn)闄C(jī)器人服務(wù)的是人,如果不能理解人的情緒、達(dá)到交流共識(shí)的話,就沒法提供很好的服務(wù)。
從CT到RT,需要人工智能技術(shù)與其它技術(shù)緊密合作完成“感知-認(rèn)知-執(zhí)行”的人機(jī)交互閉環(huán)
智能機(jī)器人就是典型的自主系統(tǒng)。如上圖所示,從現(xiàn)在的計(jì)算機(jī)技術(shù)(CT: Computer Technology)到未來的機(jī)器人技術(shù)(RT: Robot Technology),需要人工智能技術(shù)與其它技術(shù)緊密合作完成“感知-認(rèn)知-執(zhí)行”的人機(jī)交互閉環(huán)。機(jī)器人工作在一個(gè)開放的環(huán)境里,服務(wù)的是不愿遵守刻板交互規(guī)則的普通消費(fèi)者。從整個(gè)交互過程來講有很多不確定性,沒有AI算法能夠保證不出問題,因此必須結(jié)合其它技術(shù)來滿足消費(fèi)者對(duì)智能機(jī)器人的預(yù)期。我認(rèn)為智能交互(SI)是最佳選擇,因?yàn)樗梢猿浞滞ㄟ^機(jī)器人的移動(dòng)性和主動(dòng)交互能力來利用人這個(gè)通用智能體去補(bǔ)足人工智能。
舉兩個(gè)例子來說明智能交互的威力。我們知道在視覺識(shí)別物體的時(shí)候,角度和遮擋都會(huì)影響識(shí)別效果。對(duì)于機(jī)器人來講,它可以利用移動(dòng)性主動(dòng)選擇一個(gè)好的角度、避開遮擋來準(zhǔn)確識(shí)別物體。再進(jìn)一步,在場(chǎng)景理解的時(shí)候,對(duì)于能夠準(zhǔn)確分割的物體,如果不能確信是什么的話(例如凳子還是茶幾),機(jī)器人可以主動(dòng)組織一個(gè)問句來詢問人。由此我們可以看出,靈活利用機(jī)器人的主動(dòng)移動(dòng)和交互能力可以顯著提升整體服務(wù)能力,促進(jìn)智能機(jī)器人的產(chǎn)業(yè)化。
簡(jiǎn)而言之,我認(rèn)為在智能機(jī)器人的商業(yè)化迭代方面,首先要保證服務(wù)能力達(dá)標(biāo),然后在這個(gè)能力要求下選擇合適的人工智能算法,配合靈活的智能交互的方案一起去達(dá)成這個(gè)能力。隨著算法能力和硬件技術(shù)的提高,在保持服務(wù)能力的前提下,逐步擴(kuò)大 AI 的比重,是通過商業(yè)化發(fā)展推動(dòng)AI技術(shù)發(fā)展的正循環(huán)之路。
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。