英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)：融合 AI 與 SI 推進(jìn)智能機(jī)器人產(chǎn)業(yè)

本文作者：英特爾中國(guó)研究院

編輯：谷磊

2017-05-08 11:18

導(dǎo)語：作為人工智能最重要的應(yīng)用領(lǐng)域之一，機(jī)器人話題飽受關(guān)注。作為專欄開篇文章，看看在英特爾中國(guó)研究院院長(zhǎng)眼中，AI與SI如何幫助智能機(jī)器人產(chǎn)業(yè)破局？

雷鋒網(wǎng)按：本文作者宋繼強(qiáng)，英特爾中國(guó)研究院院長(zhǎng)。

宋繼強(qiáng)

今天，我們正在擁抱一個(gè)萬物智能互聯(lián)的新世界。越來越多的物和設(shè)備通過網(wǎng)絡(luò)實(shí)現(xiàn)互聯(lián)互通，讓數(shù)據(jù)呈現(xiàn)爆發(fā)之勢(shì)。數(shù)據(jù)洪流洶涌而至，數(shù)據(jù)正在成為技術(shù)領(lǐng)域最重要的驅(qū)動(dòng)力。人工智能、自動(dòng)駕駛、5G 和VR/MR 等一系列前瞻性技術(shù)的出現(xiàn)，令我們有機(jī)會(huì)充分釋放這些數(shù)據(jù)的潛能，不斷升級(jí)人類生活體驗(yàn)。

非常高興從今天開始，我們?cè)诶卒h網(wǎng)開設(shè)英特爾中國(guó)研究院專欄。借助這個(gè)平臺(tái)，我們希望與大家分享并交流英特爾對(duì)于前瞻技術(shù)趨勢(shì)的觀察，探討萬物智能互聯(lián)的當(dāng)下與未來。作為專欄系列文章的開篇，讓我們先從機(jī)器人、人工智能的視角切入，探究數(shù)據(jù)洪流時(shí)代的產(chǎn)業(yè)機(jī)遇。

融合 AI 與 SI 推進(jìn)智能機(jī)器人產(chǎn)業(yè)

機(jī)器人作為人工智能最重要的應(yīng)用領(lǐng)域，一直飽受關(guān)注。好萊塢大片中經(jīng)常出現(xiàn)的智能機(jī)器人為大眾設(shè)置了很高的預(yù)期，而現(xiàn)實(shí)的服務(wù)機(jī)器人的智能能力遠(yuǎn)未達(dá)標(biāo)。伴隨著近來深度學(xué)習(xí)催熱的這一波人工智能大潮，智能機(jī)器人產(chǎn)業(yè)如何破局是一個(gè)很重要的問題。我認(rèn)為兩個(gè)方面非常關(guān)鍵：一個(gè)是人工智能（AI: Artificial Intelligence）與智能交互（SI: Smart Interaction）深度融合；另一個(gè)是智能機(jī)器人的安全性。關(guān)于安全性我們留到以后再談，今天重點(diǎn)探討AI與SI的融合。

AI 在學(xué)術(shù)界有一個(gè)比較常用的定義，就是要了解智能的實(shí)質(zhì)，并且要能夠生產(chǎn)出一種像人一樣，以智慧的方式對(duì)外界輸入作出反應(yīng)的智能機(jī)器。這個(gè)學(xué)科的最終目的是讓機(jī)器具有智能的反應(yīng)能力，所以智能機(jī)器人可以看做是人工智能的終極目標(biāo)。

了解智能的實(shí)質(zhì)有兩種辦法：

一種是通過哲學(xué)或者心理學(xué)的方法，從外部觀察人的行為來推測(cè)人是以怎樣的智能方式在思考；
另外一種是把人腦切開看看神經(jīng)解剖結(jié)構(gòu)，并且通過腦活動(dòng)檢測(cè)技術(shù)和精心設(shè)計(jì)的實(shí)驗(yàn)來發(fā)現(xiàn)智能活動(dòng)的規(guī)律。

當(dāng)我們對(duì)智能有了一個(gè)認(rèn)識(shí)（未必正確、但至少有了模型），那怎樣把機(jī)器變得智能就需要數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家、自動(dòng)化專家去鉆研。所以，人工智能相關(guān)的學(xué)科很多，除了軟的理論、模型和算法，還需要依賴硬件落地，比如說需要芯片去給它提供強(qiáng)有力的計(jì)算和存儲(chǔ)。對(duì)于機(jī)器人這種智能體，還需要有復(fù)雜的系統(tǒng)控制技術(shù)支撐。

現(xiàn)在這一波人工智能的熱潮，實(shí)際上也是受益于目前最新的計(jì)算和存儲(chǔ)的改進(jìn)。神經(jīng)網(wǎng)絡(luò)技術(shù)來自于腦的神經(jīng)元結(jié)構(gòu)啟發(fā)，但它跟腦的處理過程完全不一樣。它是通過大規(guī)模的數(shù)據(jù)去訓(xùn)練，然后機(jī)器從數(shù)據(jù)中學(xué)習(xí)一些內(nèi)在的規(guī)律，形成一個(gè)模型，再用這個(gè)模型去推測(cè)新的數(shù)據(jù)。這稱為一個(gè)機(jī)器學(xué)習(xí)的過程，它需要很多的存儲(chǔ)和計(jì)算能力，而我們現(xiàn)在正處于一個(gè)非常適合它大發(fā)展的時(shí)代。

為什么非常合適呢？因?yàn)槭芤嬗谀柖?，過去20年硬件的能力獲得大幅發(fā)展，其中單位成本的計(jì)算能力提高1.5萬倍、存儲(chǔ)能力提高3萬倍。通訊技術(shù)從有線發(fā)展到無線，現(xiàn)在正向5G邁進(jìn)。這意味著我們不僅可以讓智能機(jī)器具有強(qiáng)大的大腦，在需要的時(shí)候還可以靈活利用云端的能力。云、端結(jié)合釋放持續(xù)學(xué)習(xí)和改善的能力。

而 AI 的算法像深度學(xué)習(xí)，通過統(tǒng)計(jì)和大數(shù)據(jù)迎來一個(gè)非常大的飛躍，它在圖像識(shí)別還有語音識(shí)別上已經(jīng)超越了人類的能力。而且我們看到更大的數(shù)據(jù)也成為了可能，例如一輛無人駕駛汽車一天就產(chǎn)生4TB 的數(shù)據(jù)，而且是不同源的、異構(gòu)的數(shù)據(jù)。有了這些數(shù)據(jù)以后就要考慮怎樣去處理它來產(chǎn)生實(shí)時(shí)的價(jià)值，提供可靠、高質(zhì)量的服務(wù)。

現(xiàn)在深度學(xué)習(xí)一枝獨(dú)秀，但是處理這么多種數(shù)據(jù)完成目標(biāo)任務(wù)只靠這一類算法是不夠的。所以，NN+X 就代表要讓神經(jīng)網(wǎng)絡(luò)加各種新的技術(shù)，并且要正視人工智能算法的局限性。引用一下機(jī)器人界也是人工智能學(xué)界的大牛 Rodney Brooks 教授（人工智能專家，行為學(xué)派杰出代表，美國(guó)國(guó)家工程院院士，iRobot、Rethink Robotics 創(chuàng)始人，Baxter 之父，MIT CSAIL前主任）的觀點(diǎn)，他主張先不去管用什么樣的邏輯模型或者什么樣的神經(jīng)網(wǎng)絡(luò)模型去模擬人的思維過程，而要通過實(shí)際的智能體去感知，然后去研究怎樣通過全系統(tǒng)優(yōu)化去做出正確的反應(yīng)。他認(rèn)為特別是產(chǎn)業(yè)界不要沉迷于某一種技術(shù)，重要的是根據(jù)實(shí)際需要去使用技術(shù)，為人類提供價(jià)值。他認(rèn)為第一輪AI可以提供的價(jià)值是在五年左右，在輔助駕駛和自動(dòng)駕駛這個(gè)領(lǐng)域，第二輪就是十年左右，可以在助老機(jī)器人領(lǐng)域提供很大的社會(huì)價(jià)值。

關(guān)于在機(jī)器中加入智能能力，整個(gè)產(chǎn)業(yè)界是在分三步走。

首先是把一些不聯(lián)網(wǎng)的設(shè)備連了網(wǎng)，連網(wǎng)以后設(shè)備就有了信息傳遞和更新的能力，同時(shí)它也可以結(jié)合社交服務(wù)提供客戶價(jià)值。但這個(gè)還不算多么智能，只算把設(shè)備互聯(lián)了。
第二步就是我們現(xiàn)在所處的智能設(shè)備這個(gè)級(jí)別，其實(shí)就是手機(jī)上能夠提供的這些智能服務(wù)，把視覺、聽覺識(shí)別的能力加進(jìn)去，再結(jié)合數(shù)據(jù)挖掘技術(shù)和知識(shí)庫提供服務(wù)。這些智能機(jī)器能夠聽和看，但還不是聽懂和看懂。
終極目標(biāo)是第三步，就是自主機(jī)器。

現(xiàn)在我們基本上已經(jīng)跨越了第二步，正在向第三步邁進(jìn)。但這個(gè)發(fā)展過程不是線性的，因?yàn)閺牡诙降降谌綍?huì)越來越復(fù)雜，不僅要理解環(huán)境和行為，還要能理解人的情緒。因?yàn)闄C(jī)器人服務(wù)的是人，如果不能理解人的情緒、達(dá)到交流共識(shí)的話，就沒法提供很好的服務(wù)。

英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)：融合 AI 與 SI 推進(jìn)智能機(jī)器人產(chǎn)業(yè)

從CT到RT，需要人工智能技術(shù)與其它技術(shù)緊密合作完成“感知-認(rèn)知-執(zhí)行”的人機(jī)交互閉環(huán)

智能機(jī)器人就是典型的自主系統(tǒng)。如上圖所示，從現(xiàn)在的計(jì)算機(jī)技術(shù)（CT: Computer Technology）到未來的機(jī)器人技術(shù)（RT: Robot Technology），需要人工智能技術(shù)與其它技術(shù)緊密合作完成“感知-認(rèn)知-執(zhí)行”的人機(jī)交互閉環(huán)。機(jī)器人工作在一個(gè)開放的環(huán)境里，服務(wù)的是不愿遵守刻板交互規(guī)則的普通消費(fèi)者。從整個(gè)交互過程來講有很多不確定性，沒有AI算法能夠保證不出問題，因此必須結(jié)合其它技術(shù)來滿足消費(fèi)者對(duì)智能機(jī)器人的預(yù)期。我認(rèn)為智能交互（SI）是最佳選擇，因?yàn)樗梢猿浞滞ㄟ^機(jī)器人的移動(dòng)性和主動(dòng)交互能力來利用人這個(gè)通用智能體去補(bǔ)足人工智能。

舉兩個(gè)例子來說明智能交互的威力。我們知道在視覺識(shí)別物體的時(shí)候，角度和遮擋都會(huì)影響識(shí)別效果。對(duì)于機(jī)器人來講，它可以利用移動(dòng)性主動(dòng)選擇一個(gè)好的角度、避開遮擋來準(zhǔn)確識(shí)別物體。再進(jìn)一步，在場(chǎng)景理解的時(shí)候，對(duì)于能夠準(zhǔn)確分割的物體，如果不能確信是什么的話（例如凳子還是茶幾），機(jī)器人可以主動(dòng)組織一個(gè)問句來詢問人。由此我們可以看出，靈活利用機(jī)器人的主動(dòng)移動(dòng)和交互能力可以顯著提升整體服務(wù)能力，促進(jìn)智能機(jī)器人的產(chǎn)業(yè)化。

總結(jié)

簡(jiǎn)而言之，我認(rèn)為在智能機(jī)器人的商業(yè)化迭代方面，首先要保證服務(wù)能力達(dá)標(biāo)，然后在這個(gè)能力要求下選擇合適的人工智能算法，配合靈活的智能交互的方案一起去達(dá)成這個(gè)能力。隨著算法能力和硬件技術(shù)的提高，在保持服務(wù)能力的前提下，逐步擴(kuò)大 AI 的比重，是通過商業(yè)化發(fā)展推動(dòng)AI技術(shù)發(fā)展的正循環(huán)之路。

雷峰網(wǎng)特約稿件，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

英特爾中國(guó)研究院

專欄作者

英特爾中國(guó)研究院專欄。以通俗筆墨解讀創(chuàng)新科技，一探萬物智能互聯(lián)的當(dāng)下與未來。佳作每?jī)芍芨拢凑?qǐng)期待。

發(fā)私信

當(dāng)月熱門文章