0
本文作者: 汪思穎 | 2018-05-14 18:16 |
雷鋒網(wǎng) AI 科技評論按,2018 年 5 月 11 日,中國工程院院士「智能與網(wǎng)絡(luò)前沿問題與應(yīng)用」論壇于惠州召開,本次大會由中國工程院指導,香港中文大學(深圳)、鵬城實驗室(深圳網(wǎng)絡(luò)空間科學與技術(shù)省實驗室)承辦,惠州仲愷(國家級)高新區(qū)管委會、星河控股集團協(xié)辦。
會上,中國工程院院士、香港中文大學(深圳)校長徐揚生,中國工程院院士、鵬城實驗室主任高文,百度副總裁、研究院院長王海峰,中國科技大學信息科學技術(shù)學院執(zhí)行院長吳楓帶來了四場精彩的主題報告,他們的演講涉及到機器人、智能城市、AI 應(yīng)用、類腦計算、視頻編解碼等多個領(lǐng)域,各位學術(shù)大?;蛟敿毜貓蟾媪俗钚碌膶W術(shù)進展,或幽默地展示了自己最新的研究,現(xiàn)場座無虛席。
機器人與人工智能時代的教育
作為第一位演講的嘉賓,徐揚生院士開場即表示,現(xiàn)在已經(jīng)到了人工智能時代,這一時代人工智能對社會的發(fā)展會產(chǎn)生諸多影響,同時人工智能也將影響到教育。在報告中,他先是列舉了他們研制的各種機器人和智能機器,之后談到機器人從動作到智能的發(fā)展,在演講的最后,他提到了智能革命以及心腦解放對人類社會的影響,以及人工智能時代應(yīng)該進行什么樣的教育。
他表示,機器人即感知、認知再加上動作。之后,他展示了他們研制的一系列機器人,比如單輪機器人、爬樹機器人、爬衫機器人、家庭服務(wù)機器人、安全監(jiān)控機器人、救災機器人、智能交互機器人、智能帽控輪椅、智能鞋等等。
在他看來,機器人技術(shù)有四大特征:
一是智能化技術(shù),即自主識別判斷能力;
二是綜合性技術(shù),這是典型的交叉學科;
三是實時性技術(shù),需要能對不可預知的突發(fā)情況進行快速處理;
四是交互性技術(shù),這里涉及到與人與機的各種交互。
他表示,這里面存在很多科學問題,比如圖像的理解、智能的描述、實時深度學習、人與機器的交互、普適性感知。
他表示,在之前的幾十年,機器人基本上圍繞著動作在發(fā)展,而現(xiàn)在得益于大數(shù)據(jù)的支撐,是時候考慮機器人的智能了?!钢悄鼙葎幼鞲匾??!顾麖娬{(diào)。他以人來舉例,他說道,人的骨骼、皮膚、腸胃等等一直處于更新?lián)Q代中,但人的腦部中樞和神經(jīng)細胞終身不變,大腦和「心靈」,遠比肉體重要。引申到技術(shù),他表示,現(xiàn)在越來越多的機械代替人肉體的勞動,但是,大腦與心靈的解放遠比肉體要重要。
他強調(diào),心腦解放將帶來一場智能革命,人類將重新進行社會分工,許多行業(yè)會面臨消失的困境。機器人的強項是記憶、邏輯、精準、快速,人的強項是直覺、感情、想象、創(chuàng)造,所以人應(yīng)該發(fā)揮自己的強項。這就引出人工智能時代的教育問題,他認為,應(yīng)該培養(yǎng)學生的想象力和創(chuàng)造力,引入非知識型的教育和考試。
深度剖析智慧城市大腦
接下來是高文院士的精彩報告,高文院士講了智慧城市的應(yīng)用,并從技術(shù)層面對智慧城市大腦進行了剖析。
他提到城市現(xiàn)存的交通問題、安保問題,對于交通堵塞問題,目前一般的做法只是根據(jù)每個路口的交通狀況做出分析,解決能力很差。他提到杭州的案例,他表示,杭州由于車輛、路口眾多,經(jīng)常存在堵車現(xiàn)象,他們通過云計算重新規(guī)劃信號燈,控制紅路燈的時間,達到了平均 17% 的駕駛速度優(yōu)化。他們稱這一系統(tǒng)為城市大腦。之后,他詳解了城市大腦系統(tǒng)的構(gòu)造,最底層是數(shù)據(jù)庫,中間是數(shù)據(jù)交換平臺,上層是算法,再往上是操作和服務(wù)的平臺,外圍是各種各樣傳感器。所有信號都會匯總到這個系統(tǒng)里,進行統(tǒng)一優(yōu)化。
但他表示,雖然用以上系統(tǒng)根據(jù)以往的數(shù)據(jù)來做調(diào)度規(guī)劃表現(xiàn)不錯,但對突發(fā)事件無法及時做出判斷。主要原因如下:現(xiàn)在在設(shè)計系統(tǒng)的時候,是為存儲而設(shè)計,不是為了實時響應(yīng)而設(shè)計,不夠智能;系統(tǒng)里沒有統(tǒng)一的時間戳;沒有準確的地理位置信息;無法在壓縮數(shù)據(jù)上直接解碼分析。
之后他提出數(shù)字視網(wǎng)膜的概念,這一系統(tǒng)可以解決數(shù)據(jù)和算法利用率低的問題。他提到其中的核心技術(shù),
一是高效的編碼;
二是視頻特征的緊湊表達;
三是視頻編碼與特征編碼的聯(lián)合優(yōu)化;
四是聯(lián)合 R-D 和 R-A 優(yōu)化。
他表示,數(shù)字視網(wǎng)膜結(jié)合了視頻編碼+特征編碼,既能精細編碼視覺內(nèi)容,又具備面向識別理解的功能。之后,他提到數(shù)字視網(wǎng)膜的整體框架,詳細描述了構(gòu)建方案以及效果,例如可以進行無牌車搜索、遮擋車輛搜索等。
在演講最后,他總結(jié)道,要想真正做好智慧城市,僅僅依靠現(xiàn)有的攝像機和系統(tǒng)是不行的,需要提升到帶有數(shù)字視網(wǎng)膜的攝像機。他表示,技術(shù)上的標準已經(jīng)完成了,接下來就是產(chǎn)品和系統(tǒng)開發(fā)。
雷鋒網(wǎng)此前對高文院士的城市大腦進行過相關(guān)報道,詳情參見:高文院士50張PPT,帶你看懂城市大腦的瓶頸與重大突破點
百度在人工智能上的布局
隨后上臺演講的是百度副總裁、研究院院長王海峰,王海峰的演講主題是《智能時代的機遇與挑戰(zhàn)》,演講伊始,他說道,前面兩位院士不約而同都講到了人工智能,他今天的主題也是智能。他表示,互聯(lián)網(wǎng)近年來快速發(fā)展,帶來一系列強大的算法、大數(shù)據(jù)以及計算平臺,這是人工智能得以高速發(fā)展的基礎(chǔ)。
他說道,人工智能正在影響各行各業(yè),為行業(yè)帶來更高的效率,更高的生產(chǎn)力。
接下來他講了百度在人工智能上的布局,他表示,百度成立之初即布局人工智能,在 2010 年開始全面布局,目前已經(jīng)形成相對比較完整的生態(tài)。
百度人工智能技術(shù)布局主要有四個層面:
一是基礎(chǔ)層,這里就是前面提到的大數(shù)據(jù)、算法、大計算;
二是感知層,這里包括語音、圖像、視頻、AR/VR;
三是認知層,這里包括自然語言處理、知識圖譜、用戶畫像;
四是平臺層,即AI開放平臺與生態(tài)。
他表示,百度所建立的平臺一方面服務(wù)于百度的業(yè)務(wù),比如做搜索,另一方面也可以讓各行各業(yè)受益。
接下來他講了百度的智能搜索,現(xiàn)在用戶需求越來越復雜,越來越多的內(nèi)容線上化,設(shè)備和場景越來越豐富,因此,搜索要改變。他將傳統(tǒng)搜索與智能搜索進行對比,傳統(tǒng)搜索只存在網(wǎng)頁數(shù)據(jù),抓取之后進行需求匹配、排序。
智能搜索依賴龐大的知識圖譜構(gòu)建計算,還有基于深度學習的搜索排序與應(yīng)答、基于知識圖譜和深度語義分析的需求理解。在交互層,除了搜索框里的文字,更多是用麥克風進行語音交互,同時也可以利用攝像頭進行視覺交互。
之后他為大家展示了百度知識圖譜的一小部分以及如何構(gòu)建這一知識圖譜,他也談到需求理解中幾項典型技術(shù)如語義排序、多模交互問題等等。
在百度AI整體戰(zhàn)略布局上,主要有底層的智能云,中間的百度大腦,最上層的阿波羅自動駕駛平臺,DUER OS 對話平臺等。
他表示,第三方企業(yè)可以用他們開放出來的平臺解決問題,比如充電樁故障、生鮮商品銷售預測、制冷設(shè)備智能調(diào)控、人力資源篩選等。他也舉了很多語音技術(shù)應(yīng)用的典型案例,例如語音搜索、同聲傳譯、語音播報、語音交互、有聲閱讀、語音指令、語音質(zhì)檢。之后,他提到 OCR、視頻比對以及 AR 技術(shù)等。他表示,數(shù)據(jù)分析非常重要,可以解決很多問題,他也提到一些解決方案,例如數(shù)據(jù)倉庫解決方案、日志分析解決方案、數(shù)據(jù)挖掘解決方案、物聯(lián)網(wǎng)行業(yè)解決方案等。
最后他講了自己對技術(shù)趨勢的理解,他表示,深度學習技術(shù)是AI的核心技術(shù),但這一技術(shù)在理論基礎(chǔ)上存在三個問題——小樣本、低能耗、可解釋性。從應(yīng)用技術(shù)上講,他表示感知技術(shù)在深度學習技術(shù)的推動下得到了非常好的發(fā)展,很多地方已經(jīng)可以超過人了。但認知技術(shù)雖然發(fā)展很快,但整體還沒有到超過人的程度。未來認知技術(shù)到底怎么樣發(fā)展,還有很多要探討的地方。
從產(chǎn)業(yè)角度來看,他表示這里涉及到軟硬件、深度學習框架、AI 芯片的發(fā)展。他表示,深度學習會成為未來產(chǎn)業(yè)很核心的部分。
最后他做出總結(jié),真正想將人工智能技術(shù)應(yīng)用于各行各業(yè),帶來各行各業(yè)生產(chǎn)力提升,更多不是單點技術(shù),而是多種人工智能技術(shù)綜合應(yīng)用,同時也要結(jié)合應(yīng)用場景進行系統(tǒng)化創(chuàng)新。
在他的報告結(jié)束之后,吳楓教授帶來了以《類腦人工智能及應(yīng)用》為主題的報告,這也是今天的最后一場報告。
類腦人工智能以及利用 AI 進行視頻編碼
他帶來的內(nèi)容涉及三方面,一是深度學習,二是類腦計算,三是人工智能的應(yīng)用。
報告伊始,他談到人工智能這幾年取得了很多突破,這些突破實際上是基于深度學習技術(shù),通過強大的計算能力,對大規(guī)模的數(shù)據(jù)進行學習,然后得到深度神經(jīng)網(wǎng)絡(luò)的模型。他提到目前深度學習和人腦主要有兩個相似度:第一,深度學習的神經(jīng)元模型是由人腦神經(jīng)元推導出來的。第二,從早期的淺層神經(jīng)網(wǎng)絡(luò)發(fā)展至今,現(xiàn)在的深度學習有很多層次,這和腦比較相似。
他提到目前深度學習的局限性:
一是離不開大數(shù)據(jù)、高質(zhì)量的標注;
二是自學習、遷移學習等能力弱;
三是消耗大量計算資源;
四是現(xiàn)有機器沒有形成概念和知識,缺少邏輯分析和推理。
接下來,他談到類腦人工智能,在國家去年發(fā)布的人工智能發(fā)展規(guī)劃里,明確提到類腦智能計算理論,他表示,歐盟、美國和中國都在發(fā)展腦計劃,進行腦認知和模擬方面的研究。他談到中科大的類腦智能技術(shù)及應(yīng)用國家工程實驗室,實驗室的使命就是要建立腦科學研究和人工智能研究的橋梁,把腦科學研究得到的成果應(yīng)用到人工智能發(fā)展里。
接下來是類腦智能的發(fā)展瓶頸:
第一,對腦機理的認知不夠清楚,在這里,他對腦結(jié)構(gòu)與功能進行解析,其中涉及到數(shù)據(jù)存儲、數(shù)據(jù)重構(gòu)、數(shù)據(jù)可視化、量化分析多個層面。
第二,類腦計算模型和算法不準確。他提到 2014 年網(wǎng)格細胞的發(fā)現(xiàn)以及 2018 年 DeepMind 發(fā)表的一篇 nature 論文。他表示,腦科學研究會給人工智能發(fā)展帶來啟發(fā)。
第三,計算架構(gòu)和能力的制約,他表示,現(xiàn)在的計算系統(tǒng)是計算與存儲分離,這樣的系統(tǒng)功耗高、并行度低、規(guī)模有限。而借鑒人腦的計算模式,可以提出高密度、低功耗的計算系統(tǒng)。
他提到現(xiàn)在亟需借鑒腦網(wǎng)絡(luò)結(jié)構(gòu),發(fā)展低功耗計算,從電路、架構(gòu)層次等方面展開研究,實現(xiàn)存算一體的網(wǎng)絡(luò)化計算。他們也在模擬神經(jīng)元計算上做了一些嘗試,比如實現(xiàn)了基于 180nm 標準 CMOS 工藝的低功耗數(shù)模混合神經(jīng)元芯片,實現(xiàn)了多種高精度、低功耗的模數(shù)轉(zhuǎn)換器。
演講最后,他提到人工智能的相關(guān)應(yīng)用——視頻編碼。他表示,現(xiàn)在的智能編碼框架可以用學習的方法從大規(guī)模數(shù)據(jù)中獲得模型,替代原來基于經(jīng)驗或者少量數(shù)據(jù)統(tǒng)計出來的模型。他也詳解了智能視頻編碼的框架,以及基于學習的后處理技術(shù)、基于學習的熵編碼,在對比中,可以看到基于學習的編碼方案名列前茅。
雷鋒網(wǎng) AI 科技評論總結(jié):以上為中國工程院院士「智能與網(wǎng)絡(luò)前沿問題與應(yīng)用」論壇內(nèi)容介紹。在半天會議中,徐揚生院士的報告普及了人工智能與機器人的相關(guān)知識, 并讓我們對教育問題進行重新思考;高文院士的匯報了目前城市大腦的突破,該如何發(fā)展城市大腦;王海峰院長讓我們了解到深度學習的各種應(yīng)用,以及百度在人工智能上的布局;吳楓院長則帶來了對于計算的前沿思考——借鑒腦網(wǎng)絡(luò)結(jié)構(gòu)來發(fā)展計算系統(tǒng),以及深度學習在視頻編碼上的應(yīng)用。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。