0
本文作者: 汪思穎 | 2018-03-30 21:00 |
雷鋒網(wǎng)按,3 月 30 日,AITech(2018 國際智能科技峰會) 于深圳隆重召開。本次峰會由深圳市人民政府指導(dǎo),深圳市龍崗區(qū)人民政府、中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟主辦,深圳龍崗智能視聽研究院承辦,雷鋒網(wǎng)作為獨(dú)家戰(zhàn)略合作媒體帶來現(xiàn)場報導(dǎo)。
在智能技術(shù)與標(biāo)準(zhǔn)及 IEEE Fellow 分論壇上,迎來海信、思必馳、華為的三位產(chǎn)業(yè)領(lǐng)導(dǎo)以及南方科技大學(xué)、香港中文大學(xué)深圳分校、南京大學(xué)等五所高校(科研機(jī)構(gòu))的學(xué)術(shù)明星。三位企業(yè)代表從多個方面闡述了各自行業(yè)目前面臨的機(jī)遇、挑戰(zhàn)以及相應(yīng)應(yīng)對措施,五位學(xué)術(shù)界明星或幽默、或嚴(yán)謹(jǐn)?shù)貓蟾媪四壳白约旱膶W(xué)術(shù)研究。
海信、思必馳、華為的三位產(chǎn)業(yè)領(lǐng)導(dǎo)齊聚首
首先出場的是海信公共安全事業(yè)部總經(jīng)理孫論強(qiáng),他的演講主題是《從視頻接力到精準(zhǔn)跟蹤一一跨媒體智能領(lǐng)航安防行業(yè)》。
演講伊始,他提出安防行業(yè)迎來新的機(jī)遇與挑戰(zhàn)。目前,人工智能廣泛應(yīng)用于安防領(lǐng)域,如人臉識別、車輛識別、目標(biāo)檢測等,但將傳統(tǒng) AI 技術(shù)應(yīng)用于安防行業(yè)有如下三點(diǎn)不足:場景適應(yīng)能力不強(qiáng),需求多樣性無法滿足,智慧化程度不高。他進(jìn)一步引出了即將重點(diǎn)描述的部分——跨媒體智能。
孫論強(qiáng)表示,跨媒體智能技術(shù)突破之后,可實(shí)現(xiàn)各種異構(gòu)數(shù)據(jù)的融合,充分發(fā)揮機(jī)器學(xué)習(xí)、數(shù)據(jù)分析與挖掘等的優(yōu)勢,比如多種媒體的融合應(yīng)用、多元異構(gòu)數(shù)據(jù)分析、多維智能主動預(yù)警。
他接下來談到,目前我們需要從視頻接力到精準(zhǔn)追蹤。「以往的視頻接力追蹤過程依靠經(jīng)驗(yàn),并且需要人工判斷,比較耗時費(fèi)力。而精準(zhǔn)追蹤對安全風(fēng)險的管控提出更高要求,需要實(shí)現(xiàn)目標(biāo)的精準(zhǔn)識別、定位、軌跡刻畫、屬性判斷和行為分析?!乖趯?shí)現(xiàn)的過程中,運(yùn)用了很多關(guān)鍵技術(shù),比如跨媒體時空分析,流式視頻大數(shù)據(jù),跨媒體多元數(shù)據(jù)融合,而針對每一關(guān)鍵技術(shù),他也提到了具體的模型、算法以及整體架構(gòu)。
談到應(yīng)用案例,他舉了青島的一個例子,當(dāng)市民的小孩走失報警之后,啟動前面提到的精準(zhǔn)追蹤技術(shù),通過目標(biāo)結(jié)構(gòu)化及特征提取、跨媒體多元數(shù)據(jù)融合等,能夠快速追捕到嫌疑人。
之后,孫論強(qiáng)展示了海信在跨媒體智能安防上的成果,他表示,海信除了電視和冰箱,還關(guān)注數(shù)字多媒體技術(shù)、智能信息系統(tǒng)等多個技術(shù),目前,他們的跨媒體安防技術(shù)的產(chǎn)品有狼王視頻安全接入網(wǎng)關(guān)、狼眼視頻結(jié)構(gòu)化系統(tǒng)、戰(zhàn)狼公安實(shí)戰(zhàn)平臺等。
在演講的最后,他表示,智能安防行業(yè)任重道遠(yuǎn),他們將堅(jiān)持技術(shù)創(chuàng)新,深入研究跨媒體智能安防應(yīng)用,引領(lǐng)行業(yè)發(fā)展,開創(chuàng)智能安防行業(yè)新時代。
第二位演講的嘉賓是思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱,他的演講主題是對話智能。
他表示,時代不斷變革,從 PC 互聯(lián)時代的文本搜索,到移動互聯(lián)網(wǎng)的語音、文本對話,再到現(xiàn)在的硬件物聯(lián)網(wǎng)時代的自然口語對話,數(shù)據(jù)出現(xiàn)了指數(shù)級的增長?!缚梢钥吹剑覀儚?PC 互聯(lián)邁入智能設(shè)備互聯(lián)的時代,例如亞馬遜推出 Echo,微軟推出 Cortana Button,谷歌推出 Google Home 等。我們目前需要對話智能系統(tǒng),能進(jìn)行語音識別、語義理解等?!?/p>
他談到目前的智能行業(yè)主要有三個層次,一是基礎(chǔ)支撐層,二是智能交互層,三是系統(tǒng)應(yīng)用層。他們正在做的就是第二層,其核心技術(shù)是感知、認(rèn)知和表達(dá)。
接著,俞凱提到智能行業(yè)的主要矛盾——技術(shù)提供商的定制效率和層出不窮的個性化需求之間的矛盾?!府?dāng)做產(chǎn)品時,顧客有各種個性化需求,比如是否支持熱更新、為什么不支持自定義。這時候,如何更快做得更專業(yè)化,這是一個挑戰(zhàn)?!?/p>
而為了迎戰(zhàn)這一挑戰(zhàn),他們推出思必馳大規(guī)模對話定制平臺。他表示,雖然語音合成很早就可行,但他們希望在對話層面做到能像手機(jī) apps 一樣定制化,實(shí)現(xiàn)開放的解決方案?!肝覀冊谧龅臅r候需要解決一系列技術(shù)問題,平臺不單是技術(shù)平臺,需要為產(chǎn)業(yè)提供真正有意義的應(yīng)用?!顾麄兲岢隽岘囅到y(tǒng)(做跨平臺的轉(zhuǎn)接,提供云+端技能的混合定制)、天機(jī)系統(tǒng)(提供可視化大數(shù)據(jù),實(shí)現(xiàn)用戶畫像和智能化推薦,給開發(fā)者詳盡、可按需定制的用戶任務(wù)結(jié)果數(shù)據(jù))、青囊系統(tǒng)、紫薇系統(tǒng)等。
他表示,當(dāng)不定制的時候,他們做成一個黑箱,而定制話的系統(tǒng)在結(jié)構(gòu)上是白箱,子結(jié)構(gòu)是黑箱。
之后,俞凱提到對話智能需要利用到的技術(shù):在語義層面快速的遷移學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)以及自適應(yīng)技術(shù)。而在演講最后,他對對話認(rèn)知智能技術(shù)路線提出自己的看法——從深度學(xué)習(xí)到遷移學(xué)習(xí)(解決數(shù)據(jù)量的問題),從數(shù)據(jù)驅(qū)動到知識嵌入(利用已有的知識),從開環(huán)學(xué)習(xí)到閉環(huán)學(xué)習(xí)(讓機(jī)器具備自學(xué)習(xí)的能力)。
接下來,華為 CBG 軟件工程部副總裁張寶峰帶來主題為 Enabling Next Generation Mobile experience with Huawei HiAI 的報告。
演講伊始,張寶峰表示,如何讓 AI 走下神壇,是我們要思考的問題。而其中重要的一點(diǎn)是開放。他表示,他們希望用開放性的 HiAI 平臺,讓更多人參與進(jìn)來,讓用戶更快享受 AI 帶來的變革。
為什么要開放呢,他解釋道,目前進(jìn)行 AI 研究存在許多問題,比如門檻高、效率低、能力碎、提升難,他們希望把芯、端、云側(cè)的計算力開放出來,比如將實(shí)踐中集成好的各種 AI 模型開放給開發(fā)者。
他說道,華為 HiAI 生態(tài)主要有四大優(yōu)勢助力開發(fā)者,一是 AI 能力加速,二是 AI 能力提供,三是完備的工具支持,四是成熟的服務(wù)生態(tài)。
他也舉了一些例子。他們與一家公司合作將照片進(jìn)行風(fēng)格轉(zhuǎn)換時,在端側(cè)執(zhí)行模型,可以將效率提升 300%。他補(bǔ)充道,很多人臉識別、物體識別,當(dāng)在端側(cè)計算時,不僅可以提升效率,還可以提升用戶體驗(yàn)。為了能讓應(yīng)用開發(fā)更快,他們做了很廣泛的調(diào)研。目前,他們有成熟的服務(wù)生態(tài),希望能給用戶便捷的體驗(yàn)。
最后,他表示,HiAI IDE 與 Android studio 完美集成,可以不改變開發(fā)者習(xí)慣,快速集成 AI 模型,快速開發(fā)出極具想象力和全新體驗(yàn)的 AI 應(yīng)用。他表示,通過這樣一個開放的生態(tài),會促進(jìn)整個產(chǎn)業(yè)鏈共贏。
五位 IEEE Fellow 帶來精彩主題報告
在張寶峰的演講結(jié)束之后,迎來五位 IEEE Fellow 的主題報告,首先出場的是南方科技大學(xué)計算機(jī)科學(xué)與工程系主任、IEEE Fellow、專家姚新,他的演講主題是 Evolving Intelligence(演化智能)。
他首先談到目前火熱的人工智能,他表示,教育部、科技部等各類文件都提到人工智能,目前人工智能可能應(yīng)用在自動駕駛車、對話系統(tǒng)等諸多領(lǐng)域,背后的技術(shù)有深度學(xué)習(xí)等。
他表示,目前,圖像識別的精準(zhǔn)度不斷提升,甚至超過了人類。而完成這一個階段的突破之后,有人認(rèn)為圖像識別不好玩,又開始提出類腦計算,要做一個真正的「電」腦,最早先從歐美開始,后來中國也提出「中國腦計劃」,一是認(rèn)識腦,二是模擬腦。他表示,先從人工智能 2.0 到工業(yè) 4.0,接下來從模擬腦 8.0 ,在未來,又可能會出現(xiàn)某某 16.0。
他表示,人工智能和腦啟發(fā)計算都不是新學(xué)科,需要發(fā)掘新的人工智能問題,找到人工智能缺少的部分。這引出演化智能。「所有的腦都是演化而來的,沒有任何的生物腦是上帝造出來的。如果我們真的想認(rèn)識腦和模擬腦,演化的過程不可忽略。如果我們真想理解一個系統(tǒng),不能忽略系統(tǒng)產(chǎn)生的過程。」
他接下來舉了自己之前做的研究,他們做了一個非常規(guī)范的神經(jīng)網(wǎng)絡(luò),然后考慮讓演化過程自動發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)。通過對比,可以看到演化的神經(jīng)網(wǎng)絡(luò)比人工做的更緊湊,演化的網(wǎng)絡(luò)層數(shù)很多,占用的資源少,效率也更高。
他表示,把演化的過程考慮進(jìn)去,會出現(xiàn)一些意想不到的東西。而他接下來也舉了教育學(xué)生以及玩游戲的例子來推廣到演化智能。他表示,演化計算的深入研究將對人工智能產(chǎn)生重大影響。
接下來出場的是香港中文大學(xué)深圳分校理工學(xué)院院長、IEEE Fellow、專家陳長汶,他的演講主題是《Scenario-Aware Intelligent Media Delivery in 5G Mobile Networks》。
陳長汶教授說道,前面大家講了很多人工智能相關(guān)的東西,他想講一點(diǎn)點(diǎn)比較特別的,即 5G 的智能化。他表示,自己也做過很多與人工智能相關(guān)的研究,人工智能雖然很紅火,但現(xiàn)在還是任重道遠(yuǎn)。接下來他回歸正題。
首先,他從從第一代移動通信講到到馬上實(shí)現(xiàn)的第五代。他表示,目前網(wǎng)絡(luò)越來越復(fù)雜,功能越來越豐富。從 1G 的模擬,到 2G 的數(shù)字可以傳遞短信,再到 3G 的媒體(3G 的時候,中國有了自己的標(biāo)準(zhǔn)),現(xiàn)在步入 4G 時代的多媒體,然后即將迎來 5G 時代。
他表示,5G 不僅僅是簡單的移動寬帶。為了滿足需求,需要有技術(shù)標(biāo)準(zhǔn),他舉了很多的技術(shù)上的數(shù)字,也提到一些技術(shù)比如 MIMO。在未來,將向超 5G 發(fā)展。之后,他表示,為了持續(xù)發(fā)展,3C 非常重要,即 communications,computing 和 cashing。
而將下一代 5G 應(yīng)用起來,可以有什么不同的場景呢?他列舉了三個場景:一是更寬的帶寬,二是超穩(wěn)定、短延時要求,三是物聯(lián)網(wǎng)。接下來他也提到 5G 的新挑戰(zhàn),比如如何在多場景下選擇最好的組合等。
然后是南京大學(xué)專家、 IEEE Fellow 王中風(fēng)帶來的演講,他的主題是 VLSI Optimizations for Deep Neural Networks。
王中風(fēng)教授對他們最近的工作做了簡單介紹,其中包括很多還沒發(fā)表的工作。在演講中,他主要講到了如下三個方面,一是模型的壓縮,二是硬件架構(gòu)上的設(shè)計,包括卷積網(wǎng)絡(luò)、遞歸網(wǎng)絡(luò)的架構(gòu)等,三是工程化方面的進(jìn)展。
他表示,深度學(xué)習(xí)在許多應(yīng)用上取得突破,比如醫(yī)療、語音、自動駕駛等,而核心部分是深度神經(jīng)網(wǎng)絡(luò),他們從硬件的角度來研究這些架構(gòu)和一些瓶頸。
他提到,目前的推理平臺有 CPU、GPU、ASIC、FPGA 等,現(xiàn)在算法的復(fù)雜度在提高,同時帶來功耗的增加,從能耗來講,CPU、GPUF、FPGA、ASIC 的效率逐漸增高。
他們在算法和硬件架構(gòu)上進(jìn)行了一系列優(yōu)化。
在模型壓縮方面,他提到量化問題,而對于深層神經(jīng)網(wǎng)絡(luò),他們設(shè)計了一個機(jī)制,來自動/動態(tài)簡化網(wǎng)絡(luò)?!府?dāng)物體很難識別時,我們使用復(fù)雜網(wǎng)絡(luò),而當(dāng)識別很簡單時,可以自動簡化網(wǎng)絡(luò),降低功耗?!顾硎?,這是他們最新的工作。
之后,他也提到了遞歸神經(jīng)網(wǎng)絡(luò)等。他表示,他們目前的研究工作與 FPGA 2017 best paper 進(jìn)行對比,他們達(dá)到了 32 倍的 size reduction,超過后者的 20 倍。之后,他講到針對卷積神經(jīng)網(wǎng)絡(luò)做的一些研究工作以及卷積網(wǎng)絡(luò)里可以優(yōu)化的部分,比如從 3D 到 1D 的優(yōu)化,存儲的優(yōu)化,帶寬的優(yōu)化等,他也對這些優(yōu)化具體展開了討論。
此外,他還提到 Energy-Quality Scalable 卷積神經(jīng)網(wǎng)絡(luò),其中需要解決的問題以及他們的解決方法,另外還有對深度學(xué)習(xí)保密性的研究。
在演講的最后他表示,他們基于 TSMCA 28nm 工藝的神經(jīng)網(wǎng)絡(luò)處理器芯片版圖將于 6 月份流片,此外,他們還做了一個基于深度學(xué)習(xí)的視覺處理驗(yàn)證平臺。
他總結(jié)到,對于深度學(xué)習(xí)來說,DNN 非常重要,而 VLSI 優(yōu)化將會帶來意想不到的效果。
之后迎來臺灣清華大學(xué)、IEEE Fellow 林嘉文的演講,他主要談到人臉識別方面的一些研究。
演講伊始,他談到這是自己第一次來深圳,他表示,人臉識別在 AI 領(lǐng)域是一個非常重要的應(yīng)用,但會遇到很多難題。
他提到人臉識別的以下挑戰(zhàn),一是要準(zhǔn)確找出人臉位置,但要是人臉很小,就會很難偵測。雖然現(xiàn)在有辦法提高分辨率,但很多時候,分辨率提高后無法提高識別效果。
此外,在很多場景下,比如光線變化,人的表情、姿勢發(fā)生變化,有人戴眼鏡,有人戴口罩,這也會影響識別率。
他舉了幾個例子,比如要偵測一張籃球場照片里的很多微小人臉,還有偵測分辨率非常低的人臉,需要怎么做呢?雖然利用 GAN 可以生成人臉,但也會誤產(chǎn)生人臉。如何既增加人臉分辨率又提升人臉檢測準(zhǔn)確度。另外,在做超分辨率時,如何既能完成高質(zhì)量的重建,又能保證身份特征。
他提出如下方法,他們使用 Siamese 網(wǎng)絡(luò),將這個網(wǎng)絡(luò)跟 GAN 結(jié)合,得到 SiGAN,在實(shí)驗(yàn)中,他們用 LFW 等一些數(shù)據(jù)庫做測試,發(fā)現(xiàn) SiGAN 結(jié)果的準(zhǔn)確度比傳統(tǒng)網(wǎng)絡(luò)還有 GeGAN、DeGAN 等都要高,他們還對執(zhí)行時間等進(jìn)行了對比,也發(fā)現(xiàn)效果非常好。
最后,他提到他們基于 GAN 做 Face Augmentation 和 Face Normalization,對人臉進(jìn)行處理之后也可以得到較高的識別率。
最后一位上臺演講的是 New Jersey Institute of Technology、IEEE Fellow、專家周孟初,他的演講主題為 Dendritic neuron model-based learning algorithms for classification, approximation and prediction。
在演講中,他由人類的神經(jīng)細(xì)胞講到人工神經(jīng)網(wǎng)絡(luò)。他表示,神經(jīng)網(wǎng)絡(luò)是用非常簡單的網(wǎng)絡(luò)表示非常復(fù)雜的模型。基于之前的兩個模型,他們提出 Dendritic Neuron Model,他表示,他們在其中引入了很多乘法,模型有很強(qiáng)的處理非線性問題的能力。
之后,他詳細(xì)講解了該模型的架構(gòu),他表示,模型有四個 layer,有 4 種 connection,他也談到了這一模型的主要特征,他形容,DNM 相當(dāng)于一棵樹,樹上有很多分支,分支上有很多葉子。
而接下來,他也提到了模型的實(shí)際應(yīng)用,比如解決乳腺癌問題,肝臟疾病問題、金融時間序列預(yù)測、旅客到達(dá)預(yù)測等等,他們的模型在這些問題上都有不錯的效果。
他也提到了目前算法的一些問題,他表示,傳統(tǒng)經(jīng)常使用的 BP 算法,會經(jīng)常落入 local minima 問題,得到局部最優(yōu)解,而不是全局最優(yōu)解,此外還有 saddle points 問題。他提到 BBO、ES、PBIL、GA、ACO、PSO 這六種算法,他們將這六種算法進(jìn)行了比較,他表示,最終 BBO+DNM 取得的結(jié)果相當(dāng)不錯。
至此,智能技術(shù)與標(biāo)準(zhǔn)及 IEEE Fellow 分論壇圓滿結(jié)束,而在次日將迎來 3 場同樣精彩的論壇,敬請期待雷鋒網(wǎng)的現(xiàn)場報導(dǎo)。
相關(guān)文章:
AITech 次日,腦科學(xué)、智能外科、多模態(tài)智能等多個話題引熱議
七場高端報告,帶你大視角看人工智能發(fā)展 | AITech
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。