0
雷鋒網(wǎng)AI 科技評(píng)論按:2018 年 12 月 17 日,由鵬城實(shí)驗(yàn)室、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟共同舉辦的「新一代人工智能院士高峰論壇」在深圳隆重開(kāi)幕。本次論壇將持續(xù)兩天,由 17 日的主論壇和 18 日的醫(yī)療專題論壇組成。論壇以「『頭雁』穿云,云腦啟智」為主題,邀請(qǐng)了多位院士、國(guó)內(nèi)頂級(jí)科技企業(yè)技術(shù)負(fù)責(zé)人參加論壇做報(bào)告,論壇的重頭戲是院士 panel,多位院士將針對(duì)人工智能現(xiàn)狀與發(fā)展的一些疑難問(wèn)題展開(kāi)討論。此次論壇匯聚了國(guó)內(nèi)人工智能領(lǐng)域頂尖專家,共同探討行業(yè)變革與技術(shù)創(chuàng)新、探尋 AI 邊界,是 2018 年人工智能領(lǐng)域最值得關(guān)注的盛會(huì)之一。
360 集團(tuán)副總裁、360 人工智能研究院院長(zhǎng)顏水成博士是 17 日下午主論壇第三位出場(chǎng)的嘉賓,他的演講題目是《視覺(jué)智能:從攻堅(jiān)到閉環(huán)》。
360 集團(tuán)副總裁、360 人工智能研究院院長(zhǎng)顏水成
他說(shuō)道,360 公司如今的研發(fā)不再局限在網(wǎng)絡(luò)空間,進(jìn)一步拓展到了物理空間,而人工智能當(dāng)前主要聚焦打造四大人工智能引擎:運(yùn)動(dòng)引擎、交互引擎、視覺(jué)引擎以及決策引擎。緊接著,他也為大家介紹了360-NUS聯(lián)合實(shí)驗(yàn)室在視覺(jué)智能領(lǐng)域的最新研究成果——Global Reasoning Unit,這個(gè)模塊可插入任意網(wǎng)絡(luò),在淺層網(wǎng)絡(luò)就能使跨區(qū)域進(jìn)行信息交換成為可能。
同時(shí),顏水成博士也分享個(gè)人在業(yè)界做研究的心得,他強(qiáng)調(diào),學(xué)術(shù)界的研究和業(yè)界的研究有很大的區(qū)別,業(yè)界的研發(fā)必須回歸商業(yè)本質(zhì),尤其要放在價(jià)值閉環(huán)與數(shù)據(jù)閉環(huán)的維度上進(jìn)行思考。價(jià)值閉環(huán)方面,技術(shù)需要對(duì)閉環(huán)中的產(chǎn)品、客戶 、企業(yè)和社會(huì)產(chǎn)生正向推動(dòng),不然就有失敗的可能。數(shù)據(jù)閉環(huán)方面,由于不存在完美的算法,因此我們只能依賴特定場(chǎng)景的數(shù)據(jù)來(lái)不斷優(yōu)化算法,進(jìn)而優(yōu)化產(chǎn)品模型。
最后,顏水成博士用一組有趣的比喻結(jié)束了報(bào)告:在學(xué)術(shù)界做視覺(jué)智能研究就像戀愛(ài)中的男女,而在工業(yè)界做研發(fā)則更像結(jié)婚后的男女。
以下為他的演講內(nèi)容,雷鋒網(wǎng) AI 科技評(píng)論做了不改變?cè)獾木庉嬚怼?/strong>
非常高興今天有機(jī)會(huì)在這里做一次很特別的分享。我的背景比較特殊,我在學(xué)術(shù)界待了大概 8 年,進(jìn)入工業(yè)界也已經(jīng)有 3 年了,今天的分享包括兩方面的內(nèi)容:一方面我想跟大家分享一個(gè)比較有價(jià)值的深度學(xué)習(xí)模型結(jié)構(gòu);另一方面我想根據(jù)我在工業(yè)界的 3 年經(jīng)驗(yàn),談?wù)剬?duì)人工智能研發(fā),特別是智能視覺(jué)研發(fā)的兩點(diǎn)感悟。
360的核心是安全,現(xiàn)在我們把安全的概念從網(wǎng)絡(luò)空間拓展到了物理空間,在關(guān)注網(wǎng)絡(luò)空間問(wèn)題的同時(shí),通過(guò) AI 能力,把安全的能力從網(wǎng)絡(luò)空間拓展到物理空間。
今年 5 月份,360 發(fā)布了 360 安全大腦。和視覺(jué)、語(yǔ)言不一樣,安全問(wèn)題的數(shù)據(jù)標(biāo)注需要頂級(jí)專家,人的作用是至關(guān)重要的,所以,安全大腦是一個(gè)人機(jī)協(xié)同的系統(tǒng)。2018 年上半年,360 的安全大腦對(duì)惡意程序攔截的次數(shù),已達(dá)到了 400 億次;對(duì)于釣魚(yú)攻擊,在半年時(shí)間里的攔截次數(shù)也多達(dá) 200 多億次;此外對(duì)安卓手機(jī)中垃圾短信和騷擾電話的攔截次數(shù)也非常高,比如半年時(shí)間里對(duì)騷擾電話的攔截次數(shù)已達(dá)到 190 億次。我們可以看到它在這些方面的應(yīng)用非常典型,而用戶的反饋也可以進(jìn)一步增強(qiáng)安全大腦的能力:用戶用得越多,安全大腦也就變得越智能。
我在360主要帶領(lǐng)建立360 人工智能平臺(tái),為公司的互聯(lián)網(wǎng)業(yè)務(wù)和IoT 業(yè)務(wù)全面賦能??偟膩?lái)說(shuō),我們主要打造了四個(gè)引擎:
第一個(gè)是運(yùn)動(dòng)引擎,對(duì)于 IoT 來(lái)說(shuō),這是第一個(gè)非常重要的能力,能讓智能硬件在地面上進(jìn)行智能運(yùn)動(dòng);
第二個(gè)是交互引擎,這是國(guó)內(nèi)很多公司都比較關(guān)注的點(diǎn)。以前,我們對(duì)遠(yuǎn)場(chǎng)技術(shù)方面的關(guān)注并不是太多,技術(shù)主要以服務(wù)于 360 兒童手表為主。交互引擎除了為360手表提供支撐,也用于孵化新的語(yǔ)音類(lèi)產(chǎn)品。
第三個(gè)是視覺(jué)引擎,我原來(lái)的研究方向以計(jì)算機(jī)視覺(jué)為主,這也算是我的老本行。當(dāng)前,360 的視覺(jué)引擎主要分成兩塊:一塊是支持 360 的家庭安防生態(tài),例如 360 最近發(fā)布的一款門(mén)鈴,它是實(shí)實(shí)在在地在滿足有中國(guó)特色的需求,比如當(dāng)有外賣(mài)、快遞被送到家的時(shí)候,即使不在家,也可以通過(guò)語(yǔ)音的方式讓外賣(mài)員、快遞員將貨物放在門(mén)口,與此同時(shí),這個(gè)門(mén)鈴還可以實(shí)時(shí)監(jiān)控這些貨物;另一塊是對(duì)網(wǎng)上圖文、短視頻信息流的內(nèi)容進(jìn)行安全審核和內(nèi)容結(jié)構(gòu)化分析。
第四個(gè)是決策引擎,這是搜索引擎公司特別關(guān)注的一個(gè)方面。決策引擎主要根據(jù)用戶的歷史行為,來(lái)建立相關(guān)的決策模型,去預(yù)測(cè)將來(lái)用戶可能會(huì)對(duì)什么東西感興趣以及會(huì)有一些怎樣的行為。360 對(duì)其主要有三個(gè)方面的應(yīng)用:一是金融領(lǐng)域的控制和決策,上周五 360 金融已在美國(guó)上市,對(duì)于其風(fēng)控的部分,360 提供了很多的支持和幫助;二是廣告,在過(guò)去這段時(shí)間,360 的廣告業(yè)務(wù)因?yàn)槭褂脹Q策引擎的相關(guān)技術(shù),在技術(shù)的性能方面有了多次明顯提升;三是推薦,通過(guò)深度學(xué)習(xí)的方法,推薦的效能得到有效提升。
下面我分享一下個(gè)人在業(yè)界做研究的心得。
在學(xué)術(shù)界和工業(yè)界進(jìn)行視覺(jué)智能研究,差別是非常大的。在學(xué)術(shù)界研究視覺(jué)智能,更像是一個(gè)個(gè)人攻堅(jiān)的擂臺(tái)賽,大家可能是針對(duì)某個(gè)具體問(wèn)題、具體數(shù)據(jù),去不停地設(shè)計(jì)新的算法,從而提升其性能。但是在工業(yè)界,則更像是一個(gè)綜合的閉環(huán)的大戰(zhàn)略,研究已不僅僅是某個(gè)小團(tuán)隊(duì)的事情,類(lèi)似一個(gè)大戰(zhàn)役,你可能需要后勤、醫(yī)院,需要海、陸、空軍進(jìn)行協(xié)同作戰(zhàn),才能保證這場(chǎng)戰(zhàn)爭(zhēng)的勝利。所以我覺(jué)得在工業(yè)界做視覺(jué)智能研發(fā)很重要的一點(diǎn),就是要回歸商業(yè)的本質(zhì),要把視覺(jué)智能研究放在價(jià)值閉環(huán)和數(shù)據(jù)閉環(huán)上進(jìn)行思考和推進(jìn)。
針對(duì)學(xué)術(shù)界,今天我跟大家分享 360-NUS聯(lián)合實(shí)驗(yàn)室近期在視覺(jué)智能領(lǐng)域的一個(gè)最新研究成果——Global Reasoning Unit。我們發(fā)現(xiàn)有不少人在思考這個(gè)問(wèn)題:當(dāng)我們用深度學(xué)習(xí)做推理的時(shí)候,都是在用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行推理,然而卷積神經(jīng)網(wǎng)絡(luò)在淺層網(wǎng)絡(luò)無(wú)法感知遠(yuǎn)處的目標(biāo)。那有沒(méi)有一種方式可以在淺層網(wǎng)絡(luò)就能實(shí)現(xiàn)很好的感知遠(yuǎn)處目標(biāo)呢?
由于我的團(tuán)隊(duì)是 1×1 卷積的推動(dòng)者,因而在想盡量用 1×1 的卷積方法來(lái)實(shí)現(xiàn)這件事情。我們有一個(gè)想法:是否可能在任意的網(wǎng)絡(luò)插入一個(gè)模塊進(jìn)行學(xué)習(xí)。為此,我的學(xué)生Yunpeng CHEN提出了一個(gè)思想,叫做 Global Reasoning Unit,將 5 個(gè) 1×1 的卷積以模塊的形式插入任意網(wǎng)絡(luò)做學(xué)習(xí),在淺層網(wǎng)絡(luò)就能對(duì)遠(yuǎn)處的目標(biāo)進(jìn)行感知,使跨區(qū)域進(jìn)行信息交換成為可能。無(wú)論是在分類(lèi)任務(wù),還是在其他的檢測(cè)、分割任務(wù)中,這種方法都能有效提升現(xiàn)有網(wǎng)絡(luò)的性能。我覺(jué)得無(wú)論是在手機(jī)端還是智能硬件設(shè)備上,Global Reasoning 都將會(huì)有不錯(cuò)的價(jià)值,所以今天在這里特別跟大家分享這個(gè)方向。
接下來(lái)我將針對(duì)工業(yè)界,跟大家分享一個(gè)研發(fā)需要注意的事項(xiàng):在工業(yè)界做研發(fā)一定要回歸商業(yè)本質(zhì),必須將我們的研發(fā)放在價(jià)值閉環(huán)和數(shù)據(jù)閉環(huán)里面,去不斷地思考和推進(jìn)研發(fā)進(jìn)度。
什么叫價(jià)值閉環(huán)?我估計(jì)現(xiàn)場(chǎng)很多朋友讀過(guò)一本書(shū),叫《創(chuàng)新者的窘境》,里面思考的問(wèn)題是:為什么一些好的技術(shù)在大公司里面并不能被很好地利用起來(lái)?其中分析到的一個(gè)主要原因是,這些技術(shù)對(duì)于技術(shù)創(chuàng)新者來(lái)說(shuō),可能是一件非常嗨的事情,但是對(duì)于產(chǎn)品方、最終的用戶以及生態(tài)中完成銷(xiāo)售環(huán)節(jié)的公司來(lái)說(shuō),可能并沒(méi)有帶來(lái)價(jià)值的提升。也就是說(shuō),當(dāng)技術(shù)沒(méi)有給所在閉環(huán)中的其他維度帶來(lái)真正的價(jià)值,它的落地會(huì)非常困難。因此,在工業(yè)界做研發(fā),我們的核心任務(wù)已不僅是「炫技」,還需要對(duì)所在閉環(huán)中的所有維度帶來(lái)正向價(jià)值,從而保證技術(shù)的落地和最終應(yīng)用。
《創(chuàng)新者的窘境》這本書(shū)中提到了四個(gè)維度:技術(shù)、產(chǎn)品、客戶和企業(yè)。不過(guò)我認(rèn)為做視覺(jué)智能方面的研究,還有一個(gè)非常重要的維度,叫做社會(huì)價(jià)值觀。當(dāng)技術(shù)落地到一款產(chǎn)品時(shí),如果它本身的社會(huì)價(jià)值觀不正的話,就不能產(chǎn)生正向的推動(dòng)作用,這款產(chǎn)品遲早會(huì)失敗。因此,我將價(jià)值閉環(huán)分成了五個(gè)維度,其中,不同維度之間相互依存,并通過(guò)彼此的驅(qū)動(dòng)來(lái)提升各自的價(jià)值。比如說(shuō)技術(shù)和產(chǎn)品:新的技術(shù)孵化了新的產(chǎn)品,而產(chǎn)品收集了更多場(chǎng)景下的有效數(shù)據(jù),又反過(guò)來(lái)推動(dòng)技術(shù)的迭代;產(chǎn)品和企業(yè)則是相互促進(jìn)的,產(chǎn)品質(zhì)量和銷(xiāo)量的提升,可以提升企業(yè)的品牌和利潤(rùn),而企業(yè)品牌又反過(guò)來(lái)會(huì)帶動(dòng)產(chǎn)品的銷(xiāo)量,同時(shí)企業(yè)賺取利潤(rùn)后,會(huì)加大技術(shù)投入,從而提升產(chǎn)品的質(zhì)量。而企業(yè)和社會(huì)價(jià)值觀則是大家更需要注意的一點(diǎn):企業(yè)文化造就了社會(huì)價(jià)值觀,員工的價(jià)值觀也會(huì)影響企業(yè)的效率,其中最重要的一點(diǎn)是,企業(yè)永遠(yuǎn)不能觸及倫理道德的底線。
另外,在工業(yè)界做視覺(jué)智能研究,尤其是做視覺(jué)智能相關(guān)產(chǎn)品的時(shí)候,數(shù)據(jù)閉環(huán)也非常關(guān)鍵。研究者可能更多地關(guān)注算法模型,不過(guò)算法模型和具體產(chǎn)品的后臺(tái)與用戶的交互就形成了一個(gè)數(shù)據(jù)閉環(huán),它是一個(gè)發(fā)現(xiàn)問(wèn)題和迭代產(chǎn)品的過(guò)程。
為什么要將研發(fā)放在一個(gè)數(shù)據(jù)閉環(huán)中呢?無(wú)論是做計(jì)算機(jī)視覺(jué)還是其他方向的研究,有一點(diǎn)是非常明確的——就是永遠(yuǎn)沒(méi)有完美的算法,在這種情況下,數(shù)據(jù)就變得非常關(guān)鍵。我常思考并與一些人進(jìn)行討論的問(wèn)題是:為什么中國(guó)會(huì)出現(xiàn)這么多做人臉識(shí)別的公司,并且這些公司都還生存得非常不錯(cuò)?其中的一個(gè)核心原因是每家公司都具有特定場(chǎng)景下(如銀行、交通監(jiān)控、公共監(jiān)控等)的數(shù)據(jù)優(yōu)勢(shì),而正是這些數(shù)據(jù)能夠讓它們?nèi)ゲ粩鄡?yōu)化模型,實(shí)現(xiàn)特定場(chǎng)景下更佳的表現(xiàn)。用戶的反饋才能讓我們?cè)谘芯恐姓嬲l(fā)掘他們真正的痛點(diǎn)和需求,因此數(shù)據(jù)閉環(huán)對(duì)于工業(yè)界的視覺(jué)智能研究至關(guān)重要。
我自己也感覺(jué)到,當(dāng)我們將研發(fā)放入一個(gè)閉環(huán)的環(huán)境中,其所涉及的每個(gè)環(huán)節(jié)只有在穩(wěn)定、可靠的情況下,才能讓算法和研發(fā)人員去很好地推動(dòng)技術(shù)向前迭代。再以 360 的門(mén)鈴為例,一旦服務(wù)端的產(chǎn)品聯(lián)網(wǎng)延遲問(wèn)題嚴(yán)重,用戶很長(zhǎng)時(shí)間才能收到家門(mén)口的監(jiān)控信息,就無(wú)法獲得良好的體驗(yàn),另外如果 APP 的設(shè)計(jì)不夠好,云端的數(shù)據(jù)分析結(jié)果就無(wú)法很好地通過(guò) APP 讓用戶直接感受到這款智能設(shè)備所帶來(lái)的價(jià)值,進(jìn)而也讓用戶難以產(chǎn)生有效的反饋,這樣的話,閉環(huán)的迭代也會(huì)變得異常困難。
無(wú)論在學(xué)術(shù)界還是在工業(yè)界,大家做視覺(jué)智能研究都還是挺辛苦的,經(jīng)常面臨加班和熬夜,所以今天我想用一個(gè)比較輕松的方式來(lái)跟大家總結(jié)一下,在學(xué)術(shù)界和工業(yè)界做視覺(jué)智能研發(fā)的不同的特點(diǎn):
在學(xué)術(shù)界做視覺(jué)智能研究更像戀愛(ài)中的男女,每一點(diǎn)進(jìn)步都讓你們激動(dòng)無(wú)比,同時(shí)還希望不斷地有新的進(jìn)步,達(dá)到新的高度??吹降娜菍?duì)方的優(yōu)點(diǎn),你們總是不停地憧憬,因?yàn)闀簳r(shí)沒(méi)人催你生孩子(產(chǎn)品)。你們也會(huì)憧憬生一個(gè)小孩(產(chǎn)品)會(huì)有多么美好,認(rèn)為這個(gè)孩子一定會(huì)是世界上最聰明、最乖巧的,因?yàn)榉凑挥谜娴陌押⒆由鰜?lái)。
而在工業(yè)界做研發(fā)更像結(jié)婚后的男女,發(fā)現(xiàn)生娃(產(chǎn)品)成了你們最首要的任務(wù)。父母(公司老板)天天催著你生娃(產(chǎn)品),你們以為孩子生出來(lái)以后會(huì)很乖巧,結(jié)果生出來(lái)以后才發(fā)現(xiàn)一堆的問(wèn)題、一堆的毛病,社會(huì)(用戶)也不喜歡他/她,于是你不停地根據(jù)經(jīng)驗(yàn)和用戶反饋進(jìn)行調(diào)教。最后孩子強(qiáng)大了,你頭發(fā)白了,脊椎也壞了,但看著孩子(產(chǎn)品)還是一臉的滿足幸福。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。