0
本文作者: 高婓 | 2016-10-06 23:33 | 專題:CCF-GAIR | 全球人工智能與機器人峰會 |
編者按:近兩年人工智能技術(shù)的研究與應(yīng)用驟然增速,產(chǎn)業(yè)界,無論是身經(jīng)百戰(zhàn)的科技巨頭,抑或是默默無聞的中小企業(yè),都想要抓住這一難得的機遇,在業(yè)內(nèi)嶄露頭角。但是,如何將人工智能與自身原始的商業(yè)模式相結(jié)合,實現(xiàn)產(chǎn)業(yè)創(chuàng)新,很多企業(yè)都還在“摸著石頭過河”,難免遇到迷茫期。
在2016 年GAIR大會上,楊強教授深入淺出地為大家分享了自己多年來的智慧與經(jīng)驗總結(jié)——人工智能要取得成功應(yīng)當(dāng)具備的五個必要條件,這五個條件將成為推動人工智能長足發(fā)展的動力源泉。
楊強,香港科技大學(xué)計算機與工程系教授, IEEE Fellow,IAPR Fellow, AAAS Fellow 和ACM杰出科學(xué)家。,第四范式首席科學(xué)家、機器學(xué)習(xí)領(lǐng)域國際學(xué)術(shù)帶頭人,主要研究領(lǐng)域為機器學(xué)習(xí)、數(shù)據(jù)挖掘和自動規(guī)劃。到目前為止,楊教授在學(xué)術(shù)研究中碩果累累,在人工智能和數(shù)據(jù)挖掘方面,已發(fā)表了超過了200篇的學(xué)術(shù)文章,還組織籌辦了多個人工智能和數(shù)據(jù)挖掘的國際會議。
當(dāng)下人工智能在圖像識別、語音識別和大規(guī)模的產(chǎn)品推薦方面取得了巨大的成功,那么人工智能的成功應(yīng)用究竟取決于哪些條件?
為什么只在我們這個時代迎來了人工智能發(fā)展的高峰期?對于這兩個備受關(guān)注的問題,楊教授從人工智能的科學(xué)與應(yīng)用兩個方面著手,娓娓道來。
人工智能技術(shù)的發(fā)展大體可以分為兩個方面:人工智能的科學(xué)與人工智能的應(yīng)用。
從科學(xué)層面談及人工智能要回歸到該研究領(lǐng)域最根本的問題:機器能夠思維嗎?這個問題最早起源于人工智能之父圖靈,之后經(jīng)過60多年的努力,計算機科學(xué)家及各行各業(yè)對人工智能感興趣的人士都競相研發(fā)計算能力更強的計算機,匯聚更多的數(shù)據(jù),提出更高級的算法,致力于回答這個最基本、也是最重要的問題。
談到應(yīng)用層面,除去人工智能已經(jīng)為我們的生活帶來的便利,我們更關(guān)心它對人類未來生活將產(chǎn)生什么樣的影響。要將人工智能技術(shù)成功地應(yīng)用于商業(yè)領(lǐng)域,既要站在科學(xué)前沿,也要具備一定的商業(yè)頭腦,兩者兼?zhèn)洳拍茉谏虡I(yè)浪潮中立于不敗之地。
會上,楊教授言簡意賅為我們分享了決定人工智能成功的五個必要條件:
清晰的目標(biāo)(商業(yè)模式)
高質(zhì)量的大數(shù)據(jù) (持續(xù)反饋)
清晰的問題定義和領(lǐng)域邊界
懂人工智能的跨界人才(擅長應(yīng)用和算法)
計算能力
首先,要有 “清晰的目標(biāo)”,即清晰的商業(yè)模式,這就好比游戲中明確規(guī)定何為贏,何為輸,延伸到人工智能在商業(yè)領(lǐng)域的應(yīng)用,即要確定明確的運行模式和運行目的。
其次,高質(zhì)量的大數(shù)據(jù)資源是人工智能成功的核心條件。楊教授特別強調(diào),高質(zhì)量的數(shù)據(jù)要求收集到的數(shù)據(jù)能夠具備持續(xù)性、反饋性,且反饋的方式與內(nèi)容要與具體的算法相匹配。有人會覺得,在某個領(lǐng)域擁有了幾千萬個數(shù)據(jù)樣本便具備從事人工智能的條件了,楊教授認(rèn)為,這種觀點是站不住腳的,原因如下:首先,已收集的數(shù)據(jù)樣本可能無法與某個特定的算法相匹配;其次,所用到的算法可能不具備可持續(xù)性;最后,得到的反饋方式與內(nèi)容不一定與期望相符。
第三,清晰的問題定義和領(lǐng)域邊界。要求在應(yīng)用人工智能技術(shù)時要對所遇到的問題有清晰的理解與定義,就像下棋一樣,在有限定的領(lǐng)域里完成特定的行為操作。
第四,人工智能成功的核心競爭力在于懂人工智能的跨界人才(擅長應(yīng)用和算法),即我們需要一個既精通人工智能,又在商界游刃有余的人才。當(dāng)然,很多人會質(zhì)疑:我們到哪里去找這樣的人才?楊教授號召我們做生活中的有心人,善于關(guān)注身邊會學(xué)習(xí)的人,著重培養(yǎng)其跨領(lǐng)域才能,這樣的人才將具備把兩個看似不同的垂直領(lǐng)域聯(lián)系在一起的能力,在未來能夠做出突出的成就。
最后,楊教授提出,強大的計算能力是人工智能技術(shù)在各領(lǐng)域成功應(yīng)用的硬實力。在計算能力方面,我們有云計算、并行計算、GPU,這都為人工智能的發(fā)展奠定了堅實的基礎(chǔ)。
此外,楊教授提到,人工智能已經(jīng)在機器學(xué)習(xí)領(lǐng)域已經(jīng)取得了突出的成就,特別是在深度學(xué)習(xí)方面,此外,還特別強調(diào)了強化學(xué)習(xí)與遷移學(xué)習(xí)的應(yīng)用前景。
楊教授講到,強化學(xué)習(xí)的優(yōu)點在于它不僅能夠?qū)W習(xí)人的行為,而且能夠更好地使用延遲反饋功能。以Google DeepMind采用的強化學(xué)習(xí)流程為例,我們可以將這個流程圖理解為一個計算機內(nèi)部的表達形式,一個矢量,這個矢量與我們得到的反饋信息相結(jié)合,將有助于改進我們采用的策略。流程圖中的策略,簡單來講,就是我們平常的行為規(guī)劃,工作規(guī)劃,就好比游戲中的一個動作就對應(yīng)一個策略,這個策略再返回來,產(chǎn)生一個新的界面,如此我們便能夠進行持續(xù)學(xué)習(xí)。在這個循環(huán)過程中,我們只有到最后才能夠獲得反饋,稱之為延遲的反饋。就好比我們投資一只股票,過了很長時間才知道收益如何。
但是,這個循環(huán)暴露出強化學(xué)習(xí)的一個局限性:人們永遠無法準(zhǔn)確定義這個策略里的空間,我們稱之為“狀態(tài)空間”,即強化學(xué)習(xí)的結(jié)果具有不可預(yù)測性。說到這里,楊教授以Google DeepMind的第二個目標(biāo)——端到端的深度學(xué)習(xí)為例。當(dāng)該有的狀態(tài)預(yù)先在學(xué)習(xí)器內(nèi)表達好后,就形成了一種從輸入端到輸出端的端到端的深度學(xué)習(xí)模型,經(jīng)過幾百次的訓(xùn)練學(xué)習(xí)后,機器將能夠?qū)W會如何更好地玩一個游戲。
以下各個圖對應(yīng)不同游戲的學(xué)習(xí)效果。圖中橫軸表示隨著游戲輪數(shù)越來越多,機器的自學(xué)習(xí)效果不斷提升,直至達到上限。
遷移學(xué)習(xí)是深度學(xué)習(xí)與強化學(xué)習(xí)的結(jié)合體,能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實現(xiàn)個性化遷移,這樣一來能夠避免數(shù)據(jù)寡頭的出現(xiàn)。
楊教授提出一點:
大數(shù)據(jù)設(shè)計出來的模型用于小數(shù)據(jù)上,它的副產(chǎn)品就是個性化。這就是遷移學(xué)習(xí)的目的。
運用遷移學(xué)習(xí)把在一個數(shù)據(jù)領(lǐng)域已經(jīng)建立的非常好的模型,應(yīng)用到另一個領(lǐng)域,這樣既節(jié)省了資源,又能夠節(jié)省時間,效果又好。
楊教授談到,我們?nèi)撕茏匀痪途邆溥@種舉一反三的遷移能力,比如我們學(xué)會騎自行車后,學(xué)騎摩托車就很簡單了;會打羽毛球,再學(xué)打網(wǎng)球也就沒那么難了。
在演講中,楊教授總結(jié)了遷移學(xué)習(xí)的四種實現(xiàn)方式,每一種方式都很直觀。
第一種為樣本遷移,就是在數(shù)據(jù)集(源領(lǐng)域)中找到與目標(biāo)領(lǐng)域相似的數(shù)據(jù),把這個數(shù)據(jù)放大多倍,與目標(biāo)領(lǐng)域的數(shù)據(jù)進行匹配。樣本遷移的特點是:1)需要對不同例子加權(quán);2)需要用數(shù)據(jù)進行訓(xùn)練。
第二種為特征遷移,就是通過觀察源領(lǐng)域圖像與目標(biāo)域圖像之間的共同特征,然后利用觀察所得的共同特征在不同層級的特征間進行自動遷移。
第三種為模型遷移,其原理時利用上千萬的圖象訓(xùn)練一個圖象識別的系統(tǒng),當(dāng)我們遇到一個新的圖象領(lǐng)域,就不用再去找?guī)浊f個圖象來訓(xùn)練了,可以原來的圖像識別系統(tǒng)遷移到新的領(lǐng)域,所以在新的領(lǐng)域只用幾萬張圖片同樣能夠獲取相同的效果。模型遷移的一個好處是我們可以區(qū)分,就是可以和深度學(xué)習(xí)結(jié)合起來,我們可以區(qū)分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些。
第四種為關(guān)系遷移,比如社會網(wǎng)絡(luò),社交網(wǎng)絡(luò)之間的遷移。
遷移學(xué)習(xí)的最終目的就是實現(xiàn)AI for Everyone。比如我們利用一個由訓(xùn)練三萬個的對話模式獲得的大對話模型可以遷移到個人的小型對話中,這種基于強化學(xué)習(xí)所獲取的個性化效果非常具有實用性,因為我們不用繁瑣地問用戶很多同樣的問題。此外,楊教授在會上曾提到一個愿景——利用遷移學(xué)習(xí),即使是自身沒有條件獲得大量訓(xùn)練數(shù)據(jù)的小公司也可以按照自己的需要應(yīng)用大公司訓(xùn)練出來的模型,從而普及AI的應(yīng)用,從而克服數(shù)據(jù)“寡頭”現(xiàn)象。不論怎樣,遷移學(xué)習(xí)是一種極具潛力的解決方案,將在未來大顯身手。
此外,楊教授用一個人工智能技術(shù)應(yīng)用的熱點——對話系統(tǒng),清晰地闡明上述五個條件對人工智能技術(shù)發(fā)展所產(chǎn)生的推動性作用。
一般來講,市場上現(xiàn)有的對話系統(tǒng)可以分為兩類:閑聊類與功能類。
在上圖中,我們可以看到:60年代的Eliza與微軟的小冰屬于閑聊類對話系統(tǒng),百度的小度與微軟的Cortana介乎閑聊類與功能類之間,F(xiàn)acebook的M與HKUST最新的Magic Mirror系統(tǒng)屬于功能類對話系統(tǒng)。楊教授講到,我們大家應(yīng)該都有體驗,微軟小冰很幽默,但是也只能止于閑聊;功能類對話系統(tǒng)則給我們的生活帶來了很多便利,例如,我們打電話到酒店預(yù)定房間,在銀行辦理個人業(yè)務(wù),不過,在一定程度上,目前的功能類對話系統(tǒng)依然存在一些不太便利的地方,例如,在使用過程中,我們要根據(jù)系統(tǒng)提醒依次按服務(wù)鍵,這可能導(dǎo)致用戶體驗下降。
從技術(shù)層面上進行分析,楊教授提到對話系統(tǒng)可以大致分為兩種:基于原則的系統(tǒng)與基于學(xué)習(xí)的系統(tǒng)。最早的對話系統(tǒng)是基于原則的,有很多專家來制定這些規(guī)則,其優(yōu)點在于準(zhǔn)確性高,但是卻難以擴展,與數(shù)據(jù)無關(guān),對數(shù)據(jù)的靈敏度不高。此外,基于原則的對話系統(tǒng)的由于無法擴展,通常情況下不能應(yīng)對不同的意外事件,所以現(xiàn)在大家關(guān)注較多的是基于機器學(xué)習(xí)算法研發(fā)的對話系統(tǒng)。
楊教授透露說,香港科技大學(xué)實驗室正在研究如何運用新技術(shù)來改進現(xiàn)有的對話系統(tǒng)。在大會上,楊教授向我們展示了一個三明治式的三層結(jié)構(gòu)算法模型:
第一層是我們熟知的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)——遞歸深度神經(jīng)網(wǎng)絡(luò)(RNN)
第二層是一個策略學(xué)習(xí)器——強化學(xué)習(xí)(RL)
第三層是遷移學(xué)習(xí)(TL)
在演講中,楊教授特別強調(diào)了強化學(xué)習(xí)(RL)中最難的階段:人工智能機器人只能部分觀察周圍的世界,研究者用一個奇怪的名字來描述這種現(xiàn)象——基于部分觀察的馬爾可夫決策過程。遷移學(xué)習(xí)(TL),正如在前面講到的,能夠?qū)⒁粋€已經(jīng)做好的模型遷移應(yīng)用到一個新的領(lǐng)域中。楊教授講到,希望利用這樣一個三層結(jié)構(gòu)賦予對話系統(tǒng)以下功能,比如說閑聊、推薦、引導(dǎo)、提醒、學(xué)習(xí),如果一個對話系統(tǒng)能夠具備這些功能,它就像一個真人一樣。
但是,如何達到這個目的呢?
根據(jù)楊教授的觀點,首先,對話系統(tǒng)應(yīng)當(dāng)具備基本的對話功能,即自然語言生成能力,這種能力主要依賴RNN來實現(xiàn)。
其次,我們需要一個策略,用這個策略引導(dǎo)對話的對象來完成一個特定的任務(wù),即對話控制,主要通過RL實現(xiàn)。
最后,要實現(xiàn)個性化,滿足用戶不同的需求指令,主要依靠TL實現(xiàn)。
為此,楊教授給我們提供了一個實例,香港科技大學(xué)現(xiàn)在和一個O2O的公司合作,用真是的數(shù)據(jù)訓(xùn)練這個對話系統(tǒng),上圖中綠色代表用戶所提的問題,白色代表系統(tǒng)的回答,該系統(tǒng)的中文名字叫做“魔鏡系統(tǒng)”,就是童話故事白雪公主里面的魔鏡,當(dāng)然這是一個好的魔鏡。“魔鏡系統(tǒng)”是個性化學(xué)習(xí)的一個實例。
在這個系統(tǒng)中,我們是把整個對話系統(tǒng)放置在一個機器人里面,讓機器人通過語音的方式與用戶對答,實際上,這個系統(tǒng)可以在手機上與人進行交流。楊教授的研究團隊將“魔鏡系統(tǒng)”與大家熟悉的一些對話系統(tǒng)作對比,下圖中,綠色代表用戶的問題,黃色是小冰的回答,可以看到相比之下,小冰的回答多富有調(diào)侃性,準(zhǔn)確度很低,而之前“魔鏡系統(tǒng)”的回答更容易滿足用戶的需求。此外,我們還可以看到siri(灰色)的回答很多都是“抱歉沒有找到匹配”,因為siri是基于搜索的對話系統(tǒng)。
楊教授表示,他們之所以對這種對話系統(tǒng)進行研究,歸根到底是對背后的系統(tǒng)感興趣,即我們在剛開始講到的——人工智能成功的五個必備條件。在對該對話系統(tǒng)背后的原理進行剖析,可以發(fā)現(xiàn),其研究團隊具有很明確的目標(biāo),有很好的反饋,有不斷到來的數(shù)據(jù),有跨界人才,此外,和O2O公司有聯(lián)絡(luò)。
談及清晰的問題定義與領(lǐng)域邊界這個必要條件,楊教授表示,我們不一定像在下圍棋一樣,要確定明確的邊界,在這里我們可以考慮說當(dāng)我們現(xiàn)在的談話進行到這里時,到底離我們的目標(biāo)還有多遠,這就好像在下棋里面一樣,我們對當(dāng)前的盤面有一個估算,同時我們可以接著往下問不同的問題,就像我們下面要下的棋子一樣,所以對話系統(tǒng)的問題定義與領(lǐng)域邊界問題實質(zhì)上與Alphago的思維很相像。
楊教授講到,同深度學(xué)習(xí)、強化學(xué)習(xí)及遷移學(xué)習(xí)一樣,這個三層結(jié)構(gòu)算法模型也具有通用性。比如楊教授的學(xué)生就把這種模型應(yīng)用到大家公認(rèn)的很難的領(lǐng)域中——預(yù)測股市走勢。下圖所示為A股里面的某個股票,用過去十年的數(shù)據(jù)訓(xùn)練該模型。首先,運用數(shù)據(jù)之間的連接,產(chǎn)生不同的狀態(tài),讓各個狀態(tài)之間能夠互相遷移。其次,不同狀態(tài)之間將發(fā)生變化,我們運用用一個強化學(xué)習(xí)器模擬這種變化。最后。我們發(fā)現(xiàn)深度學(xué)習(xí)的隱含層里面會自動產(chǎn)生幾百個狀態(tài),基本就能夠?qū)@十年來的經(jīng)濟狀況做出一個很完善的總結(jié)。所以,運用這種三層結(jié)構(gòu)算法模型可以很好地對股市走勢作出預(yù)測,對此,我們也做了一些相關(guān)測試。
楊教授表示,這個例子只是在金融領(lǐng)域的一個小小的試驗。不過,一旦我們對一個領(lǐng)域有了透徹的了解,并掌握更多的高質(zhì)量數(shù)據(jù),就可以將人工智能技術(shù)遷移到這個領(lǐng)域來,在應(yīng)用過程中對所遇到的問題作清晰的定義,最終能夠?qū)崿F(xiàn)通用型人工智能的目的。
在演講接近尾聲時,楊教授對所講的內(nèi)容做出總結(jié):通過同大家分享谷歌DeepMind的應(yīng)用實例,講解強化遷移學(xué)習(xí)和三層結(jié)構(gòu)算法模型,及個性化學(xué)習(xí),最終我們都要回歸到人工智能成功的五個必要條件——清晰的商業(yè)模式(明確的目標(biāo))、高質(zhì)量的大數(shù)據(jù)、清晰的問題定義和領(lǐng)域邊界、懂人工智能的跨界人才及計算能力,這五個條件相互影響,缺一不可,是人工智能技術(shù)長足發(fā)展的動力機。
本文由雷鋒網(wǎng)獨家編寫,未經(jīng)許可拒絕轉(zhuǎn)載!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。