丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給老王
發(fā)送

0

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

本文作者: 老王 2016-12-23 11:57
導(dǎo)語:香港科技大學(xué)楊強(qiáng)教授在騰訊暨 KDD China 大數(shù)據(jù)峰會(huì)做了一期以《從深度學(xué)習(xí)到遷移學(xué)習(xí)》為主題的演講。

雷鋒網(wǎng)按:騰訊暨 KDD China 大數(shù)據(jù)峰會(huì)在深圳舉行,其中香港科技大學(xué)教授、第四范式首席科學(xué)家楊強(qiáng)做了一期以《從深度學(xué)習(xí)到遷移學(xué)習(xí)》為主題的演講,本文主要闡述了楊強(qiáng)教授在會(huì)中講解遷移學(xué)習(xí)在產(chǎn)業(yè)界的實(shí)際應(yīng)用,由雷鋒網(wǎng)亞峰、亞萌、宗仁聯(lián)合編輯。

遷移學(xué)習(xí)是什么?

簡單講,就是能讓現(xiàn)有的模型算法稍加調(diào)整即可應(yīng)用于一個(gè)新的領(lǐng)域和功能的一項(xiàng)技術(shù)。遷移學(xué)習(xí)能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實(shí)現(xiàn)個(gè)性化遷移。

人類很自然就具備舉一反三的遷移能力,如我們學(xué)會(huì)騎自行車后,學(xué)騎摩托車就很簡單了;會(huì)打羽毛球,再學(xué)打網(wǎng)球也就沒那么難了。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

遷移學(xué)習(xí)四種實(shí)現(xiàn)方法:

1.樣本遷移

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

樣本遷移即在數(shù)據(jù)集(源領(lǐng)域)中找到與目標(biāo)領(lǐng)域相似的數(shù)據(jù),把這個(gè)數(shù)據(jù)放大多倍,與目標(biāo)領(lǐng)域的數(shù)據(jù)進(jìn)行匹配。其特點(diǎn)是:需要對不同例子加權(quán);需要用數(shù)據(jù)進(jìn)行訓(xùn)練。

2.特征遷移

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

特征遷移是通過觀察源領(lǐng)域圖像與目標(biāo)域圖像之間的共同特征,然后利用觀察所得的共同特征在不同層級的特征間進(jìn)行自動(dòng)遷移。

3.模型遷移

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

模型遷移利用上千萬的圖象訓(xùn)練一個(gè)圖象識(shí)別的系統(tǒng),當(dāng)我們遇到一個(gè)新的圖象領(lǐng)域,就不用再去找?guī)浊f個(gè)圖象來訓(xùn)練了,可以原來的圖像識(shí)別系統(tǒng)遷移到新的領(lǐng)域,所以在新的領(lǐng)域只用幾萬張圖片同樣能夠獲取相同的效果。模型遷移的一個(gè)好處是我們可以區(qū)分,就是可以和深度學(xué)習(xí)結(jié)合起來,我們可以區(qū)分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些。

4.關(guān)系遷移

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

如社會(huì)網(wǎng)絡(luò),社交網(wǎng)絡(luò)之間的遷移。

遷移學(xué)習(xí)在產(chǎn)業(yè)界的實(shí)際應(yīng)用

1.遷移學(xué)習(xí)在機(jī)器閱讀中的應(yīng)用

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

所謂“機(jī)器閱讀”,就是把自然語言文本轉(zhuǎn)化為機(jī)器可以理解的模式,然后機(jī)器根據(jù)這個(gè)模式對個(gè)人進(jìn)行服務(wù)。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

這個(gè)模式可以從不同的層次進(jìn)行“理解”,比如可以在字、句子、段落、文檔和多文檔當(dāng)中產(chǎn)生各種隱式表達(dá),而這些表達(dá)可以用空間的相似度來代替,這樣加一個(gè)詞,可以映射到高維空間。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

有了這種表達(dá)之后,可以拿一句話到比如說 LSTM 里 ,對應(yīng)的就是輸出,這個(gè)輸出就會(huì)給我們對話一個(gè)現(xiàn)象。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

同時(shí),我們還可以拿 Attention 模型去標(biāo)明一些問句里面的概念,它可以利用同一個(gè)對比相似性找到這個(gè)概念。因?yàn)槠鋬?nèi)部隱含的表達(dá)是一個(gè) text,把周邊字的名稱給理解了,它的應(yīng)用就是可以自動(dòng)產(chǎn)生文本摘要(Automatic Summarization)。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

這個(gè)在 Information Retrieval里面叫做 Summarization,過去的 Summarization 做法是“提取式” (Extractive)的。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

但是今天 Summarization 可以做到“理解”,并用自己的語言或用戶喜歡的語言表達(dá)出來。所以這里就要提出一個(gè)新的方式,就是既可以結(jié)合傳統(tǒng) Summarization,并加入用戶反饋(比如用戶看了某篇文章、所看時(shí)長或點(diǎn)贊行為)。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

所以,接下來就可以把模型個(gè)性化,給張三看的 Summarization和李四看的 Summarization不一樣,就像一篇文章我們需要產(chǎn)生一個(gè)吸引眼球的標(biāo)題,但你給張三和李四看的標(biāo)題都是不一樣的。

2.遷移學(xué)習(xí)在對話系統(tǒng)中的應(yīng)用

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

訓(xùn)練一個(gè)通用型的對話系統(tǒng),該系統(tǒng)可能是閑聊型,也可能是一個(gè)任務(wù)型的。但是,我們可以根據(jù)在特定領(lǐng)域的小數(shù)據(jù)修正它,使得這個(gè)對話系統(tǒng)適應(yīng)不同任務(wù)。比如,一個(gè)用戶想買咖啡,他并不想回答所有繁瑣的問題,例如是要大杯小杯,熱的冷的?

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

所以我們希望這個(gè)系統(tǒng)了解用戶的喜好,根據(jù)過去的數(shù)據(jù)分析,一步到位提供一杯符合用戶需求的咖啡。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

這里舉個(gè)例子,買咖啡的時(shí)候,可能你不喜歡每次都回答所有問題,比如你要大杯小杯???熱的冷的???而是想這個(gè)助手了解我,可以根據(jù)我們過去的小數(shù)據(jù)來一步到位。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

據(jù)此,我做了一個(gè)推薦系統(tǒng),把一個(gè)在三萬個(gè)對話基礎(chǔ)上做了一個(gè)通用型的對話系統(tǒng),或者說任務(wù)型的對話系統(tǒng),遷移到一個(gè)個(gè)性化的統(tǒng)計(jì)上,變成只有 9 個(gè)對話的(小數(shù)據(jù))上,就像一個(gè)懂你的小秘書。同理,這個(gè)也可在金融系統(tǒng),問一些金融和股票的問題,然后它通過強(qiáng)化學(xué)習(xí),給你建議一些 Candidate。并且對收益和用戶的需求做排序。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

在這個(gè)過程中,我們看到:

第一部分是深度學(xué)習(xí)效果。

第二部分是強(qiáng)化學(xué)習(xí)效果。

第三部分是遷移學(xué)習(xí)效果。

最后我要講最近一些做的遷移學(xué)習(xí)的工作。如果兩個(gè)領(lǐng)域,直接遷移是不行的,我們可以找到一些中間的領(lǐng)域。這個(gè)我們可以用深度學(xué)習(xí)的方法,假設(shè)我們用一個(gè)大數(shù)據(jù),已經(jīng)訓(xùn)練好的一個(gè)系統(tǒng),然后我們現(xiàn)在的目標(biāo)是到達(dá)一個(gè)目標(biāo)領(lǐng)域,若我們不能一步到位的話,會(huì)發(fā)現(xiàn)一旦我們用的小數(shù)據(jù),各種數(shù)據(jù)的屬性相差很多,怎么辦呢?我們?nèi)フ乙恍┲虚g的領(lǐng)域,中間的領(lǐng)域可以適度的的改變, 并且一些不應(yīng)該改變的部分不會(huì)改變。這樣經(jīng)過合理改變之后,部分?jǐn)?shù)據(jù)加以梳理,最后就得到我們要的被遷移數(shù)據(jù)。

3.遷移學(xué)習(xí)在輿情分析中的應(yīng)用

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

遷移學(xué)習(xí)也可應(yīng)用在輿情分析中,如用戶評價(jià)方面。以電子產(chǎn)品和視頻游戲留言為例,上圖中綠色為好評標(biāo)簽,而紅色為差評標(biāo)簽。我們可以從上圖左側(cè)的電子產(chǎn)品評價(jià)中找到特征,促使它在這個(gè)領(lǐng)域(電子產(chǎn)品評價(jià))建立模型,然后利用模型把其遷移到視頻游戲中。這里可以看到,輿情也可以進(jìn)行大規(guī)模的遷移,而且在新的領(lǐng)域不需要標(biāo)簽。

4.遷移學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

我們之前也與 IMBD 做過在線推薦系統(tǒng),在某個(gè)領(lǐng)域做好一個(gè)推薦系統(tǒng),然后應(yīng)用在稀疏的、新的垂直領(lǐng)域。

風(fēng)頭正勁的遷移學(xué)習(xí)

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

當(dāng)今全世界都在推動(dòng)遷移學(xué)習(xí),當(dāng)今 AAAI 中大概有 20 多篇遷移學(xué)習(xí)相關(guān)文章,而往年只有五六篇。與此同時(shí),如吳恩達(dá)等深度學(xué)習(xí)代表人物也開始做遷移學(xué)習(xí)。

為什么呢?因?yàn)橐谝粋€(gè)領(lǐng)域找到高質(zhì)量的數(shù)據(jù)非常難,而把現(xiàn)成的模型用在高質(zhì)量數(shù)據(jù)量少的領(lǐng)域則是非常好的解決方案。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

最后,我做一個(gè)總結(jié),昨天我們在深度學(xué)習(xí)上有著很高成就。但我們發(fā)現(xiàn)深度學(xué)習(xí)在有即時(shí)反饋的領(lǐng)域和應(yīng)用方向有著一定的優(yōu)勢,但在其他領(lǐng)域則不行。打個(gè)比方:就像我在今天講個(gè)笑話,你第二天才能笑得出來,在今天要解決這種反饋的時(shí)延問題需要強(qiáng)化學(xué)習(xí)來做。而在明天,則有更多的地方需要遷移學(xué)習(xí):它會(huì)讓機(jī)器學(xué)習(xí)在這些非常珍貴的大數(shù)據(jù)和小數(shù)據(jù)上的能力全部釋放出來。做到舉一反三,融會(huì)貫通。

相關(guān)閱讀:

騰訊暨 KDD China 大數(shù)據(jù)峰會(huì)之前,楊強(qiáng)教授就曾在 2016 年雷鋒網(wǎng)承辦的 CCF- GAIR 全球人工智能與機(jī)器人峰會(huì)大會(huì)上,深入淺出地為大家講述了人工智能要取得成功應(yīng)當(dāng)具備的五個(gè)必要條件和遷移學(xué)習(xí)的本質(zhì)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

分享:
相關(guān)文章

編輯

微信 wangyafeng123456
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說