丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給小芹菜
發(fā)送

0

CCL 2016| 中科院張鈸院士:后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

本文作者: 小芹菜 2016-10-15 23:02
導(dǎo)語(yǔ):計(jì)算語(yǔ)言學(xué)依然任重道遠(yuǎn),后深度學(xué)習(xí)時(shí)代,自然語(yǔ)言處理的發(fā)展要更依賴于學(xué)科交叉。

今天,第十五屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議(CCL2016)與第四屆基于自然標(biāo)注大數(shù)據(jù)的自然語(yǔ)言處理國(guó)際學(xué)術(shù)研討會(huì)(NLP-NABD2016)同時(shí)在魯東大學(xué)召開(kāi)。來(lái)自語(yǔ)智云帆的美女工程師任曉娜參與了會(huì)議,并為雷鋒網(wǎng)的讀者們帶來(lái)會(huì)議現(xiàn)場(chǎng)的報(bào)道,雷鋒網(wǎng)對(duì)內(nèi)容做了不修改原意的編輯。

CCL 2016| 中科院張鈸院士:后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

先簡(jiǎn)單介紹下兩個(gè)會(huì)議的背景——

CCL(全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議)從1991年開(kāi)始每?jī)赡昱e辦一次,從2013年開(kāi)始每年舉辦一次,著重于中國(guó)境內(nèi)各類語(yǔ)言的計(jì)算處理,為研討和傳播計(jì)算語(yǔ)言學(xué)最新的學(xué)術(shù)和技術(shù)成果提供了高水平的交流平臺(tái)。


NLP-NAB(基于自然標(biāo)注大數(shù)據(jù)的自然語(yǔ)言處理國(guó)際學(xué)術(shù)研討會(huì))涵蓋了所有自然語(yǔ)言處理的研究?jī)?nèi)容,尤其關(guān)注在大數(shù)據(jù)時(shí)代自然語(yǔ)言處理的前沿方法和技術(shù)。

從清華大學(xué)孫茂松教授的發(fā)言大致就能知道本次會(huì)議的相關(guān)情況:會(huì)議收到投稿300多篇,錄用率32.9%。會(huì)議前一天加入講習(xí)班環(huán)節(jié),都是一線青年研究學(xué)者的報(bào)告;并且加入了自然語(yǔ)言處理國(guó)際前沿動(dòng)態(tài)綜述的,是簡(jiǎn)而精的報(bào)告;加入系統(tǒng)展示環(huán)節(jié)的,都是業(yè)界比較前沿的技術(shù),特邀報(bào)告人也是業(yè)界專家。以上被錄用的英文論文,都將由論文出版社Springer發(fā)表在LNAI(Lecture Notes in Artificial Intelligence)系列中。

中科院張鈸院士:后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

CCL 2016| 中科院張鈸院士:后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

(清華大學(xué)教授、中國(guó)科學(xué)院張鈸院士)

清華大學(xué)教授、中國(guó)科學(xué)院張鈸院士介紹了從符號(hào)主義到連接主義再到深度學(xué)習(xí),在語(yǔ)言處理上遇到的困難、原因以及來(lái)源等。

  • 符號(hào)主義的認(rèn)知計(jì)算模型

張鈸院士提到,符號(hào)主義掀起了一場(chǎng)計(jì)算機(jī)(算法)應(yīng)用的革命,它也是最合適的語(yǔ)言模型。另外,知識(shí)驅(qū)動(dòng)法,提及了waston系統(tǒng)(以知識(shí)為基礎(chǔ)的問(wèn)答系統(tǒng)),指出了知識(shí)驅(qū)動(dòng)法存在的局限。

  • 連接主義的崛起

20世紀(jì)以來(lái)計(jì)算語(yǔ)言學(xué)的兩大變化,一是大數(shù)據(jù),二是概率統(tǒng)計(jì)方法。跨過(guò)統(tǒng)計(jì)學(xué)的四個(gè)里程碑、機(jī)器學(xué)習(xí)模型的發(fā)展及文本的機(jī)器學(xué)習(xí)模型等,再到文本語(yǔ)義鴻溝問(wèn)題,一般情況語(yǔ)義和底層特征之間的映射不存在,于是引出了從淺層學(xué)習(xí)到深度學(xué)習(xí),深度學(xué)習(xí)在語(yǔ)言處理中的應(yīng)用以及深度學(xué)習(xí)解決問(wèn)題的范圍。

  • 后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

在后深度學(xué)習(xí)時(shí)代,計(jì)算語(yǔ)言遇到了困難,比如在概率統(tǒng)計(jì)方法和生數(shù)據(jù)所帶來(lái)的——

概率統(tǒng)計(jì)方法帶來(lái)的困難:神經(jīng)網(wǎng)絡(luò)(手寫數(shù)字)識(shí)別系統(tǒng)只是分類問(wèn)題并非“識(shí)別”。張鈸院士舉了個(gè)深度神經(jīng)網(wǎng)絡(luò)錯(cuò)誤識(shí)別案例:全是噪音的圖片,被識(shí)別為0-9個(gè)手寫數(shù)字,置信度為99.99%。又另外分別從輸入量、信息量、關(guān)系、底層特征四方面,分析了文本與圖像信息之間存在的差異。

生數(shù)據(jù)(Raw Data)帶來(lái)的困難:Stanford圖片識(shí)別均采用正例樣本,識(shí)別率比較高,而正負(fù)樣本均隨機(jī)選擇的話,Stanford識(shí)別率只有19.2%(包括pretraining,采用9M images,10k categories)。

如何解決以上困難?張鈸院士提出以下三點(diǎn):

(1)知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)的結(jié)合:例蒙特卡洛樹(shù)搜索+深度學(xué)習(xí)

(2)學(xué)科交叉,特別是與腦科學(xué)與認(rèn)知科學(xué)的結(jié)合

(3)計(jì)算語(yǔ)言學(xué)與人工智能共同前進(jìn)

張鈸院士說(shuō),計(jì)算語(yǔ)言學(xué)依然任重道遠(yuǎn),后深度學(xué)習(xí)時(shí)代,自然語(yǔ)言處理的發(fā)展要更依賴于學(xué)科交叉:腦科學(xué)、語(yǔ)言學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)和認(rèn)知科學(xué)等。

微軟亞洲研究院 常務(wù)副院長(zhǎng)馬維英:有關(guān)Self-Teaching機(jī)器人的一些研究成果

CCL 2016| 中科院張鈸院士:后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

微軟亞洲研究院常務(wù)副院長(zhǎng)馬維英博士在《Can We Build a Self-Teaching Machine?  A Quest for Machine Comprehension of Text》 的現(xiàn)場(chǎng)報(bào)告中,主要介紹了微軟亞洲研究院有關(guān)Self-Teaching機(jī)器人的最新進(jìn)展。

比如在談及機(jī)器人從搜索引擎道聊天工具對(duì)文本的理解時(shí),Self-Teaching機(jī)器人能夠做到:

  • 閑聊和深聊的結(jié)合,使用戶更有興趣進(jìn)行交流,并具有親切感;

  • 圖片或者視頻的識(shí)別和評(píng)論;

  • 建立用戶模型,會(huì)給出令人驚喜的回答;

  • 能夠幫助訂機(jī)票

  • ...... 

除此之外,還有機(jī)器人小冰。比如圖書館進(jìn)行圖書搜索的關(guān)鍵是排序,機(jī)器人小冰通過(guò)大量數(shù)據(jù)來(lái)顛覆搜索過(guò)程,采用了深度學(xué)習(xí)、知識(shí)挖掘等關(guān)鍵技術(shù),數(shù)據(jù)結(jié)果顯示,小冰的每個(gè)會(huì)話的互動(dòng)要高于其他相似產(chǎn)品。

報(bào)告現(xiàn)場(chǎng),馬維英還提到了人工智能的四大趨勢(shì):

a. 萬(wàn)物電子化;b. 萬(wàn)物互聯(lián);c. 云計(jì)算;d. 軟件工程智能化

人工智能技術(shù)還可以擴(kuò)展到其他方向,其中一個(gè)重要的應(yīng)用就是機(jī)器翻譯。機(jī)器翻譯的雙向?qū)W習(xí),用5%雙語(yǔ)訓(xùn)練數(shù)據(jù)的BLEU值與100%訓(xùn)練數(shù)據(jù)的BLEU值相當(dāng),并且可應(yīng)用于多個(gè)相關(guān)任務(wù)協(xié)同學(xué)習(xí)中(NIPS2016)。

今天會(huì)議干貨很多,這里做個(gè)小小預(yù)告:明天將有4個(gè)特邀報(bào)告,自然語(yǔ)言處理國(guó)際前沿動(dòng)態(tài)綜述及錄取論文poster的展示,另外還新加入了系統(tǒng)展示環(huán)節(jié)。我們也將展示公司(北京語(yǔ)智云帆科技有限公司)的最新產(chǎn)品,歡迎大家留言交流。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

CCL 2016| 中科院張鈸院士:后深度學(xué)習(xí)時(shí)代的計(jì)算語(yǔ)言學(xué)

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,AI慕課學(xué)院負(fù)責(zé)人。關(guān)注智能駕駛與金融科技,歡迎來(lái)撩:www.mooc.ai。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)