0
本文作者: camel | 2017-08-25 16:16 | 專(zhuān)題:IJCAI 2017 |
雷鋒網(wǎng)AI科技評(píng)論按:這幾天在澳洲舉行的人工智能領(lǐng)域頂級(jí)會(huì)議“人工智能?chē)?guó)際聯(lián)合大會(huì)”(International Joint Conference on Artificial Intelligence,IJCAI 2017),IJCAI今年共收到2540篇論文投稿,最終錄用660篇,錄用率26%。
雷鋒網(wǎng)注意到在這660篇文章中,清華大學(xué) 自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室(thunlp)就有7篇論文被IJCAI收錄。它們分別是:
1、《Fast Network Embedding Enhancement via High Order Proximity Approximation 》
一句話(huà):針對(duì)網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題提出一種基于高階鄰接度逼近的快速算法,能夠普遍提升已有網(wǎng)絡(luò)表示學(xué)習(xí)算法的性能。
摘要:最近在網(wǎng)絡(luò)頂點(diǎn)向量表示的學(xué)習(xí)上提出了許多網(wǎng)絡(luò)表示學(xué)習(xí)(NRL)方法。在這篇文章中,我們將現(xiàn)有的大多數(shù)NRL方法統(tǒng)一歸納為兩步驟框架,包括鄰近度矩陣構(gòu)造和維度降低。我們集中分析鄰近度矩陣構(gòu)造這一步驟。當(dāng)構(gòu)建鄰近度矩陣時(shí)我們得出一個(gè)結(jié)論,即可以通過(guò)高階鄰近度來(lái)改進(jìn)NRL方法。我們提出網(wǎng)絡(luò)嵌入更新(Network Embedding Update, NEU)算法,其中隱含地有理論近似約束的高階鄰近度,它可以應(yīng)用到任意一個(gè)NRL方法中來(lái)提高這些方法的性能。實(shí)驗(yàn)上我們對(duì)多標(biāo)簽分類(lèi)和連接預(yù)測(cè)任務(wù)做了實(shí)驗(yàn)。結(jié)果表明,NEU可以對(duì)所有三種公開(kāi)數(shù)據(jù)集的NRL方法有一致且顯著的改進(jìn),運(yùn)行時(shí)間幾乎可以忽略不計(jì)。本文代碼可以從https://github.com/thunlp/NEU 獲得。
論文下載地址:https://www.ijcai.org/proceedings/2017/0544.pdf
2、《Joint Training for Pivot-based Neural Machine Translation 》
一句話(huà):針對(duì)低資源語(yǔ)言的神經(jīng)機(jī)器翻譯提出了源語(yǔ)言-橋接語(yǔ)言和橋接語(yǔ)言-目標(biāo)語(yǔ)言翻譯模型的聯(lián)合訓(xùn)練算法,增強(qiáng)兩個(gè)模型在參數(shù)估計(jì)中的關(guān)聯(lián)性。
摘要:近來(lái)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯方法在資源豐富的語(yǔ)言上表現(xiàn)極佳,但是對(duì)于低資源語(yǔ)言卻有著數(shù)據(jù)稀缺的問(wèn)題。這個(gè)問(wèn)題可以通過(guò)橋接語(yǔ)言來(lái)連接源語(yǔ)言和目標(biāo)語(yǔ)言得以緩解,但是目前源語(yǔ)言-橋接語(yǔ)言和橋接語(yǔ)言-目標(biāo)語(yǔ)言的模型在訓(xùn)練時(shí)大多是相互獨(dú)立的。在我們的工作中,我們引入了基于橋接語(yǔ)言的神經(jīng)機(jī)器翻譯的聯(lián)合訓(xùn)練算法。我們提出了三種方式來(lái)連接源-橋接和橋接-目標(biāo)這兩種模型,使他們?cè)谟?xùn)練過(guò)程中能夠相互作用?;贓uroparl和WMT語(yǔ)料庫(kù)的實(shí)驗(yàn)表明,這種聯(lián)合訓(xùn)練在多種語(yǔ)言中相比比獨(dú)立訓(xùn)練效果都有顯著提高。
論文下載地址:https://www.ijcai.org/proceedings/2017/0555.pdf
3、《TransNet: Translation-Based Network Representation Learning for Social Relation Extraction 》
一句話(huà):提出社會(huì)網(wǎng)絡(luò)中用戶(hù)關(guān)系抽取問(wèn)題,成功地利用用戶(hù)低維表示間的平移(Translating)思想表示用戶(hù)關(guān)系,實(shí)現(xiàn)用戶(hù)關(guān)系的識(shí)別與標(biāo)注。
摘要:常規(guī)的網(wǎng)絡(luò)表示學(xué)習(xí)(NRL)模型一般是通過(guò)簡(jiǎn)單地將每個(gè)邊緣作為二分/連續(xù)的值來(lái)學(xué)習(xí)低維丁點(diǎn)表示。但實(shí)際上,在邊緣部分存在豐富的語(yǔ)義信息,且頂點(diǎn)之間的相互作用通常會(huì)保留不同的含義,這些信息在現(xiàn)有的大部分NRL模型中都被忽略了。在本文中,我們提出了一種基于翻譯的NRL模型,TransNet,通過(guò)將頂點(diǎn)之間的相互作用作為翻譯來(lái)操作。此外,我們將社會(huì)化關(guān)系提?。⊿ocial Relation Extraction, SRE)的任務(wù)格式化,用來(lái)評(píng)估NRL方法對(duì)頂點(diǎn)關(guān)系建模的能力。SRE的實(shí)驗(yàn)結(jié)果表明,TransNet在hits@1上比其他基準(zhǔn)方法顯著提高10%到20%。源代碼和數(shù)據(jù)集可以從https://github.com/thunlp/TransNet提取。
論文下載地址:https://www.ijcai.org/proceedings/2017/0399.pdf
4、《Lexical Sememe Prediction via Word Embeddings and Matrix Factorization》
一句話(huà):提出面向HowNet的義原預(yù)測(cè)任務(wù),提出基于詞表示和矩陣分解的方法,能夠有效預(yù)測(cè)新詞或短語(yǔ)的義原信息。
摘要:義原(sememe)被定義為人類(lèi)語(yǔ)言的最小語(yǔ)義單位。人們以前通過(guò)手動(dòng)注釋文本義原來(lái)形成語(yǔ)言知識(shí)的基礎(chǔ)。但手動(dòng)注釋不僅耗時(shí)、費(fèi)力,注釋結(jié)果也具有顯著的不一致性以及較大的噪聲。在這篇文章中,我們首次探索了基于詞嵌入編碼的詞語(yǔ)義學(xué)意義的詞匯義原自動(dòng)預(yù)測(cè)。此外我們應(yīng)用矩陣因式分解方法來(lái)學(xué)習(xí)語(yǔ)義和詞之間的語(yǔ)義關(guān)系。在實(shí)驗(yàn)中,我們采用了一個(gè)實(shí)際生活中的知識(shí)庫(kù)HowNet進(jìn)行訓(xùn)練和評(píng)估,結(jié)果顯示了我們的詞匯義原預(yù)測(cè)方法的有效性。我們的這種方法在現(xiàn)有噪雜的義原知識(shí)庫(kù)的注釋驗(yàn)證和新詞匯/短語(yǔ)的注釋中將會(huì)有很大的應(yīng)用。
論文下載地址:https://www.ijcai.org/proceedings/2017/0587.pdf
5、《Iterative Entity Alignment via Joint Knowledge Embeddings 》
一句話(huà):針對(duì)異質(zhì)知識(shí)圖譜間的實(shí)體對(duì)齊問(wèn)題,僅根據(jù)異質(zhì)知識(shí)圖譜的結(jié)構(gòu)信息,提出利用知識(shí)的分布式表示學(xué)習(xí)在低維語(yǔ)義空間中有效實(shí)現(xiàn)實(shí)體對(duì)齊。
摘要:實(shí)體對(duì)齊旨在將其對(duì)應(yīng)方與多個(gè)知識(shí)圖(Knowledge Graphs, KG)聯(lián)系起來(lái)。大多數(shù)現(xiàn)有的方法通常依賴(lài)諸如維基百科鏈接這樣的實(shí)體外部信息,且需要昂貴的受凍特征構(gòu)造來(lái)完成對(duì)齊。在本文中,我們提出了一種通過(guò)聯(lián)合知識(shí)嵌入來(lái)實(shí)現(xiàn)實(shí)體對(duì)齊的新方法。在我們的方法,我們根據(jù)在這種聯(lián)合語(yǔ)義空間中的語(yǔ)義距離,將實(shí)體和各種KG的關(guān)系共同編碼成一個(gè)統(tǒng)一的低維語(yǔ)義空間。在這個(gè)過(guò)程中,我們可以根據(jù)在聯(lián)合語(yǔ)義空間中它們的語(yǔ)義距離將這些實(shí)體對(duì)齊。更具體地說(shuō),我們提出了一種迭代和參數(shù)共享的方法來(lái)提高對(duì)齊的性能。根據(jù)實(shí)際生活中的數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,與基準(zhǔn)方法相比,我們的方法對(duì)實(shí)體對(duì)齊有顯著的改進(jìn),并且利用聯(lián)合知識(shí)嵌入可以進(jìn)一步提高各種KG實(shí)現(xiàn)中的表現(xiàn)。
論文下載地址:https://www.ijcai.org/proceedings/2017/0595.pdf
6、《Image-embodied Knowledge Representation Learning》
一句話(huà):針對(duì)知識(shí)的分布式表示學(xué)習(xí)問(wèn)題,成功地引入實(shí)體的圖像信息,顯著提升知識(shí)表示能力。
摘要:實(shí)體圖像可以為知識(shí)表示學(xué)習(xí)提供重要的視覺(jué)信息。大多數(shù)常規(guī)的方法僅從結(jié)構(gòu)化的三元組來(lái)學(xué)習(xí)知識(shí)表示,而忽略了從實(shí)體圖像中提取的豐富的視覺(jué)信息。在本文中,我們提出了一種新穎的圖像呈現(xiàn)的知識(shí)表示學(xué)習(xí)模型(Image-embodied Knowledge Representation Learning model, IKRL),其中知識(shí)表示是同時(shí)用三重事實(shí)和圖像來(lái)學(xué)習(xí)的。更具體地說(shuō),我們首先用句有神經(jīng)圖像編碼器的實(shí)體的所有圖像構(gòu)造表示。然后,這些圖像表示通過(guò)基于注意的方法被集成到聚合的基于圖像的表示中。我們?cè)谥R(shí)圖實(shí)現(xiàn)和三重分類(lèi)上測(cè)試了我們的IKRL模型。實(shí)驗(yàn)結(jié)果表明,我們的模型在兩個(gè)任務(wù)中都優(yōu)于其他的基準(zhǔn)方法,這也說(shuō)明了視覺(jué)信息對(duì)于知識(shí)表示的重要性,以及我們的模型在學(xué)習(xí)圖像表示中的性能。
論文下載地址:https://www.ijcai.org/proceedings/2017/0438.pdf
7、《Maximum Expected Likelihood Estimation for Zero-resource Neural Machine Translation》
一句話(huà):針對(duì)零資源神經(jīng)機(jī)器翻譯提出最大期望似然估計(jì)準(zhǔn)則訓(xùn)練準(zhǔn)則,實(shí)現(xiàn)在無(wú)標(biāo)數(shù)據(jù)情況下的直接翻譯建模,緩解了傳統(tǒng)方法分段解碼所面臨的錯(cuò)誤傳播問(wèn)題。
摘要:雖然神經(jīng)機(jī)器翻譯(neural machine translation, NMT)最近在翻譯少數(shù)資源豐富的語(yǔ)言中取得了顯著的進(jìn)步,但并行語(yǔ)料庫(kù)并不總能用到大多數(shù)語(yǔ)言對(duì)中。為了解決這個(gè)問(wèn)題,我們提出一種通過(guò)最大期望似然估計(jì)的零資源NMT方法?;舅枷刖褪?,在一個(gè)意向的源-目標(biāo)語(yǔ)言翻譯模型中,我們最大限度地提高關(guān)于連接-源翻譯模型與連接-目標(biāo)并行語(yǔ)料庫(kù)之間的期望值。為了近似獲得這個(gè)期望值,我們提出兩種方法來(lái)結(jié)合 連接-源模型 和 源-目標(biāo)模型。對(duì)這兩種零資源語(yǔ)言對(duì)的實(shí)驗(yàn)表明,我們所提出的方法相比于基準(zhǔn)方法會(huì)有實(shí)質(zhì)性的增益。我們還看到,當(dāng)源-目標(biāo)模型與連接-源模型聯(lián)合訓(xùn)練時(shí),后者也將獲得比獨(dú)立訓(xùn)練較大的改進(jìn)。
論文下載地址:https://www.ijcai.org/proceedings/2017/0594.pdf
雷鋒網(wǎng)注:本文參考了“我組7篇論文被人工智能頂級(jí)會(huì)議IJCAI 2017錄用”
相關(guān)文章:
現(xiàn)場(chǎng)|楊強(qiáng)教授當(dāng)選新任IJCAI理事會(huì)主席后接受采訪:華人首次當(dāng)選的個(gè)中細(xì)節(jié)
大陸人工智能學(xué)者第一人!周志華當(dāng)選IJCAI 2021程序委員會(huì)主席(附會(huì)后采訪)
優(yōu)必選斬獲 IJCAI 2017最佳學(xué)生論文獎(jiǎng),13篇論文入選
IJCAI最佳論文公布 華人斬獲最佳學(xué)生論文獎(jiǎng)!
IJCAI 2017 最佳論文明日公布,華人已承包最佳學(xué)生論文獎(jiǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章