0
本文作者: 楊曉凡 | 2018-02-05 16:26 | 專題:AAAI 2018 |
雷鋒網(wǎng) AI 科技評(píng)論消息,第 32 屆 AAAI 大會(huì)(AAAI 2018)日前在美國(guó)新奧爾良拉開帷幕,會(huì)議時(shí)間為 2 月 2 日至 7 日。
作為人工智能領(lǐng)域最悠久、涵蓋內(nèi)容最廣泛的學(xué)術(shù)會(huì)議之一,歷屆 AAAI 都吸引了全世界的人工智能相關(guān)領(lǐng)域的研究者參與,會(huì)議的論文內(nèi)容也豐富多彩。近年來(lái)參加 AAAI 的中國(guó)學(xué)者和以及投稿 AAAI 的中國(guó)論文也都有明顯增加,這也印證了 AAAI 對(duì)中國(guó)學(xué)者們的吸引力。實(shí)際上,來(lái)自中國(guó)的論文投遞數(shù)在 2017 年為 785 篇,僅以微弱優(yōu)勢(shì)超越美國(guó),但在今年實(shí)現(xiàn)了 58%的驚人提升,以 1242 篇論文當(dāng)仁不讓地成為 AAAI 2018 的「學(xué)術(shù)論文第一產(chǎn)地」。但從錄用論文的數(shù)量來(lái)說,中美兩國(guó)仍然不相上下,均有 260 余篇論文被收錄,可見來(lái)自中國(guó)的投稿數(shù)雖然有了大幅提升,但在質(zhì)量上仍然有進(jìn)步的空間。
AAAI 2018 今年共收到論文投稿 3808 篇,接受論文 938 篇,接受率 24%。大會(huì)評(píng)出杰出論文、杰出學(xué)生論文各一篇,杰出論文提名、杰出學(xué)生論文提名各一篇,以及經(jīng)典論文一篇。盡管《Memory-Augmented Monte Carlo Tree Search》獲得杰出論文的消息早已傳播開來(lái),但論文內(nèi)容還是直到上周末才公開發(fā)表;另外,這篇來(lái)自阿爾伯塔大學(xué)的論文的三位作者中也有兩位是華人。
杰出論文 Outstanding Paper:《Memory-Augmented Monte Carlo Tree Search》
記憶增強(qiáng)的蒙特卡洛樹搜索
論文摘要:這篇論文提出并評(píng)估了記憶增強(qiáng)蒙特卡洛樹搜索(M-MCTS),這一方法為在線實(shí)時(shí)搜索提出了一種新的利用泛化性的方式。記憶增強(qiáng)蒙特卡洛樹搜索的關(guān)鍵思路是把蒙特卡洛樹搜索和一個(gè)記憶結(jié)構(gòu)組合起來(lái),記憶結(jié)構(gòu)中的每個(gè)存儲(chǔ)位置都可以包含某個(gè)特定狀態(tài)的信息。通過綜合類似的狀態(tài)的估計(jì)結(jié)果,這些記憶可以生成逼近的估計(jì)值。作者們展示了,在隨機(jī)情況下,基于記憶的逼近值有更高可能性比原始的蒙特卡洛樹搜索表現(xiàn)更好。作者們也在圍棋游戲中評(píng)估了記憶增強(qiáng)蒙特卡洛樹搜索,實(shí)驗(yàn)結(jié)果表明,在同樣的模擬步數(shù)下記憶增強(qiáng)蒙特卡洛樹搜索也比原始版本有更好的表現(xiàn)。
論文地址:https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf
杰出學(xué)生論文 Outstanding Student Paper:《 Counterfactual Multi-Agent Policy Gradients》
反事實(shí)多智能體策略梯度
論文摘要:許多現(xiàn)實(shí)世界中的問題,比如網(wǎng)絡(luò)數(shù)據(jù)包的路由,或者自動(dòng)駕駛汽車之間的協(xié)調(diào),都可以很自然地看作合作性的多智能體系統(tǒng)問題來(lái)建模。這就對(duì)新的強(qiáng)化學(xué)習(xí)方法提出了強(qiáng)烈的需求,以便為這些系統(tǒng)高效地學(xué)習(xí)到區(qū)中心化的運(yùn)行策略。出于這個(gè)目的,作者們提出了一種新的多智能體的“執(zhí)行者-批評(píng)者”方法:反事實(shí)多智能體策略梯度(COMA)。COMA 中使用一個(gè)中心化的批評(píng)者估計(jì)Q函數(shù)和區(qū)中心化的執(zhí)行者,從而優(yōu)化智能體的運(yùn)行策略。除此之外,為了解決多智能體間互相建立信任的問題,它使用了一個(gè)會(huì)把單個(gè)智能體的動(dòng)作邊緣化的反事實(shí)基準(zhǔn)線,同時(shí)還能保證其它智能體的動(dòng)作不變。COMA 中使用了一個(gè)批評(píng)式的表征,從而使得這個(gè)反事實(shí)基準(zhǔn)線可以在單個(gè)前饋流程中進(jìn)行高效的計(jì)算。作者們?cè)谛请H爭(zhēng)霸游戲的單位控制測(cè)試環(huán)境中評(píng)估了 COMA 的表現(xiàn),使用了非常便于分別觀察的去中心化變量。與這個(gè)環(huán)境下的其它多智能體執(zhí)行者-批評(píng)者方法相比,COMA 的平均表現(xiàn)有顯著提高,而且 COMA 得到的最好的智能體的表現(xiàn)可以和頂尖的具有全狀態(tài)數(shù)據(jù)的中心化控制方法相提并論。
杰出論文提名 Outstanding Paper, Honorable Mention:《Generalized Adjustment Under Confounding and Selection Biases》
對(duì)選擇偏倚和混雜偏倚的泛化調(diào)節(jié)處理方法
論文摘要:選擇偏倚和混雜偏倚是限制常見推理方法在大尺度環(huán)境下使用的最常見的兩個(gè)障礙。在這篇論文中,作者們泛化了后門調(diào)節(jié)的想法,以便同時(shí)處理這兩種偏倚,并且在不引入選擇偏倚的情況下利用可能的外部數(shù)據(jù)(比如來(lái)自人口調(diào)查的數(shù)據(jù))。作者們介紹了調(diào)節(jié)對(duì)(adjustment pair)的思路,并展示了通過調(diào)節(jié)方法識(shí)別因果關(guān)系的完整圖形條件。作者們還進(jìn)一步設(shè)計(jì)了一個(gè)算法,以多項(xiàng)式形式列出所有可以處理的調(diào)節(jié)對(duì),對(duì)于希望評(píng)估以部分可處理的調(diào)節(jié)對(duì)的特定屬性(常見屬性包括開銷、變化、測(cè)量難度)的研究人員來(lái)說這會(huì)很有用。最后,作者們描述了一種統(tǒng)計(jì)性的估計(jì)過程,一旦確認(rèn)了某個(gè)設(shè)置是可以處理的就可以執(zhí)行這個(gè)過程;它可以用來(lái)處理有限樣本中的多種問題。
論文地址:https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e894003725afd00a.pdf
杰出學(xué)生論文提名 Outstanding Student Paper, Honorable Mention:《Adapting a Kidney Exchange Algorithm to Align with Human Values》
改造出和人類的價(jià)值一致的腎臟分配算法
論文摘要:如何高效分配有限的資源是經(jīng)濟(jì)學(xué)和計(jì)算機(jī)科學(xué)兩個(gè)領(lǐng)域共有的經(jīng)典問題。對(duì)于腎臟移植手術(shù)來(lái)說,通常會(huì)由一個(gè)中央市場(chǎng)把一切正常的腎臟捐贈(zèng)者分配給等待腎臟的病人。在腎臟分配中,病人和捐贈(zèng)者首先由委員會(huì)通過特設(shè)的權(quán)重決定優(yōu)先級(jí),然后輸入一個(gè)分配算法,由它決定哪個(gè)病人會(huì)分配到哪個(gè)捐贈(zèng)者 —— 以及決定哪個(gè)病人分配不到捐贈(zèng)者。在這篇論文中,作者們提出了一種端到端的方法用于在腎臟分配中根據(jù)每個(gè)病人的檔案估計(jì)權(quán)重。作者們首先從人類被試者獲取了一組他們認(rèn)為可以用于決定病人優(yōu)先級(jí)的屬性(比如醫(yī)療特征,生活方式等等)。然后作者們根據(jù)不同病人的檔案向被試者提問對(duì)比問題,并根據(jù)他們的回答嚴(yán)格地計(jì)算出各個(gè)屬性的權(quán)重。作者們展示了如何在腎臟分配市場(chǎng)的分配算法中使用這些權(quán)重。作者們接著在模擬環(huán)境下評(píng)估了這些權(quán)重的影響,發(fā)現(xiàn)他們算出的權(quán)重的精確值其實(shí)影響很小,實(shí)際上需要的只是由權(quán)重計(jì)算出的檔案的排序。不過,與完全不給病人排優(yōu)先級(jí)的情況相比,帶有權(quán)重的算法還是取得了更好的表現(xiàn),確實(shí)有部分類別的病人從前述的測(cè)試者的價(jià)值評(píng)價(jià)中獲得了優(yōu)先匹配(或者延后匹配)。
經(jīng)典論文 Classic Paper:《Algorithm and Tool for Automated Ontology Merging and Alignment》
自動(dòng)本體合并和對(duì)齊的算法及工具
這篇論文來(lái)自 2000 年的第 17 屆 AAAI 大會(huì)。這次頒獎(jiǎng)是為了表彰這篇論文在本體匹配和集成研究方面的先驅(qū)性貢獻(xiàn),論文中分析了這個(gè)問題的具體情況,并提出了首個(gè)創(chuàng)新的解決方案。
論文作者 Natasha Fridman Noy 應(yīng)邀在會(huì)議上進(jìn)行了演講,介紹了論文內(nèi)容以及這個(gè)問題研究的后續(xù)變遷,雷鋒網(wǎng) AI 科技評(píng)論也將為大家整理呈現(xiàn)演講內(nèi)容。請(qǐng)期待后續(xù)報(bào)道。
雷鋒網(wǎng) AI 科技評(píng)論報(bào)道
相關(guān)文章:
AAAI 2018全揭秘:1242篇中國(guó)投遞論文領(lǐng)跑全球,錄用數(shù)和美國(guó)平分秋色
AAAI 2018 六大前瞻亮點(diǎn)搶先看,BATJ、滴滴聚首學(xué)術(shù)頂會(huì)|AAAI 2018
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章