0
本文作者: 奕欣 | 2017-06-10 13:47 |
上個月,人工智能與多智能體頂級會議 AAMAS-17 在巴西順利舉行。而其中,憑借「Stability of generalized two-sided markets with transaction thresholds」論文獲得最佳論文和最佳學生論文提名的唐平中博士也參加了本次大會。在雷鋒網(wǎng)的邀請下,唐博士向我們闡述了他參加大會的一些心得以及他對于交叉學科的一些思考。
唐平中博士是清華大學交叉信息研究院青年千人助理教授(2012 – 至今),博士生導師,計算經濟學研究室主任。在加入清華大學之前,他在美國卡耐基梅隆大學計算機系從事了兩年的博士后研究員工作,師從 Tuomas Sandholm 教授從事人工智能、拍賣、腎臟交換和機制設計的研究工作。他于 2010 在香港科技大學計算機系獲得博士學位,在林方真教授的指導下進行人工智能與經濟學交叉學科的研究。他曾在斯坦福大學計算機系(2008-2009),哈佛大學計算機系(2010),微軟亞洲研究院(2013)以及加州大學伯克利分校(2015)從事訪問研究工作。
唐平中博士的研究興趣是人工智能及多智能體系統(tǒng),專注于互聯(lián)網(wǎng)背景下計算機科學與經濟學的交互,包括機制設計,市場設計,拍賣和博弈,并將其理論應用于電子商務,互聯(lián)網(wǎng)廣告等相關的領域。他在該領域著名會議及期刊發(fā)表論文四十余篇,獲得 IJCAI-15 媒體論文獎和 AAMAS-17 最佳論文和最佳學生論文提名,并將于國際人工智能大會 IJCAI-2017 作青年事業(yè)獎特邀報告(Early career spotlight talk)。他是中組部青年和微軟研究院鑄星計劃的入選者,并擔任國家自然科學基金中國-以色列國際合作項目中方首席科學家。
唐平中博士致力于將科研成果應用于互聯(lián)網(wǎng)企業(yè),包括百度,阿里,谷歌等頂級互聯(lián)網(wǎng)企業(yè)。提出的解決方案包括百度搜索廣告中的保留價項目,淘寶平臺的防刷單流量分配算法和滴滴拼車的動態(tài)定價算法。
1. 近期您的論文「Stability of generalized two-sided markets with transaction thresholds」近期獲得了人工智能頂級會議之一 AAMAS-2017 的最佳論文和最佳學生論文雙料提名,請問老師是否能簡單介紹一下團隊所做的工作?
這個工作源于我國西北甘肅省石羊河流域的水權市場設計。眾所周知,西北尤其是甘肅的干旱問題非常嚴重。當?shù)卣疄榱司徑飧珊祮栴},設計了兩級的水權市場。一級市場由政府設計,旨在年初將總水量按往年需求分配給各個村莊。年中隨時間進展,每個村莊的需求發(fā)生動態(tài)變化,需要設計一個二級市場來讓村莊之間進行交易,有盈余的村莊將水權賣給有需求的村莊,從而進一步達到水資源的有效分配。之前設計的二級市場提供一個接口,由各村莊輸入買賣單,由工作人員手動將這些買賣單進行匹配,效率十分低,而且很難優(yōu)化。
我們在 [Liu, et. al. AAAI-16] (雷鋒網(wǎng)注:指「Optimizing Trading Assignments in Water Right Markets」)這篇論文中,首次證明了這個問題是 SNP-Hard(通俗地說,如果有二十個村莊,手動匹配幾乎沒有任何可能找到最優(yōu)匹配),并提供了快速算法,能夠有效地在現(xiàn)有規(guī)模上計算出最優(yōu)匹配。
現(xiàn)在的問題是,能夠計算出最優(yōu)匹配并沒有完全解決問題:村和村的之間將以多少價格進行交易并沒有說清楚。按照當?shù)亓晳T,村和村之間還需要討價還價,這使得交易效率降低,而且更直接的后果是有些村莊由于最后價格不滿意,取消交易。
在 AAMAS-2017 這篇論文中,我們提出了搭配最優(yōu)匹配的定價,并證明該定價能夠最大程度的滿足各村的交易動機,促進村和村之間的交易??偨Y一下,AAAI-2016 加 AAMAS-2017 兩個工作從計算和經濟兩個角度組合出擊,解決了水權市場的設計難題。該工作最近得到了水利方面專家的極大認可,目前正在和清華水利系以及當?shù)卣黄鸷献?,推進該系統(tǒng)落地。
市場設計與定價是經濟學和計算機科學交叉學科的熱門課題之一,被認為是經濟學中的「工程學」。計算機科學(尤其是 AI)一方面能夠設計有效的算法,將復雜的經濟學機制實現(xiàn),又能夠利用機制運行中產生的數(shù)據(jù)進一步優(yōu)化設計。
2. 本次參加 AAMAS 2017,縱觀會議全場,您有看到什么新的研究趨勢嗎?在論文的投遞情況和主題的選擇上,您有發(fā)現(xiàn)什么有意思的現(xiàn)象么?
會前的一個猜測是關于深度學習等熱門方向的論文數(shù)量會增加,但據(jù)我觀察,這方面的論文還比較少。原因之一可能是深度學習在多智能體系統(tǒng)的應用還比較初步,像圍棋和撲克等方向的兩人博弈技術也暫時難以擴展到多智能體系統(tǒng)??傮w的主題分布跟往年類似,偏應用(博弈或強化學習等)的文章較往年略有增加。
3. AAMAS 現(xiàn)在同樣是中國學者關注的重點會議之一。今年中國學者論文的投遞情況如何?有哪些中國企業(yè)也向本次會議投遞了論文?是否能談談您所了解到的國內人工智能發(fā)展近況?
AAMAS community 近年來在國內發(fā)展非常良好。現(xiàn)有一個兩百多人的多智能體學組,并定期組織高水平的線上線下講座。據(jù)我局限地了解,今年國內參會的高校包括清華大學、南京大學、廈門大學、華中科技大學、重慶大學等,企業(yè)包括阿里巴巴和百度也在會議上有論文發(fā)表。我組內的學生今年在 AAMAS 發(fā)表了六篇論文,其中有兩篇是學生獨立完成。
國內的人工智能發(fā)展是個非常大的話題。我個人喜歡的研究是從科學的本源出發(fā),結合具體場景提煉出有價值的新問題,并提出新方法進行解決。這可以是純理論問題,也可以是結合具體場景的應用。國內各大 IT 企業(yè)的迅猛發(fā)展給國內的研究者提供了非常好的場景和機遇,做引領世界的科研。
4. AI for social good 是一個社會熱門議題,能否結合您的一些研究工作,談談可以從哪些角度出發(fā),用 AI 改善社會生活?
之前提到的水權市場的設計和優(yōu)化就是一個非常典型的例子。事實上,在學術圈內現(xiàn)在主推的一個主題叫做 computational substanability,就是用計算方法幫助可持續(xù)發(fā)展。這里面包括關于腎臟交換與匹配機制的設計,幫助腎病患者和捐贈者進行更有效的匹配,我們組在這個方向有一系列的工作。也包括利用博弈方法保護公共資源(如野生動物)等。南洋理工的安波教授和 CMU 的新晉教授方飛在這個方向也有一系列的工作(雷鋒網(wǎng)按:安波博士此前也接受過雷鋒網(wǎng)的采訪,詳情請點擊《能玩德?lián)湟材鼙U蠂野踩?,南洋理工安波博士闡述算法博弈論的魅力何在?》查看)。我們組最近和滴滴公司合作,用 AI 等技術優(yōu)化現(xiàn)有的定價和匹配算法,優(yōu)化出行效率減少擁堵,也是用 AI 改善社會生活的一個例子。
5. 算法機制設計(algorithmic mechanism design)是一個客觀的過程,但人在決策的過程中很難做到絕對理性,那么在這個過程中,如何兼顧人作為個體在決策中所起的作用?
傳統(tǒng)的機制設計和算法機制設計都基于完全理性假設,忽略了個體行為數(shù)據(jù)。在現(xiàn)實場景中,完全理性很難滿足,使得設計的機制并不能達到理想的效果。如何在博弈模型中結合機制運行產生的個體數(shù)據(jù)是學術和工業(yè)界共同關心的話題之一。可以參閱我近期為國際人工智能大會 IJCAI-2017 寫的一篇特邀論文「Reinforcement mechanism design」。里面提到了近年來我們組在這個方向上的初步探索,即將強化學習的思想結合行為經濟學建模,應用到傳統(tǒng)的機制設計框架中。
6. 了解到唐老師曾經參與百度搜索廣告中的個性化保留價項目,那么如何更好地通過博弈論、拍賣理論及機制設計的結合實現(xiàn)計算廣告領域的市場設計?有哪些設計的難點?
博弈論和拍賣理論在廣告拍賣這個場景下提供了一類經典的模型,但是事實上這類經典的模型還有較大的優(yōu)化空間。因此搜索引擎會花大量的人力物力對經典模型進行優(yōu)化。這里面就涉及到剛剛提及的模型與數(shù)據(jù)結合的問題,也涉及到公平性和經濟利益的權衡問題,是非常前沿的學術問題。
7. 去年您的團隊與阿里合作,提出基于博弈論與優(yōu)化的方案,以解決「商家刷單提升信用問題」,并憑借論文「Mechanism Design for Personalized Recommender Systems」發(fā)表于 ACM RecSys 2016,是否能請?zhí)评蠋熃榻B一下該合作項目的主要過程及目前進展?另外,這個項目也被「中青教育」列為「清華最有趣的十大前沿研究」,那么您個人認為這是一個「有趣」的研究嗎?
刷單問題可謂電子商務最頭疼的問題,指電商平臺上的賣家利用各種手段增加近期交易數(shù)量和評分,從而讓自己在接下來的搜索結果中排名靠前,獲得更多的購買流量。這是一個典型的算法設計問題中(如協(xié)同過濾)沒有考慮到個體的策略性動機所帶來的負面結果。結合博弈理論,我們在 Recsys 這個工作中對這類策略性問題進行了分析,設計了一系列防刷單的排序機制,并在仿真實驗中取得了好的效果。該項目還在進一步進展當中,目前的進展是用一個深度神經網(wǎng)絡替代原有的行為模型,用神經網(wǎng)絡來描述賣家的行為,這個建模對性能提升很大,近期提交到 NIPS 2017 并在審稿中。
8. 唐老師您有著與互聯(lián)網(wǎng)企業(yè)的合作經驗,包括百度、阿里、谷歌等公司。想了解下,您作為一名奮斗在學術一線的科研人員,是否能談談與工業(yè)界合作和做科研的不同之處?
工業(yè)界中很多問題都非常的繁雜,處理起來毫無美感可言;在學術界則可以做一些理論假設規(guī)避這些繁雜,得到比較干凈漂亮的結果。最后還是看研究者本人的滿足感來自何處,是追求實際應用的滿足感,還是漂亮理論的滿足感;工業(yè)界的大多數(shù)問題都是經濟效益驅動的,而學術界則有更多可能,科研人員可以憑興趣研究很多更有意義的問題。此外在高校的滿足感還有很大一部分來自于把自己的知識和經驗傳授給學生們,和同學們一起進步,這個滿足感是工業(yè)界無法獲得的。
9. 作為一位交叉信息研究專家,想了解下老師是如何與這個領域結緣的?
我博士期間的導師林方真 (HKUST),Yoav Shoham(Stanford) 和博士后導師 Tuomas Sandholm(CMU)都是 AI 和經濟學交叉領域的專家,所以對我而言研究這個領域是非常自然的選擇。這個選擇跟我們院長姚期智院士在清華大學成立交叉信息研究院的視野是一致的。
10. 計算機科學與經濟學的交互涵蓋了包括機制設計、市場設計、拍賣和博弈等內容。所涵蓋的知識面大,考慮的內容更加復雜。它們兩者各有怎樣的特點?老師在選擇研究方向和選題的時候,如何綜合兩者的特點進行考慮?
經濟學模型偏抽象,旨在用通用的模型解釋一大類社會問題;計算機模型偏具體,旨在用建設性的算法在特定場景中實現(xiàn)模型。在選題時應考慮到二者的平衡點和自身的學術背景進行研究。
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。