0
本文作者: AI科技評論 | 2018-07-16 10:02 |
深度強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域的一個(gè)新研究熱點(diǎn),它以一種通用的形式將深度學(xué)習(xí)的感知能力與強(qiáng)化學(xué)習(xí)的決策能力相結(jié)合,并能通過端對端的學(xué)習(xí)方式實(shí)現(xiàn)從原始輸入到輸出的直接控制。自提出以來,在許多需要感知高維度原始輸入數(shù)據(jù)和決策控制的任務(wù)中,深度強(qiáng)化學(xué)習(xí)方法已取得了實(shí)質(zhì)性的突破。
本期 CCF YOCSEF 專題探索報(bào)告會“深度強(qiáng)化學(xué)習(xí)的理論、算法與應(yīng)用”邀請到了機(jī)器學(xué)習(xí)和大數(shù)據(jù)挖掘等領(lǐng)域重量級的專家學(xué)者做主題報(bào)告,就強(qiáng)化學(xué)習(xí)理論及應(yīng)用進(jìn)行學(xué)術(shù)探討,同時(shí)邀請工業(yè)界專家分享強(qiáng)化學(xué)習(xí)在現(xiàn)實(shí)場景中的應(yīng)用多智能體計(jì)算的幾個(gè)應(yīng)用,具體可圍繞強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)的前沿探討,深度強(qiáng)化學(xué)習(xí)的主要算法,AlphaGo-深度強(qiáng)化學(xué)習(xí)應(yīng)用例解,多智能體強(qiáng)化學(xué)習(xí)與智能駕駛應(yīng)用進(jìn)展,以及深度強(qiáng)化學(xué)習(xí)在游戲、機(jī)器人、自然語言處理等領(lǐng)域的應(yīng)用進(jìn)展展開。我們期望本次論壇能夠有效推動深度強(qiáng)化學(xué)習(xí)技術(shù)的發(fā)展,增進(jìn)領(lǐng)域?qū)W者間的交流與互動,使參加者在了解學(xué)科專題基礎(chǔ),提高理論水平的同時(shí),掌握本領(lǐng)域最新技術(shù)動態(tài),了解未來技術(shù)趨勢。
時(shí)間:7 月 29 日 9:00-17:20
地點(diǎn):北京中科院計(jì)算所,一層或四層報(bào)告廳(暫定)
報(bào)名鏈接:http://conf2.ccf.org.cn/TDS
中國計(jì)算機(jī)學(xué)會青年計(jì)算機(jī)科技論壇
CCF Young Computer Scientists & Engineers Forum
專題探索班
The CCF YOUNG THeme Discovery Symposium
深度強(qiáng)化學(xué)習(xí)的理論、算法與應(yīng)用
08:00--09:00 簽到
09:00--09:10 開幕式
09:10--09:20 合影
09:20--10:20 強(qiáng)化學(xué)習(xí)在滴滴的探索與實(shí)踐 (葉杰平)
10:20--10:40 茶歇
10:40--11:40 Towards robust and efficient Reinforcement learning (秦濤)
13:30--14:30 自然語言處理和搜索中的深度強(qiáng)化學(xué)習(xí)應(yīng)用 (黃民烈)
14:30--15:30 Interpretable Machine Learning Models via Neural Interaction Detection (劉燕)
15:30--15:50 茶歇
15:50--16:50 端到端事件感知-決策的深度策略梯度方法 (鄧志東)
16:50--17:20 總結(jié)&閉幕式
特邀講者:葉杰平 ( 滴滴副總裁、AI Labs主任、首席科學(xué)家 )
簡介: 滴滴副總裁、AI Labs主任、首席科學(xué)家,美國密西根大學(xué)終身教授及密西根大學(xué)大數(shù)據(jù)研究中心管理委員。葉杰平是機(jī)器學(xué)習(xí)領(lǐng)域國際領(lǐng)軍人物,主要從事機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘和大數(shù)據(jù)分析領(lǐng)域的研究,尤其在大規(guī)模稀疏模型學(xué)習(xí)中處于國際領(lǐng)先地位。曾擔(dān)任包括IEEETPAMI,DMKD,IEEETKDE,NIPS,ICML,KDD等多個(gè)國際頂級期刊編委及國際頂級會議程序委員會主席和領(lǐng)域主席。2010年獲得美國國家自然科學(xué)基金會生涯獎(NSF CAREER Award),2013年獲得KDD最佳學(xué)生論文獎。
特邀講者: 秦濤 ( 微軟亞洲研究院資深研究員/經(jīng)理 )
簡介: 秦濤博士,微軟亞洲研究院資深研究員/經(jīng)理,中國科學(xué)技術(shù)大學(xué)博士生導(dǎo)師。主要研究領(lǐng)域包括機(jī)器學(xué)習(xí)和人工智能(深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的算法設(shè)計(jì)、理論分析及在實(shí)際問題中的應(yīng)用),互聯(lián)網(wǎng)搜索與計(jì)算廣告,博弈論和多智能體系統(tǒng),在國際會議和期刊上發(fā)表學(xué)術(shù)論文100余篇。曾任SIGIR、ACML、AAMAS領(lǐng)域主席,擔(dān)任多個(gè)國際學(xué)術(shù)大會程序委員會成員,包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE,曾任多個(gè)國際學(xué)術(shù)研討會聯(lián)合主席。獲得《北京青年》2017年度年度“工匠精神·青年榜樣”獎。
特邀講者: 黃民烈( 清華大學(xué)副教授, 清華大學(xué)計(jì)算機(jī)系人工智能實(shí)驗(yàn)室副主任 )
簡介: 黃民烈,清華大學(xué)計(jì)算機(jī)系副教授,博士生導(dǎo)師,計(jì)算機(jī)系人工智能研究所副所長。研究興趣主要集中在人工智能、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí),自然語言處理如自動問答、人機(jī)對話系統(tǒng)、情感與情緒智能等。已超過60篇CCF A/B類論文發(fā)表在ACL、IJCAI等國際頂級和主流會議及期刊上。曾擔(dān)任多個(gè)國際頂級會議的領(lǐng)域主席或高級程序委員。 。
特邀講者: 劉燕( 滴滴AI Labs時(shí)空序列首席科學(xué)家,南加州大學(xué)計(jì)算機(jī)系終身教授)
簡介: 滴滴AI Labs時(shí)空序列首席科學(xué)家,南加州大學(xué)計(jì)算機(jī)系終身教授、機(jī)器學(xué)習(xí)中心主任。她在卡內(nèi)基梅隆大學(xué)獲得計(jì)算機(jī)碩士及博士學(xué)位。2006年-2010年在IBM研究院擔(dān)任研究員。她的主要研究項(xiàng)目是時(shí)間序列和時(shí)空序列數(shù)據(jù)的分析與學(xué)習(xí),曾經(jīng)多次組織該課題的研討會和邀請講座。研究成果被廣泛應(yīng)用到交通預(yù)測、醫(yī)療、環(huán)境、智能生產(chǎn)和其他領(lǐng)域中。她曾經(jīng)獲得美國國家科學(xué)基金會獎、大川基礎(chǔ)研究獎、ACM論文獎榮譽(yù)獎(全球計(jì)算機(jī)博士論文最高獎項(xiàng))、暹羅數(shù)據(jù)挖掘國際會議最佳論文獎,以及雅虎、IBM、Facebook學(xué)院獎。
特邀講者: 鄧志東 ( 清華大學(xué)教授 )
簡介: 清華大學(xué)計(jì)算機(jī)系長聘教授,博士生導(dǎo)師?,F(xiàn)為中國自動化學(xué)會智能自動化專業(yè)委員會主任,中國人工智能產(chǎn)業(yè)創(chuàng)新聯(lián)盟專家委主任委員, 新興產(chǎn)業(yè)百人會專家等。曾任國家863計(jì)劃智能機(jī)器人主題專家組組長助理(1998-2001)。1992年-1994年在清華大學(xué)計(jì)算機(jī)系從事人工神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)的博士后研究。1994年12月晉升為清華大學(xué)副教授,2000年晉升為教授。1996年-1997年在香港理工大學(xué)合作研究一年(對方聘用)。2001年-2003年在美國華盛頓大學(xué),作為客座教授合作研究兩年(對方聘用),期間曾參加美國DARPA和NSF項(xiàng)目。先后主持或參與973項(xiàng)目一級課題等國家級重點(diǎn)科研項(xiàng)目30余項(xiàng)。發(fā)表論文250余篇,其中被SCI收錄79篇(含SCIE 30篇),EI收錄123篇,參編教材或?qū)V?本。目前的研究方向包括:人工智能(深度神經(jīng)網(wǎng)絡(luò)、深度強(qiáng)化學(xué)習(xí))、計(jì)算神經(jīng)科學(xué)、無人駕駛汽車、先進(jìn)機(jī)器人等。曾從事的研究領(lǐng)域:虛擬現(xiàn)實(shí)(1998-2001)、無線傳感器網(wǎng)絡(luò)(2001-2009)、計(jì)算生物學(xué)(2002-2010)。
執(zhí)行主席: 唐 杰( 長聘副教授、清華大學(xué)計(jì)算機(jī)系副主任 )
簡介: CCF YOCSEF 學(xué)術(shù)委員會主席、CCF杰出會員、杰出演講者。清華-工程院知識智能聯(lián)合實(shí)驗(yàn)室主任。研究興趣包括:社會網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘和知識圖譜。發(fā)表論文200余篇,引用10000多次(個(gè)人h-指數(shù)52)。獲北京市科技進(jìn)步一等獎、人工智能學(xué)會科技進(jìn)步一等獎、首屆優(yōu)青和CCF青年科學(xué)家獎等。
執(zhí)行主席: 吳國斌( 科技合作總監(jiān),滴滴出行 )
簡介: CCF YOCSEF學(xué)術(shù)委員會學(xué)術(shù)秘書、CCF-滴滴大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室學(xué)術(shù)委員會委員?,F(xiàn)任滴滴出行科技合作總監(jiān),大數(shù)據(jù)分析與應(yīng)用技術(shù)國家工程實(shí)驗(yàn)室副主任,曾任職微軟亞洲研究院。
如參會,請于7月12--26日注冊繳費(fèi)。
報(bào)名鏈接:http://conf2.ccf.org.cn/TDS
聯(lián)系方式:yocsef@ccf.org.cn; Tel: (010)6267 0236轉(zhuǎn)17;
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。