0
本文作者: 奕欣 | 2017-08-13 10:29 | 專題:KDD 2017 |
ACM SIGKDD 2017(知識發(fā)現(xiàn)與數(shù)據(jù)挖掘會議)于 8 月 13 日至 17 日在加拿大哈利法克斯正式召開。雷鋒網(wǎng)AI科技評論將從一線帶來精彩報道及內(nèi)容。
會議前一天下午,雷鋒網(wǎng)AI科技評論來到現(xiàn)場簽到時,發(fā)現(xiàn)主要的指示標志和前臺接待設施已經(jīng)布展完畢,也有不少與會人士陸續(xù)到現(xiàn)場簽到。
大會主席 Stan Matwin 、Yu Shipeng 及副主席 Faisal Farooq 分享了本次大會的一些感想:
「我們希望 KDD 2017 能夠讓您了解新的技術趨勢,從論文(包括 poster 及口頭展示)中得到啟示并在專業(yè)領域有所助益,發(fā)現(xiàn)新的工具、研究流程及實踐工作;確定新的工作機會或是招聘到心儀的人選。」
「數(shù)據(jù)科學」、「數(shù)據(jù)挖掘」和「大數(shù)據(jù)」,在過去幾年中已經(jīng)從研究實驗室走出,并出現(xiàn)于你我的日常生活中,甚至也出現(xiàn)在媒體領域和各級政府和企業(yè)的決策中。這些技術的影響涉及到每一個人。更重要的是,目前數(shù)據(jù)科學的快速發(fā)展得到了極大的推動——包括工業(yè)界人士及學術界人士。在過去,這些人一直是 KDD 會議的一道風景線,他們是理論與實踐的橋梁,是雙界交流的促進者和催化劑。在會議上,包括研究、應用數(shù)據(jù)科學及應用演講嘉賓等三個平行議程將會同期展開,將工業(yè)界與學術界人士緊密聯(lián)結在一起。
而這也正是 KDD 2017 的議程所具備的。雷鋒網(wǎng)了解議程后發(fā)現(xiàn),延續(xù)往年的慣例,KDD 2017 將非常大的比重留給了 tutorial 和 workshop 環(huán)節(jié)(第一天和第二天)。22 個各具特色的 tutorial 將從深度學習、數(shù)據(jù)挖掘、IOT 實戰(zhàn)應用等不同方面提供前沿觀點,此外還將穿插 8 個半天的 hands-on tutorial;而 22 個 workshop 則將在第二天進行;正會則要等到第三天才開始。
每年會議的Keynote自然是最重要的一個部分,KDD邀請了三個 Keynote 嘉賓,分別從數(shù)據(jù)挖掘的不同角度分享了工業(yè)界和學術界的前沿和未來:
Cynthia Dwork,微軟研究院杰出科學家/哈佛大學:《何謂公平?》
數(shù)據(jù),算法和系統(tǒng)中都嵌入了偏見,它反映了設計師的明顯和隱藏的選擇,歷史偏見和社會的優(yōu)先等級。 它們在字面上就不可避免地形成了價值觀。 算法的“不公平”,例如從廣告到再犯預測的不同任務,已經(jīng)在大眾媒體中引起了相當?shù)年P注。 這次演講將討論針對初期的數(shù)學嚴謹?shù)姆诸惡驮u分的公平性研究。
微軟研究的杰出科學家Cynthia Dwork以嚴謹?shù)臄?shù)學基礎為隱私保護數(shù)據(jù)分析而聞名。 這項工作的基石是差異隱私,強大的隱私保證通??梢垣@得高度準確的數(shù)據(jù)分析。 Dwork還在加密和分布式計算方面做出了突出貢獻。 她是美國國家科學院和美國國家工程學院的成員,也是美國藝術與科學學院院士,美國哲學社會學者。 從2017年1月開始,Dwork將是哈佛保爾森工程學院計算機科學系的Gordon McKay教授,拉德克利夫高級研究所的Radcliffe Alumnae教授,以及哈佛法學院的教授。
Bin Yu,UC 伯克利大學教授:《數(shù)據(jù)科學的三原則:可預測性、穩(wěn)定性與計算性》
在這個演講中,我將討論數(shù)據(jù)科學的三個原則在數(shù)據(jù)驅動決策中的重要性和聯(lián)系。預測的最終重要性在于,未來是所有人類在商業(yè),教育,研究和政府方面任何活動的獨特而且可能是唯一的目的。機器學習以預測為中心,以計算為核心,已經(jīng)實現(xiàn)了廣泛的數(shù)據(jù)驅動方面的成功。預測是檢查現(xiàn)實的有用途徑,良好的預測暗示著過去和未來之間的穩(wěn)定發(fā)展。穩(wěn)定性(相對于數(shù)據(jù)和模型擾動)也是數(shù)據(jù)驅動結果的可解釋性和可重復性的最低要求。它與不確定性評估密切相關。顯然,如果在沒有可行的計算算法的條件下,是不能采用預測和穩(wěn)定性的原理,因此可見可計算性的重要性。這三個原則將由分析聯(lián)系來表明,同時兩個正在進行的項目中證明,“數(shù)據(jù)智慧”也是不可或缺的。具體來說,第一個項目采用深度學習網(wǎng)絡(CNN)來了解難辨視覺皮層V4中神經(jīng)元的模式選擇性;第二個項目通過采用和比較不同潛變量模型和基于拉索的模型來預測政治電視廣告的黨派和語氣。
Bin Yu是加州大學伯克利分校統(tǒng)計學和電氣工程與計算機科學系的教授,也是伯克利統(tǒng)計局前任主席。她是北大統(tǒng)計與信息技術大學微軟聯(lián)合實驗室的創(chuàng)始人之一。她與基因組學,神經(jīng)科學和醫(yī)學科學家進行跨學科研究。為了解決這些領域的數(shù)據(jù)問題,她開發(fā)了統(tǒng)計學和機器學習方法/算法和理論,并結合領域知識和定量批判性思維進行整合。Bin Yu是美國國家科學院院士,美國藝術與科學學院成員。她是2006年的古根海姆 Fellow,2011年ICIAM的邀請演講人,2012年伯努利社會的圖基紀念講師,以及2016年立陶宛數(shù)學統(tǒng)計研究所講師。她在2013 - 2014年擔任IMS總裁,并且是IMS、ASA、AAAS、IEEE Fellow。
Renee J Miller,多倫多大學教授:《數(shù)據(jù)集成的未來》
數(shù)據(jù)集成時的形成的數(shù)據(jù)爆炸的價值。 在這次演講中,我提出過去二十年來數(shù)據(jù)整合方面的一些重要創(chuàng)新。 這其中包括數(shù)據(jù)交換,其為推理轉換數(shù)據(jù)的正確性以及在集成中使用聲明映射提供了基礎。 我還討論了數(shù)據(jù)挖掘如何用于促進數(shù)據(jù)集成,并呈現(xiàn)數(shù)據(jù)科學中出現(xiàn)的一些重要的新數(shù)據(jù)集成方面的挑戰(zhàn)。
RenéeJ. Miller是多倫多大學計算機科學系教授,加拿大貝爾信息系統(tǒng)主席。她是加拿大皇家學會、加拿大國家學院院士,ACM Fellow。她獲得了美國科學家和工程師的總統(tǒng)早期職業(yè)獎(PECASE),這是美國政府頒發(fā)的優(yōu)秀科學家和工程師從事職業(yè)生涯的最高榮譽。她獲得NSF職業(yè)榮譽獎,總理研究優(yōu)秀獎和IBM教授獎。她的研究主要在數(shù)據(jù)集成和數(shù)據(jù)管理領域。她和共同作者因為2003年頗有影響力的建立了數(shù)據(jù)交換的基礎的文章而獲得了ICDT測試時間獎。她曾擔任VLDB基金會董事會成員,并擔任捐贈基金會主席。她的研究由NSERC,NSF,IBM,SAP和Bell Canada等資助。她從威斯康星大學麥迪遜分校獲得計算機科學博士學位,并獲得麻省理工學院數(shù)學和認知科學學士學位。
此外,有 11 位專家及教授將從應用數(shù)據(jù)科學的角度闡述他們在數(shù)據(jù)科學領域的研究心得,名單如下:
而至于一直以低收錄率聞名的KDD,今年的投稿結果如何呢?官方統(tǒng)計數(shù)據(jù)如下:
今年的 KDD 研究領域的審核總論文數(shù)為 748 篇,收錄 130 篇,包括 64 篇 oral,66 篇 poster,錄用率分別占 8.6% 及 8.8%。
而應用數(shù)據(jù)科學領域共審核 390 篇論文,收錄 86 篇,包括 36 篇 oral,50 篇 poster,錄用率分別占 9.2% 和 12.6%。
論文詳細收錄名單如下:http://www.kdd.org/kdd2017/accepted-papers
鉆石贊助商:滴滴;
頂級贊助商:亞馬遜、微軟、阿里巴巴、facebook;
金牌贊助商:SAS、Captial One;
銀牌贊助商:Criteo Research、谷歌、Element AI、西門子、Linkedin
銅牌贊助商:華為、Booking.com、Honenywell、American Express、Oracle、Western Digital。
其他贊助商詳見官網(wǎng)頁面:http://www.kdd.org/kdd2017/sponsorship
值得一提的是,為了讓更多的學生和初創(chuàng)企業(yè)能夠減輕經(jīng)濟負擔來到現(xiàn)場,KDD 2017 提供了 14.5 萬美元學生差旅經(jīng)費和 25 萬美金的初創(chuàng)企業(yè)經(jīng)費?!肝覀兿M?KDD 2017」將會成為能讓研究者、實踐者、投資者的聚集之地,創(chuàng)造出更多創(chuàng)新算法及商業(yè)化的產(chǎn)品。」
雷鋒網(wǎng)AI科技評論也將從KDD 2017前線帶來更多消息。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。