0
本文作者: camel | 編輯:郭奕欣 | 2017-08-13 21:41 | 專題:KDD 2017 |
雷鋒網(wǎng) AI 科技評論按:本周末,每年一度的數(shù)據(jù)挖掘的頂級會議ACM SIGKDD在加拿大新斯科舍省省會哈利法克斯拉開了序幕,整個會議13號到17號,持續(xù)5天。在異國他鄉(xiāng)的頂尖國際會議上,雷鋒網(wǎng)AI科技評論發(fā)現(xiàn),不僅在收錄論文列表里頻頻出現(xiàn)中國人的名字,甚至連贊助商都有一系列的中國公司位列前排,其中“滴滴出行”則以鉆石贊助商的身份排在首要位置。這就引起了我們對滴滴在此次會議中活動的特別注意。
通過查找,雷鋒網(wǎng)發(fā)現(xiàn)滴滴在這次大會中共有4個活動:
14日下午13:30-14:20,在“城市計算”研討會中,滴滴副總裁、滴滴出行研究院副院長葉杰平將做一個關(guān)于“滴滴出行中的大數(shù)據(jù)”的受邀報告。
14日晚上19:00-22:00,論文報告“A Taxi Order Dispatch Model based On Combinatorial Optimization”。
15日中午12:30-13:30,滴滴在會展展位將會開啟一場精彩對話。
15日下午13:30-17:00,滴滴副總裁葉杰平也將在中國專場做一次報告。
目前滴滴平臺擁有4億用戶,日訂單量超過2000萬。在中國滴滴現(xiàn)在每天新增數(shù)據(jù)量有70TB+,每日處理數(shù)據(jù)4500TB,每日路徑規(guī)劃超200億次。所以滴滴平臺的大數(shù)據(jù)是毋庸置疑。滴滴如何把實時的交通信息整合在一塊,通過背后龐大復(fù)雜的算法和計算平臺做到實時、智能的決策,這將是非常值得關(guān)注的。通過葉杰平在之前的一些演講,我們可以發(fā)現(xiàn)人工智能、機器學習算法在滴滴出行的大數(shù)據(jù)處理中占據(jù)著極為重要的地位。據(jù)了解,最近滴滴更新了一版深度學習,其效果如何或許將在這次會議中對外揭曉。
作為其研究成果的論文報告也是非常值得關(guān)注的。在KDD官網(wǎng)上這篇論文《A Taxi Order Dispatch Model based On Combinatorial Optimization》的摘要如下:
出租車的應(yīng)用程序在世界各地非常受歡迎,因為它們?yōu)橛脩籼峁┝丝焖俚捻憫?yīng)時間和便利性。出租車預(yù)訂應(yīng)用程序的關(guān)鍵組成部分是調(diào)度系統(tǒng),該系統(tǒng)旨在提供駕駛員和車手之間的最佳匹配。傳統(tǒng)的調(diào)度系統(tǒng)依次向乘客派出出租車,其目的是最大化每個獨立訂單的司機接受率。但這種調(diào)度系統(tǒng)不能保證全局的成功率,這就會降低用戶在使用應(yīng)用程序時的體驗。在本文中,我們提出了一個新的調(diào)度系統(tǒng)來優(yōu)化多個訂單下的出租車調(diào)度。這個系統(tǒng)旨在最大化全局調(diào)度的成功率,從而優(yōu)化整體的交通效率,給用戶帶來更好的體驗。為了進一步提升用戶體驗,我們還提出了一種在開啟出租車預(yù)約APP時預(yù)測用戶目的地的方法。這種方法使用了貝葉斯結(jié)構(gòu)來根據(jù)他/她的旅行歷史來對用戶的目的地的分布進行建模。
我們使用A/B測試比較了我們新的出租車調(diào)度方法與從北京收集的數(shù)據(jù)建立的最先進的模型。實驗結(jié)果表明,該方法在全局成功率(從80%增加到84%)方面優(yōu)于其他最先進的模型。此外我們還對其他指標(如用戶的等待時間和接收距離)進行了顯著改善。我們將表明,我們的目標預(yù)測算法優(yōu)于基于KNN方法的基準模型,與精度排名前三的模型相比,我們的精度提升了89% - 93%。這種新的出租車調(diào)度和目的地預(yù)測算法已經(jīng)部署在我們的在線系統(tǒng)中,每天為數(shù)千萬用戶服務(wù)。
論文下載:A Taxi Order Dispatch Model based On Combinatorial Optimization
此外,還有一篇入選論文《The Simpler The Better: A Unified Approach to Predicting Original Taxi Demands based on Large-Scale Online Platforms》,雖然不在滴滴的活動列表中,但有滴滴副總裁葉杰平和Jie Wang的參與研究(其他研究者還有北航的Yongxin Tong, 第四范式的陳雨強,蘇黎世聯(lián)邦理工的Zimu Zhou,香港科大的陳雷和楊強)。摘要如下:
Author(s): Yongxin Tong (Beihang University);Yuqiang Chen (4Paradigm Inc.);Zimu Zhou (ETH Zurich);Lei Chen (Hong Kong University of Science and Technology);Jie Wang (Didi Research);Qiang Yang (Hong Kong University of Science and Technology);Jieping Ye (Didi Research)
出租車應(yīng)用程序現(xiàn)在越來越受歡迎,因為它們能有效地為有需要的乘客派遣空閑的出租車。為了更精確地平衡出租車的供應(yīng)和需求,在線出租車平臺必須預(yù)測單元出租車需求(UOTD),也即單位時間(例如每小時)、單位面積(例如每POI)發(fā)起的出租車需求數(shù)。UOTD的預(yù)測對于大型在線出租車平臺來說是沒有意義的,因為對它們來說精確性和靈活性是至關(guān)重要的。復(fù)雜的非線性模型(如GBRT和深度學習)通常是精確的,但在情景變化(例如新的規(guī)定導(dǎo)致的額外限制)后就需要大量的工作來重新設(shè)計模型了。為了精確地預(yù)測UOTD,同時保持靈活的情景變化,我們提出了LinUOTD,這是一個具有超過200萬維特征的統(tǒng)一線性回歸模型。這個簡單的模型結(jié)構(gòu)消除了模型重設(shè)計的需要,而且高維特征有助于精確地預(yù)測UOTD。此外,我們設(shè)計了一系列優(yōu)化技術(shù)用于高效的模型訓(xùn)練和更新。我們使用了兩個來自在線出租車平臺的大型數(shù)據(jù)集進行的評估證明了LinUOTD在精確性方面優(yōu)于流行的非線性模型。我們認為我們在UOTD預(yù)測中使用地高維特征的簡單的線性模型可以作為一個試點研究,它可以應(yīng)用到深入了解其他工業(yè)大規(guī)模時空預(yù)測的問題當中。
2015年5月,滴滴正式成立機器學習研究院,將機器學習大規(guī)模應(yīng)用在出行領(lǐng)域;2016年4月,滴滴機器學習研究院升級為滴滴研究院, 目前其研究項目包括ETA、動態(tài)調(diào)價、智能分單、拼車、供需預(yù)測、運力調(diào)度、熱力圖等核心項目,研究方向則包括機器學習、計算機視覺、人工智能、數(shù)據(jù)挖掘、最優(yōu)化理論、分布式計算等。在今年3月滴滴出行又宣布在美國加州硅谷成立滴滴美國研究院,把挖人的觸角直接伸到了美國硅谷。從2012年的微不足道,短短五年已至如此,其成長不可謂不迅猛。
SIGKDD 2017大會將有更多精彩呈現(xiàn),雷鋒網(wǎng)AI科技評論將從一線帶來精彩報道及內(nèi)容。
相關(guān)文章:
KDD 2017在即,Keynote內(nèi)容搶先看|KDD 2017
KDD 2017現(xiàn)場探營:務(wù)實、豐富,數(shù)據(jù)大爆炸的盛會即將開啟 | KDD 2017
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。