論文詳解：滴滴大數(shù)據(jù)預(yù)測用戶目的地，準(zhǔn)確率超90% | KDD 2017

本文作者： camel

編輯：郭奕欣

2017-08-14 18:06

專題：KDD 2017

導(dǎo)語：茫茫車潮，滴滴通過這些模型讓你快速打車。

雷鋒網(wǎng) AI科技評(píng)論按：在KDD 2017中滴滴研究院副院長葉杰平所帶的滴滴團(tuán)隊(duì)關(guān)于出租車組合優(yōu)化分單模型和目的地預(yù)測的論文《A Taxi Order Dispatch Model based On Combinatorial Optimization》被收錄。雷鋒網(wǎng)將對(duì)這篇論文進(jìn)行詳細(xì)解讀。

論文解讀

相比于在搜索引擎中找到一個(gè)想要的網(wǎng)頁，在茫茫車潮中匹配到一輛載你去目的地的車輛會(huì)更加復(fù)雜。因?yàn)榫W(wǎng)頁可以持續(xù)呈現(xiàn)一整天，甚至半個(gè)月；但車輛是高速移動(dòng)的，乘客和司機(jī)的相對(duì)位置一直在實(shí)時(shí)變動(dòng)。匹配的過程和方式也極其重要，在一個(gè)既定區(qū)域，乘客有很多，車輛也有很多，系統(tǒng)需要全局考慮區(qū)域內(nèi)的需求、供給，以毫秒級(jí)的速度進(jìn)行計(jì)算，實(shí)時(shí)地進(jìn)行最合理的分單，最大化用戶的出行效率和出行體驗(yàn)。

這篇論文中介紹在滴滴出租車中使用的基于組合優(yōu)化的分單模型，該模型相較于別的分單模型，整體成交率得到了提升。此外為了進(jìn)一步提高用戶叫車時(shí)的體驗(yàn)，滴滴還開發(fā)了一個(gè)目的地預(yù)測模型，能在用戶打開軟件時(shí)，2毫秒為用戶推薦出他最可能前往的地點(diǎn)。目前這一功能的預(yù)測準(zhǔn)確率已經(jīng)超過90%。

1、分單時(shí)優(yōu)化整體成交率

早期，出租車打車軟件的訂單分配主要聚焦在每個(gè)訂單與每個(gè)出租車司機(jī)的相關(guān)性算法上。當(dāng)一個(gè)乘客發(fā)起一單需求，系統(tǒng)會(huì)盡量匹配調(diào)度最近距離的司機(jī)，力圖讓接駕時(shí)間最短。然而此時(shí)往往會(huì)忽略到這些司機(jī)是否更適合其他訂單。

此前業(yè)界曾提出過一個(gè)基于多代理體系結(jié)構(gòu)的新模型NTuCab，它的目的是最小化乘客的等待時(shí)間和接駕距離。這一模型會(huì)將每個(gè)代理視為一個(gè)計(jì)算單元，它會(huì)同時(shí)計(jì)算處理N個(gè)訂單和司機(jī)的匹配，但一個(gè)訂單只會(huì)匹配一個(gè)出租車司機(jī)。如果一個(gè)出租車司機(jī)拒絕該訂單，系統(tǒng)才會(huì)轉(zhuǎn)發(fā)給下一司機(jī)。

然而這些方法的調(diào)度時(shí)間往往偏長，成功率較低。對(duì)此，滴滴出行提出了新的組合優(yōu)化方法。在這個(gè)模型中，一個(gè)訂單會(huì)播報(bào)給幾個(gè)出租車司機(jī)，當(dāng)多個(gè)出租車司機(jī)收到相同的訂單時(shí)，最先搶單的人會(huì)獲得訂單。如果訂單未被應(yīng)答，則進(jìn)入下一輪播單，直到它被出租車司機(jī)應(yīng)答或被乘客取消。而模型的目標(biāo)則是最大化訂單成交率，從而確保司機(jī)和乘客的出行體驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)也顯示，這一模型下打車的全局成功率比同類模型高出了4%。

在滴滴的模型中一個(gè)主要的改進(jìn)是使用“整體”的概念，即會(huì)整體考慮當(dāng)前時(shí)刻所有待分配司機(jī)和訂單群體的多對(duì)多的匹配問題。以成交率為優(yōu)化目標(biāo)，通過整體分配司機(jī)與乘客，提升乘客訂單的整體成交率。

模型的數(shù)學(xué)形式即：