8
本文作者: 董飛 | 2016-02-15 13:56 |
按:作者董飛,微信公號(hào):董老師在硅谷
昨天是虐狗節(jié),去年看過(guò)一篇文章,講如何通過(guò)大數(shù)據(jù)找到你的另一半(見文末參考資料),里面通過(guò)理性建模和精準(zhǔn)定位找到合適伴侶。不過(guò)大數(shù)據(jù)真有這么神奇么?我就隨便聊聊約會(huì)APP算法和現(xiàn)實(shí)中策略。
我們很多人抱怨現(xiàn)實(shí)中約會(huì)很難一下子找到宿命中的人,在線網(wǎng)站也讓找到真愛的幾率變大,操作又容易上手。據(jù)我所知,目前微信,陌陌,探探,世紀(jì)佳緣,match,tinder很多這樣的“嚴(yán)肅”交友(約會(huì))的工具,他們號(hào)稱采用大數(shù)據(jù)建立人物畫像,采用KNN聚合,DNN神經(jīng)網(wǎng)絡(luò),幫你提升匹配率,找到人生幸福另一半,事實(shí)上是這樣的嗎?
當(dāng)你把你的簡(jiǎn)歷在這種網(wǎng)站或者APP更新,一些算法就開始準(zhǔn)備潛在合拍的。然后給你打分,或者隨機(jī)給你幾個(gè)選。而這些結(jié)果基于也許就幾十個(gè),一般你回答幾個(gè)問(wèn)題,或者你產(chǎn)生的一些行為?;緮?shù)據(jù):年齡、身高…戶口所在地、畢業(yè)學(xué)校、工作單位、家庭狀況。一些網(wǎng)站最厲害的問(wèn)你100個(gè)問(wèn)題,什么喜歡的顏色,食物,運(yùn)動(dòng),偶像,喜歡看的書類型,然后開始關(guān)聯(lián)賬號(hào),微信,微博,比如微博、微信等社交媒體的內(nèi)容及更新頻率,QQ登錄及在線時(shí)間,更新發(fā)型頻率,作息時(shí)間規(guī)律,經(jīng)常出現(xiàn)的場(chǎng)所。
這些背后就是對(duì)用戶行為做預(yù)測(cè)和匹配,跟亞馬遜,Netflix去預(yù)測(cè)產(chǎn)品差不多,不同的話Netflix推薦電影給你,電影卻不需要反向去關(guān)注你。下面就介紹一個(gè)有趣的匹配算法。
1962年,美國(guó)數(shù)學(xué)家David Gale和Lloyd Shapley發(fā)明了一種尋找穩(wěn)定婚姻的策略,人們稱之為延遲認(rèn)可算法(Gale-Shapley算法)。
為了讓大家相信數(shù)學(xué)家不是真得如此無(wú)聊,我要指出它確確實(shí)實(shí)是一個(gè)地道的組合數(shù)學(xué)問(wèn)題,有其特定的數(shù)學(xué)價(jià)值。當(dāng)然啦,它也有很多別的背景和應(yīng)用,比如用來(lái)在若干個(gè)公司和應(yīng)聘者之間進(jìn)行招聘中介……但是數(shù)學(xué)家們?cè)趺磿?huì)放過(guò)如此八卦的一個(gè)名字呢?于是它就這樣流傳下來(lái)了。
規(guī)則如下:
先對(duì)所有男士進(jìn)行落選標(biāo)記,稱其為自由男。當(dāng)存在自由男時(shí),進(jìn)行以下操作:
①每一位自由男在所有尚未拒絕她的女士中選擇一位被他排名最優(yōu)先的女士;
②每一位女士將正在追求她的自由男與其當(dāng)前男友進(jìn)行比較,選擇其中排名優(yōu)先的男士作為其男友,即若自由男優(yōu)于當(dāng)前男友,則拋棄前男友;否則保留其男友,拒絕自由男。
③若某男士被其女友拋棄,重新變成自由男。
在算法執(zhí)行期間,自由男們主動(dòng)出擊,依次對(duì)最喜歡和次喜歡的女人求愛,一旦被接受,即失去自由身,進(jìn)入訂婚狀態(tài);而女人們則采取“守株待兔”和“喜新厭舊”策略,對(duì)前來(lái)求愛的男士進(jìn)行選擇:若該男子比未婚夫強(qiáng),則悔婚,選擇新的未婚夫;否則拒絕該男子的求婚。被女友拋棄的男人重獲自由身,重新?lián)碛辛俗非笈说臋?quán)利——當(dāng)然,新的追求對(duì)象比不過(guò)前女友。
這樣,在算法執(zhí)行期間,每個(gè)人都有可能訂婚多次——也有可能一開始就找到了自己的最愛,從一而終——每訂一次婚,女人們的選擇就會(huì)更有利,而男人們的品味則越來(lái)越差。只要男女生的數(shù)量相等,則經(jīng)過(guò)多輪求婚,訂婚,悔婚和再訂婚之后,每位男女最終都會(huì)找到合適的伴侶——雖然不一定是自己的最愛(男人沒能追到自己的最愛,或女人沒有等到自己的最愛來(lái)追求),但絕對(duì)不會(huì)出現(xiàn)“雖然彼此相愛,卻不能在一起”的悲劇,所有人都會(huì)組成穩(wěn)定的婚姻。
這個(gè)是數(shù)學(xué)界切切實(shí)實(shí)研究過(guò)的問(wèn)題。對(duì)于以前沒有接觸過(guò)這個(gè)問(wèn)題的人,這個(gè)理論最出人意外的結(jié)論是:傳統(tǒng)的求愛,結(jié)婚過(guò)程是male-optimal的,也就是說(shuō),男性能夠得到盡可能好的心上人,女性卻不然。這就是所謂的穩(wěn)定匹配問(wèn)題(StableMarriageProblem,也叫穩(wěn)定婚姻問(wèn)題)。
那么問(wèn)題來(lái)了,這些數(shù)據(jù)和計(jì)算之后的結(jié)果會(huì)導(dǎo)致更好的匹配嗎?我想還是不行。這些約會(huì)工具越來(lái)越多,成功的反而越少。伯克利大學(xué)還做過(guò)調(diào)查,比如說(shuō)美國(guó)人只有5%是從網(wǎng)上認(rèn)識(shí)建立長(zhǎng)期關(guān)系(only 5 percent of Americans in long-term partnerships met online. )
那個(gè)報(bào)告說(shuō)了幾點(diǎn)有意思的,個(gè)性習(xí)慣的相同對(duì)健康的兩性關(guān)系也沒啥幫助。就算算法再?gòu)?fù)雜,也對(duì)找到合適對(duì)象沒多少幫助,除非你把可能遇見的人數(shù)增加。
但最麻煩的還是用戶會(huì)說(shuō)謊,對(duì)他們多高,多重,收入,年齡都可能是瞎扯,如果給你選擇年薪3萬(wàn),30萬(wàn),在沒有任何信用的情況下,你選哪個(gè)?或者你隨便填個(gè)數(shù),你怎么不上天呢?這樣建立起來(lái)的模型有什么意義?
還有一點(diǎn),有些人號(hào)稱需要一些硬性指標(biāo)和條件,一定對(duì)方多高,多有錢,多牛逼,但真正相處,也許就不會(huì)這么要求了。然后就發(fā)現(xiàn)那些把錢放在考慮第一位的人,照樣dating藝術(shù)家或者彈吉他的。
有些交友網(wǎng)站,讓你去填個(gè)問(wèn)卷調(diào)查,什么心理分析,性格色彩,MBIT,喜歡的電影,(還有要填政治理想的!)如果拿這些作為匹配可能是誤區(qū),但換一個(gè)思路,通過(guò)用戶的活躍度和發(fā)布的朋友圈來(lái)做。那么這就得去監(jiān)控用戶行為,后臺(tái)將這些動(dòng)作作為依據(jù)去迭代模型。
這是個(gè)有趣問(wèn)題,老派的約會(huì)方式是去本地的PUB,比如你有1%的可能性對(duì)方同意要約,你得去100次才能搞定一個(gè)。而作為另外一方,應(yīng)該用什么策略來(lái)接受約會(huì)邀請(qǐng)?其實(shí)根據(jù)博弈論,拒絕掉前37%的你想要約會(huì)的人,然后挑選下一個(gè)出現(xiàn)的比前37%都要好的人。令人驚訝的是,你最終將找到真愛的幾率為37%,具體計(jì)算過(guò)程不展開了,參考文檔在最后。
其實(shí)通過(guò)這些網(wǎng)上APP,你極大增加曝光率,因?yàn)槌刈哟螅€可以加過(guò)濾,來(lái)個(gè)快速排序:)總體上這種方式未必浪漫,但高效啊。還有哪些方式去約呢,比如公司同事(讀到一個(gè)調(diào)查1/3的公司員工,包括上下屬約會(huì)也占很大比例),書店(聽說(shuō)高曉松老師剛開的書店還促成了眷侶),微博(我一個(gè)程序員朋友就這樣認(rèn)識(shí)他愛人后來(lái)結(jié)婚了),甚至微信公眾號(hào)留言都有可能。。。
最后啊,大數(shù)據(jù)能不能幫你找到對(duì)象,我還是持懷疑態(tài)度的,大數(shù)據(jù)是理性推理的工具,但人心是很善變的,女人心更是海底針,只能感慨一下:就算知道了所有的道理,還是過(guò)不好這一生。
【參考資料】
1、學(xué)以致用,光棍極客通過(guò)大數(shù)據(jù)搞定女朋友
4、Big Data Seeks Online Love [Infographic]
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。