丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

本文作者: 奕欣 2017-10-17 14:27
導(dǎo)語(yǔ):當(dāng)你在朋友圈、微博上發(fā)了個(gè)消息,你會(huì)知道其他人什么時(shí)候?qū)δ愕南⒆龀鲈u(píng)論嗎?

雷鋒網(wǎng)AI科技評(píng)論按:本文由清華大學(xué)媒體與網(wǎng)絡(luò)實(shí)驗(yàn)室以及邁阿密大學(xué)物理系共同合作完成,作者包括:余林韻(清華大學(xué)計(jì)算機(jī)系博士生,已畢業(yè)加入今日頭條人工智能實(shí)驗(yàn)室)、崔鵬(清華大學(xué)計(jì)算機(jī)系副教授、博士生導(dǎo)師)、宋超明(邁阿密大學(xué)物理系助理教授)、張?zhí)鞊P(yáng)(清華大學(xué)計(jì)算機(jī)系博士生)、楊士強(qiáng)(清華大學(xué)計(jì)算機(jī)系教授、博士生導(dǎo)師)。

在社交網(wǎng)絡(luò)中,用戶(hù)們會(huì)對(duì)周邊用戶(hù)的行為做出反應(yīng),這些在不同時(shí)間、空間發(fā)生的行為構(gòu)成了社交網(wǎng)絡(luò)中的信息流。其中,用戶(hù)與用戶(hù)間的交互行為是整個(gè)信息傳播過(guò)程中最微觀的指標(biāo),它對(duì)理解和揭示信息傳播過(guò)程的形成和演化機(jī)制起到了基石性的作用,對(duì)其進(jìn)行研究十分必要。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

目前,學(xué)界中已嘗試提出了一系列模型對(duì)用戶(hù)行為動(dòng)力學(xué)進(jìn)行刻畫(huà)。這當(dāng)中,大部分模型假設(shè)了個(gè)體與個(gè)體之間的相互作用是高度隨機(jī)的,遵循泊松過(guò)程。最近,一些工作在真實(shí)數(shù)據(jù)中發(fā)現(xiàn),個(gè)體行為在響應(yīng)時(shí)間維度(即一個(gè)人收到一個(gè)消息的時(shí)間到他做出一個(gè)響應(yīng)的時(shí)間之間的持續(xù)時(shí)間)以及事件間時(shí)間維度(即同一人相鄰兩個(gè)行為之間的持續(xù)時(shí)間)均存在非常奇異的模式:

  • 首先,絕大多數(shù)的響應(yīng)都產(chǎn)生于極短的時(shí)間范圍當(dāng)中,而有一些響應(yīng)存在長(zhǎng)時(shí)間停頓的現(xiàn)象,導(dǎo)致響應(yīng)時(shí)間出現(xiàn)了長(zhǎng)尾分布的現(xiàn)象,這與會(huì)生成出指數(shù)分布響應(yīng)的泊松過(guò)程的情況相悖;

  • 其次,最近的一些研究表明,人類(lèi)行為動(dòng)態(tài)的周期性規(guī)律,如工作-休息時(shí)間,會(huì)十分明顯地影響用戶(hù)行為的動(dòng)力學(xué)過(guò)程。

到底哪些才是用戶(hù)行為動(dòng)力學(xué)的基本要素?什么模型能夠呈現(xiàn)出這些現(xiàn)象?目前,這些問(wèn)題仍然沒(méi)有一個(gè)明確的答案。

本文探索了一個(gè)由500萬(wàn)用戶(hù)組成的大規(guī)模社交交互數(shù)據(jù)集,發(fā)現(xiàn)人類(lèi)的交互行為動(dòng)態(tài)呈現(xiàn)出極其復(fù)雜的特性。下圖展示了用戶(hù)交互行為在不同時(shí)間上的響應(yīng)時(shí)間密度函數(shù)Pt(τ)。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

用戶(hù)交互行為在不同時(shí)間上的響應(yīng)時(shí)間密度函數(shù)Pt(τ),橫坐標(biāo)為t,縱坐標(biāo)為τ

從圖中可以很明顯發(fā)現(xiàn):隨著響應(yīng)時(shí)長(zhǎng)的變化,用戶(hù)的活躍度也不斷發(fā)生變化。與此同時(shí),響應(yīng)時(shí)間密度函數(shù)在自然時(shí)間尺度也呈現(xiàn)出了周期性的變化趨勢(shì)。這些現(xiàn)象表明,社會(huì)用戶(hù)行為動(dòng)力學(xué)在多重時(shí)間維度均存在異質(zhì)性。盡管目前已有一些模型分別解決了用戶(hù)交互行為在響應(yīng)時(shí)間和人類(lèi)行為晝夜變化的規(guī)律,但是這些模型均無(wú)法同時(shí)對(duì)這兩個(gè)組成部分進(jìn)行建模,導(dǎo)致在對(duì)用戶(hù)交互行為進(jìn)行建模和預(yù)測(cè)時(shí)產(chǎn)生偏差。

為考慮復(fù)雜的等待時(shí)間模式和人類(lèi)不均勻的用戶(hù)行為活動(dòng),作者根據(jù)自然時(shí)間變量 t 和響應(yīng)時(shí)間變量 τ 設(shè)計(jì)了一個(gè)時(shí)序異質(zhì)生存框架。它嘗試回答如下問(wèn)題:

如果在時(shí)刻發(fā)生了一個(gè)事件,經(jīng)過(guò)一定時(shí)長(zhǎng)之后出現(xiàn)對(duì)此事件的回應(yīng)的概率是多少?如果經(jīng)過(guò)了一定時(shí)長(zhǎng)后仍然沒(méi)有發(fā)生回應(yīng),此時(shí)它(響應(yīng))發(fā)生的概率是多少?

根據(jù)框架的目標(biāo),作者提出了三個(gè)度量指標(biāo):

1.      概率密度函數(shù),記錄事件從t 開(kāi)始、響應(yīng)持續(xù)時(shí)間為τ(在τ時(shí)間之后發(fā)生回復(fù))的可能性。

2.      生存函數(shù),累計(jì)函數(shù)的倒函數(shù) 1-CDFt(τ) ,給出了在 t+τ 之前沒(méi)有發(fā)生響應(yīng)事件的概率。

3.      危險(xiǎn)函數(shù),或稱(chēng)作強(qiáng)度函數(shù),給出在t+τ時(shí)刻未發(fā)生響應(yīng)事件的條件響應(yīng)概率(t+τ時(shí)刻發(fā)生響應(yīng)事件相對(duì)所有在t+τ前未發(fā)生響應(yīng)事件的占比)。

給定這三個(gè)度量指標(biāo)中的任意一個(gè),另外兩個(gè)指標(biāo)也可被直接確定,其中危險(xiǎn)函數(shù)通常具有最簡(jiǎn)潔的表達(dá)形式。因此,在生存模型比較復(fù)雜的情況下,一般會(huì)采用刻畫(huà)危險(xiǎn)函數(shù)的方式進(jìn)行建模。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

由于這是一個(gè)設(shè)計(jì)在概率框架下的模型,我們可以通過(guò)最大化對(duì)數(shù)似然的方式進(jìn)行求解。利用微積分里的鏈?zhǔn)椒▌t,我們只需要求出危險(xiǎn)系數(shù)關(guān)于參數(shù)的偏導(dǎo),就能方便的通過(guò)擬牛頓法得到參數(shù)的結(jié)果。

通常情況下,用戶(hù)交互行為在自然時(shí)間和響應(yīng)時(shí)間二個(gè)維度中的密度函數(shù)過(guò)于復(fù)雜,導(dǎo)致難以直接設(shè)計(jì)可被理解的危險(xiǎn)函數(shù)。因此,我們利用了分治的思路以更好對(duì)危險(xiǎn)函數(shù)進(jìn)行建模:

  • 首先,我們需要算法設(shè)計(jì)一個(gè)拉伸函數(shù) ω(t),以表示用戶(hù)在不同自然時(shí)刻的活躍度;

  • 其次,算法還需要設(shè)計(jì)另一個(gè)響應(yīng)函數(shù) G(τ),用于刻畫(huà)在不同響應(yīng)時(shí)間τ上的回復(fù)強(qiáng)度的變化;

  • 最后,我們通過(guò)下式將以上兩個(gè)函數(shù)結(jié)合起來(lái)最終確定出危險(xiǎn)函數(shù)的形式:

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

通過(guò)這種分解方法,本模型可以很容易構(gòu)建出以前提出的所有模型。例如,當(dāng)拉伸函數(shù) ω(t) 在每個(gè)點(diǎn)保持相同的值(等于 1)時(shí),危險(xiǎn)函數(shù)將退化為: G(τ),等價(jià)于同質(zhì)的生存模型;另一方面,當(dāng)響應(yīng)函數(shù) G 保持不變時(shí),危險(xiǎn)函數(shù)將退化為:ω(t)乘以常數(shù)c,而此情況等價(jià)于異質(zhì)泊松過(guò)程。

綜上所述,同質(zhì)生存模型和異質(zhì)泊松過(guò)程所需要的所有特性都能通過(guò)這種分解模式在時(shí)序異質(zhì)生存框架中得到體現(xiàn)。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

針對(duì)本文研究數(shù)據(jù)集的用戶(hù)交互特性,我們?cè)O(shè)計(jì)了一個(gè)周期性的混合高斯模型來(lái)刻畫(huà)時(shí)間的拉伸屬性,之后,我們又設(shè)計(jì)了一個(gè)位移函數(shù)來(lái)刻畫(huà)不同回復(fù)時(shí)長(zhǎng)下的響應(yīng)強(qiáng)度。其中,位置參數(shù)β主要控制用戶(hù)的思考時(shí)間對(duì)短尺度回復(fù)時(shí)長(zhǎng)響應(yīng)強(qiáng)度的影響;形狀參數(shù)α主要控制中尺度回復(fù)時(shí)長(zhǎng)維度響應(yīng)強(qiáng)度的冪律衰減斜率;而比例參數(shù)λ0主要描述長(zhǎng)尺度回復(fù)時(shí)長(zhǎng)維度的響應(yīng)強(qiáng)度的指數(shù)衰減效應(yīng)。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

實(shí)驗(yàn)表明,我們的模型可以成功復(fù)現(xiàn)出社交交互數(shù)據(jù)集中用戶(hù)的交互行為模式。從下文展示的對(duì)比圖可發(fā)現(xiàn),我們的模型模擬生成的結(jié)果的用戶(hù)行為密度函數(shù)與真實(shí)情況是十分相似的。而在統(tǒng)計(jì)指標(biāo)的對(duì)比中,本模型成功使得 77.1% 的數(shù)據(jù)同時(shí)通過(guò)了響應(yīng)時(shí)長(zhǎng) KS-test 測(cè)試以及日常活躍度 KS-test 測(cè)試,準(zhǔn)確率相較已有方法提升了 36.6%。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

準(zhǔn)確率提升:36.6%

此外,由于我們模型的參數(shù)具有明確的物理意義,我們對(duì)模型中用戶(hù)響應(yīng)函數(shù)的參數(shù)進(jìn)行了進(jìn)一步分析,試圖挖掘出用戶(hù)的行為傾向。

首先,參數(shù)β的分布形式是一個(gè)有兩個(gè)峰的聯(lián)合分布。其中,接近0點(diǎn)的峰值表明,一大批網(wǎng)絡(luò)中的用戶(hù)是樂(lè)于不經(jīng)思考便無(wú)腦回復(fù)的。相比之下,另一部分用戶(hù)通常會(huì)在回復(fù)前對(duì)信息進(jìn)行更謹(jǐn)慎的判定和思考。對(duì)于后者,我們應(yīng)該更加專(zhuān)注于所發(fā)消息的品質(zhì),以吸引這部分用戶(hù)更好得幫助我們分享信息。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

參數(shù)α描述了不同時(shí)長(zhǎng)對(duì)用戶(hù)回復(fù)的影響。其中,當(dāng)α>0時(shí),回復(fù)概率隨時(shí)間流逝逐漸變低,是一個(gè)早衰過(guò)程;α=0時(shí),回復(fù)概率與時(shí)間無(wú)關(guān);α<0時(shí),回復(fù)概率隨時(shí)間流逝逐漸變高。

在我們的數(shù)據(jù)集中,參數(shù)α服從正態(tài)分布,其中有36.4%用戶(hù)α>0.01,對(duì)于這部分用戶(hù),他們回復(fù)概率隨時(shí)間流逝逐漸變低,因此,我們需要仔細(xì)考慮給這些用戶(hù)發(fā)消息的時(shí)間,以提升這些用戶(hù)回復(fù)消息的概率。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

最后,比例參數(shù)λ0主要控制了響應(yīng)時(shí)長(zhǎng)的指數(shù)衰減,在我們的數(shù)據(jù)集中,λ0服從了e-10的LogNormal分布,其較小的值說(shuō)明了網(wǎng)絡(luò)中的用戶(hù)對(duì)該網(wǎng)絡(luò)有著較大的粘性。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

總結(jié):本文提出了一個(gè)綜合性的時(shí)序異質(zhì)用戶(hù)動(dòng)力學(xué)生存框架,框架能夠同時(shí)對(duì)用戶(hù)交互行為在響應(yīng)時(shí)間維度和自然時(shí)間維度的影響進(jìn)行刻畫(huà)。通過(guò)為框架設(shè)計(jì)的一般性分解方案,該框架涵蓋了目前針對(duì)用戶(hù)交互動(dòng)力學(xué)行為設(shè)計(jì)的所有模型。

由于該框架是在概率框架下進(jìn)行設(shè)計(jì)的,模型可方便得通過(guò)最大似然法來(lái)進(jìn)行求解。之后,本文對(duì)一個(gè)大規(guī)模的社交網(wǎng)絡(luò)用戶(hù)交互行為數(shù)據(jù)集進(jìn)行了觀察,并根據(jù)其中的用戶(hù)行為特性進(jìn)行了針對(duì)性的建模,模型中的參數(shù)具有明確的物理意義,其數(shù)據(jù)分布有助于對(duì)社會(huì)動(dòng)態(tài)的基本規(guī)律進(jìn)一步進(jìn)行理解,并可針對(duì)性的為用戶(hù)設(shè)計(jì)推廣方案。實(shí)驗(yàn)證明,本模型可以成功復(fù)現(xiàn)出社交交互數(shù)據(jù)集中用戶(hù)的交互行為模式。相比當(dāng)前方法,模型在統(tǒng)計(jì)指標(biāo)上獲得了很大的提升。此外,模型在多個(gè)數(shù)據(jù)集上均展現(xiàn)出了很高的準(zhǔn)確率,表明其具有很強(qiáng)的泛化能力。

更多資訊,敬請(qǐng)關(guān)注雷鋒網(wǎng)AI科技評(píng)論。

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

更新了朋友圈&微博動(dòng)態(tài),好友何時(shí)會(huì)點(diǎn)贊評(píng)論?

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)