丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

本文作者: 奕欣 2017-09-09 12:15
導(dǎo)語:我們能不能基于歷史觀測數(shù)據(jù)進行因果效應(yīng)評估?

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

via hitbullseye

雷鋒網(wǎng)AI科技評論按:ACM SIGKDD 國際會議(簡稱KDD)是由ACM的知識發(fā)現(xiàn)及數(shù)據(jù)挖掘?qū)N瘯⊿IGKDD)主辦的數(shù)據(jù)挖掘研究領(lǐng)域的頂級學(xué)術(shù)會議。雷鋒網(wǎng)AI科技評論今年也來到了KDD 2017現(xiàn)場做了覆蓋和報道。參與本次KDD的清華大學(xué)博士生況琨受雷鋒網(wǎng)AI科技評論獨家邀請,介紹他與導(dǎo)師楊士強博士、崔鵬博士、黎波(清華大學(xué))和蔣朦(UIUC)的工作《Estimating Treatment Effect in the Wild via Differentiated Confounder Balancing》。

論文地址:http://www.kdd.org/kdd2017/papers/view/estimating-treatment-effect-in-the-wild-via-differentiated-confounder-balan

在當今大數(shù)據(jù)時代,在廣告、醫(yī)療等各個領(lǐng)域都積累了海量歷史數(shù)據(jù)。同時,大量高效的機器學(xué)習(xí)和數(shù)據(jù)挖掘算法提出,使得我們能更有效的利用大數(shù)據(jù)對未來數(shù)據(jù)點進行預(yù)測。在預(yù)測導(dǎo)向的問題上,大部分算法都取得了不錯的效果。但是,由于絕大多數(shù)預(yù)測算法缺乏可解釋性,導(dǎo)致其很難應(yīng)用于許多實際問題上,尤其是那些需要進行決策制定的問題。因此,如何提高這些算法的可解釋性,不管對于學(xué)術(shù)界還是工業(yè)界都十分重要。

拿醫(yī)療領(lǐng)域舉個例子。假設(shè)在整個醫(yī)療系統(tǒng)中,我們擁有 100 萬流感病人數(shù)據(jù)。對于每一位病人,我們知道其過往病史、診斷歷史、常用藥物、基因測試以及年齡性別等特征?,F(xiàn)在,醫(yī)院來了為新病人 Anna,我們知道 Anna 是亞洲人,54 歲,得了流感,伴頭疼鬧熱發(fā)燒等癥狀。Anna 問醫(yī)生,哪種治療能最有效地治療其流感。因此,醫(yī)生就需要做出決策,到底是給 Anna 服用藥物 A (Tylenol),還是藥物 B (Sudafed),或者是其他藥物。作為數(shù)據(jù)科學(xué)家,基于這些數(shù)據(jù),我們能不能利用我們的機器學(xué)習(xí)和數(shù)據(jù)挖掘算法幫助醫(yī)生進行正確的藥物決策呢?

當然,最簡單的,我們可以構(gòu)造一個回歸模型,通過病人的特征(X)加上藥物決策(A/B)來回歸預(yù)測藥效(Y)。通過回歸模型學(xué)習(xí),我們能很容易地預(yù)測 Anna 在服用藥物 A 或 B 之后的藥效,并通過藥效差異來進行藥物決策。

 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

回歸模型進行決策制定

但是,我們認為類似于上述基于關(guān)聯(lián)分析的算法是不足以解決決策制定問題的。主要原因如下:

第一,數(shù)據(jù)中變量之間的依賴性。我們知道,在真實數(shù)據(jù)中,病人的一些特征,如收入,往往會影響病人對藥物的選擇。也就是說病人特征和藥物的選擇并不是獨立關(guān)系。而在很多關(guān)聯(lián)分析模型中,他們假設(shè)數(shù)據(jù)中變量關(guān)系是獨立的。忽略數(shù)據(jù)變量依賴性,會導(dǎo)致我們很難評估每個藥物的實際療效,很容易使得我們做出錯誤決定。

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

關(guān)聯(lián)分析模型不足以解決決策制定問題

例如,在醫(yī)療歷史數(shù)據(jù)中,我們發(fā)現(xiàn)對于大多數(shù)身體健壯的病人,即使不服用任何藥物,最后病情恢復(fù)的也很快;而對于身體虛弱的病人,即使服用了相關(guān)的藥物,其最后療效也不是非常好?;谶@個簡單的數(shù)據(jù),關(guān)聯(lián)分析模型會挖掘出錯誤的覺果:「不服用任何藥物對病人反而更好」。

第二個原因是:關(guān)聯(lián)并不代表因果。也就是說兩個變量之間存在關(guān)聯(lián)關(guān)系,但其并不一定存在因果關(guān)系。如果不存在因果關(guān)系,那么就不能進行決策制定。例如,基于觀測,我們發(fā)現(xiàn)某地冰激凌銷量跟當?shù)仄囅ɑ痤l率十分相關(guān)?;谟^測數(shù)據(jù),我們能通過冰激銷量準確預(yù)測汽車熄火頻率。但是我們并不能通過控制冰激凌銷量來達到減少汽車熄火頻率的目的,原因就是冰激凌銷量跟汽車熄火之間并不存在任何因果關(guān)系。冰激凌銷量之所以和汽車熄火頻率十分相關(guān),是因為受炎熱天氣影響。

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

冰激凌銷量和汽車熄火頻率十分相關(guān)

因此,我們認為關(guān)聯(lián)分析模型不足以解決決策制定問題。

因果推理(Causal Inference)是一個用于決策制定等問題的強大統(tǒng)計建模工具。因果推理中一個根本的問題是因果效應(yīng)評估,常用的方法是隨機對照試驗,例如 A/B Testing,通過控制兩組樣本特征一樣,然后給予不同的治療并比較其最終輸出的差異來評估藥物對患者的因果效應(yīng)。但是完全的隨機對照試驗代價往往非常昂貴,而且在很多涉及倫理道德的問題上甚至不可行。因此,處于大數(shù)據(jù)時代的我們就在思考這樣一個問題:我們能不能基于歷史觀測數(shù)據(jù)進行因果效應(yīng)評估?

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

因果推斷框架

這個問題的相關(guān)工作主要有如下兩塊:

  1. Propensity Score Based Methods,包括 Inverse Propensity Weight 和 Doubly Robust 方法。這些方法首先需要對 Propensity Score 進行評估,然后通過 Propensity Score 加權(quán)樣本使得不同 Treatment 組之間的特征 Confounder X 分布是一樣的(可以理解為逼近隨機對照試驗或者 AA Testing),并進行因果效應(yīng)評估。但是,此類方法的最大缺陷是需要先驗知識進行對 Confounder X 和 Treatment T 之間的模型進行假設(shè)。然而,我們知道在大數(shù)據(jù)背景下,我們常常擁有大量的觀測變量,我們很難知道變量之間的模型結(jié)構(gòu),因此我們在計算因果效應(yīng)時不能進行模型假設(shè)。

  2. Directly Variable Balancing Methods,例如 Entropy Balancing 和 Approximate Residual Balancing 方法。這些方法的 Motivation 在于變量的分布由其矩(Moments)唯一決定,因此通過矩可以控制不同 Treatment 組間變量平衡。但是這類方法將所有的觀測變量都進行了同等平衡,包括那些不會影響 Treatment T 的一些無關(guān)變量。然而,在大數(shù)據(jù)背景下,并不是所有的變量都需要平衡,而且不同變量需要平衡的權(quán)重也不一樣。

因此,本文認為在大數(shù)據(jù)背景下進行因果效應(yīng)評估,存在如下兩個挑戰(zhàn):

  • 一是變量之間關(guān)系和模型的未知性,導(dǎo)致我們在進行因果效應(yīng)評估時不能進行模型假設(shè)。

  • 二是高維變量和噪聲數(shù)據(jù)的影響,并不是所有的變量都需要平衡,而且不同變量需要的平衡權(quán)重不一樣。

為了解決以上挑戰(zhàn),本文提出了 Differentiated Confounder Balancing 算法,通過同時學(xué)習(xí) Confounder Weights β 和 Sample Weights W 進行因果效應(yīng)評估。其中 Confounder Weights 決定哪些觀測變量是 Confounder 以及其產(chǎn)生的 Confounding Bias 權(quán)重,而 Sample Weights 則用來控制 Treated 組(T=1)和 Control 組(T=0)之間的 Confounder X 分布相似。

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

Ideas on Differentiated Confounder Balancing Algorithm

但是我們?nèi)绾稳W(xué)習(xí)這些 Confounder Weights 和 Sample Weights 呢?

首先,學(xué)習(xí) Confounder Weights. 在因果推理框架中,X,T 和 Y 之間的一般關(guān)系可以如下表示:

 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

從中我們可以得到真實的因果效應(yīng) ATT 的表達式??紤]函數(shù) f(X) 的一般形式: 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

我們從理論上發(fā)現(xiàn),我們實際評估的因果效應(yīng)清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估與實際的因果效應(yīng) ATT 之間存在一個誤差項。而該誤差項正好可以分解為每一維觀測變量 Mk 產(chǎn)生的 Confounding Bias 和相關(guān)的 Confounder Bias Weight αk. 

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

從上述推導(dǎo)中,我們發(fā)現(xiàn)如果不同的 Confounder 具有不同的 Confounder Weight αk;而且當αk=0 時,變量 Mk 就不是 Confounder,不需要進行 Balancing。我們還發(fā)現(xiàn)在推導(dǎo)過程中的 Confounder Weights αk 正好就是函數(shù) f(X) 中變量 Mk 的相關(guān)系數(shù)。因此,我們給出如下定理:

 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

其次,學(xué)習(xí) Sample Weights. 通過 Wikipedia,我們知道任何變量的矩(Moments)能唯一決定其分布。受這點啟發(fā),我們提出了通過變量的矩來直接進行變量平衡,具體如下圖。在 Moments 的幫助下,我們可以通過直接變量平衡來學(xué)習(xí) Sample Weights,且并不需要任何模型假設(shè)。

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

Sample Weights Learning by Moments

綜上,我們 DCB 算法的最終目標函數(shù)如下:

 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

其中,紅框部分是用來學(xué)習(xí) Sample Weights 的,綠框部分是用來學(xué)習(xí) Confounder Weights 的。

實際上,Entropy Balancing 和 Approximate Residual Balancing 方法都是我們 DCB 算法的 Special Cases 通過將我們算法中 Confounder Weights β 設(shè)置為單位向量。因此,我們算法對于因果效應(yīng)評估更加一般化。

我們 DCB 算法的時間復(fù)雜度為 O(np),其中 n 表示樣本數(shù)量,p 表示變量維度。

在實驗部分,我們通過三個方面對我們提出的 DCB 算法進行了測試:Robustness Test, Accuracy Test 和 Predictive Power Test.

首先是 Robustness Test. 為了檢測我們算法的魯棒性,我們在仿真數(shù)據(jù)上生成了各種情景下的高維和噪聲數(shù)據(jù)。

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

上述圖表只匯報了小部分結(jié)果,更多結(jié)果詳見我們論文。從上述結(jié)果中,我們發(fā)現(xiàn),基于 Directly Estimator 在所有 setting 下都失敗了,這是因為該方法忽略了數(shù)據(jù)中存在的 confounding bias;基于 propensity score 的方法,IPW 和 Doubly Robust 方法當面臨錯誤的模型假設(shè)和高維變量時就會產(chǎn)生巨大錯誤。ENT 和 ARB 算法由于將所有的觀測變量都當作 Confounder 進行同等平衡,導(dǎo)致其最后效果也不理想。而我們的 DCB 算法,通過同時優(yōu)化 Confounder Weights 和 Sample Weights,在所有 setting 下因果效應(yīng)評估性能相比基準方法都有顯著性提升。說明我們的 DCB 算法的魯棒性非常好。

其次是 Accuracy Test. 這里我們將 DCB 算法應(yīng)用在真實數(shù)據(jù) Lalonde 數(shù)據(jù)集上。該數(shù)據(jù)集包含兩塊,一塊是隨機對照試驗數(shù)據(jù),給我們提供了因果效應(yīng)的 ground truth;另一塊是觀測數(shù)據(jù),用來檢測各個算法對因果效應(yīng)評估的性能。

實驗結(jié)果如下表:

 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

從實驗結(jié)果可以看出,我們的 DCB 算法能在各中 setting 下更準確地評估因果效應(yīng)。

最后,Predictive Power Test. 為了檢測我們算法的預(yù)測能力,我們將 DCB 算法應(yīng)用于真實的在線廣告數(shù)據(jù)集中。對數(shù)據(jù)中每一維特征計算其對最后結(jié)果產(chǎn)生的因果效應(yīng),并選取因果效應(yīng)最高的 top-k 個特征對最后結(jié)果進行預(yù)測。預(yù)測結(jié)果如下圖:

 清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

從結(jié)果中我們發(fā)現(xiàn),我們的 DCB 算法在該預(yù)測問題上達到了最有的預(yù)測準確度。同時,我們將我們的算法與經(jīng)典的 correlation-based features selection 方法 (MRel, mRMR) 進行了對比,實驗發(fā)現(xiàn) correlation-based 方法比我們 DCB 方法的效果差了很多,甚至比其他 Causality-based 方法都要差。這就說明,因果效應(yīng)評估或者因果推理能有效地提升模型的預(yù)測能力。(對于 Causality 在預(yù)測問題上的應(yīng)用可以參考我們最新的文章「On Image Classification: Correlation v.s. Causality」

總結(jié)

在本文中,我們專注于解決在無約束的大數(shù)據(jù)高維背景下如何進行因果效應(yīng)評估。我們發(fā)現(xiàn)之前絕大多數(shù)方法抑或沒有考慮 Confounders 之間的不同,抑或需要正確的模型假設(shè),導(dǎo)致了在大數(shù)據(jù)高維背景下表現(xiàn)不佳。因此我們提出了 Differentiated Confounder Balancing 的算法并給出了理論的分析。我們的算法通過聯(lián)合優(yōu)化 Confounder Weights 和 Sample Weights 來評估因果效應(yīng)?;诜抡鏀?shù)據(jù)集和真實數(shù)據(jù)集的大量實驗表明我們的方法能夠顯著地超越當前最好的方法。同時我們的方法所選出的最重要的特征在廣告數(shù)據(jù)集的預(yù)測任務(wù)上也取得了最好的效果。

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

清華崔鵬團隊KDD論文一作解讀:在大數(shù)據(jù)背景下進行因果效應(yīng)評估

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說