丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開(kāi)發(fā)者 正文
發(fā)私信給AI研習(xí)社-譯站
發(fā)送

0

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

本文作者: AI研習(xí)社-譯站 2020-12-23 14:28
導(dǎo)語(yǔ):但對(duì)于因果關(guān)系,要把握的關(guān)系就要復(fù)雜得多。

譯者:AI研習(xí)社(聽(tīng)風(fēng)1996

雙語(yǔ)原文鏈接:Causal Inference: What, Why, and How


作為一名經(jīng)濟(jì)學(xué)博士,我致力于尋找某些變量之間的因果關(guān)系,用來(lái)完成我的論文。因果關(guān)系強(qiáng)大到可以讓人們有足夠的信心去做決策、防止損失、求解最優(yōu)解等。在本文中,我將討論什么是因果關(guān)系,為什么需要發(fā)現(xiàn)因果關(guān)系,以及進(jìn)行因果推理的常用技巧。

1. 什么是因果關(guān)系?

因果關(guān)系描述的是兩個(gè)變量之間的關(guān)系,即一個(gè)變量如何誘發(fā)另一個(gè)變量的發(fā)生。它比相關(guān)關(guān)系要強(qiáng)得多,因?yàn)橄嚓P(guān)關(guān)系只是描述兩個(gè)變量之間的共同運(yùn)動(dòng)模式。通過(guò)繪制散點(diǎn)圖,可以很容易地觀察到兩個(gè)連續(xù)變量的相關(guān)性。對(duì)于分類變量,我們可以繪制柱狀圖來(lái)觀察其關(guān)系。要知道兩個(gè)連續(xù)變量之間的確切相關(guān)性,我們可以使用皮爾遜相關(guān)公式。皮爾遜(Pearson)的相關(guān)性介于-1和1之間,絕對(duì)值越大表示相關(guān)性越強(qiáng)。正相關(guān)意味著兩個(gè)變量在同一方向共同運(yùn)動(dòng),反之亦然。

但對(duì)于因果關(guān)系,要把握的關(guān)系就要復(fù)雜得多。為了知道變量A是否引起了變量B的發(fā)生,即干預(yù)A是否引起了結(jié)果B,我們需要保持所有其他變量不變,以隔離和量化干預(yù)的效果。我們需要控制的其他變量稱為混雜變量,即與干預(yù)和結(jié)果都相關(guān)的變量:

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

有關(guān)混淆變量的例子

在上圖中,我舉了一個(gè)混淆變量,其中年齡與戒煙率和致死率都是正相關(guān)的。年齡越大,死亡率越高,但吸煙率越低。如果我們?cè)诠烙?jì)吸煙對(duì)死亡率的影響時(shí)沒(méi)有控制年齡,我們可能會(huì)觀察到吸煙會(huì)減少死亡率這樣荒謬結(jié)果。我們不能在這里得出因果關(guān)系,因?yàn)槲覀儧](méi)有控制所有混雜變量。關(guān)于這個(gè)例子的更多細(xì)節(jié),你可以閱讀我討論 "辛普森悖論 "的文章:

所謂的“辛普森悖論”

在得出因果效應(yīng)的結(jié)論時(shí),我們需要記住的另一個(gè)因素是選擇偏差。為了隔離治療效果,我們需要確保治療組單位是在人群中隨機(jī)選擇的。這樣,我們?cè)谥委熀笥^察到的差異不是因?yàn)槠渌蛩?,而是因?yàn)橹委?。舉個(gè)例子,當(dāng)一家超市想估計(jì)提供優(yōu)惠券對(duì)提高整體銷售額的影響時(shí)。如果超市只把優(yōu)惠券傳遞給在店里購(gòu)物的顧客(干預(yù)組),發(fā)現(xiàn)他們比沒(méi)有收到優(yōu)惠券的顧客(對(duì)照組)購(gòu)買(mǎi)了更多的商品,那么市場(chǎng)由于選擇偏差而無(wú)法在此處得出因果關(guān)系。沒(méi)有將顧客隨機(jī)選擇到治療組中。他們之所以在這里,是因?yàn)樗麄冊(cè)诔匈?gòu)物,這表明與對(duì)照組相比,即使沒(méi)有優(yōu)惠券,他們也更可能從超市購(gòu)買(mǎi)商品。比較來(lái)自治療組和對(duì)照組的結(jié)果變量在這里將毫無(wú)意義。    

為什么要估計(jì)因果關(guān)系?

得到因果關(guān)系是如此復(fù)雜的,何必還要呢?我們?yōu)槭裁床恢苯邮褂孟嚓P(guān)性呢?我們知道相關(guān)性在進(jìn)行預(yù)測(cè)時(shí)是有用的。如果我們知道變量A與變量B有很強(qiáng)的相關(guān)性,那么知道變量A的值就可以幫助我們預(yù)測(cè)變量B的值。在業(yè)務(wù)環(huán)境中,我們可以利用相關(guān)性來(lái)預(yù)測(cè)給哪些客戶群體做促銷,這樣我們就可以根據(jù)客戶過(guò)去的行為和其他客戶特征來(lái)提高轉(zhuǎn)化率。但是,即使是最準(zhǔn)確的預(yù)測(cè)模型,也不能得出結(jié)論,當(dāng)你觀察到客戶轉(zhuǎn)化率提高了,就是因?yàn)榇黉N。我們需要設(shè)計(jì)實(shí)驗(yàn)或進(jìn)行準(zhǔn)實(shí)驗(yàn)研究,才能得出因果關(guān)系并量化干預(yù)效果。在這個(gè)例子中,因果推理可以告訴你,提供促銷活動(dòng)是否增加了客戶轉(zhuǎn)化率,以及增加了多少。因此,與相關(guān)性相比,因果關(guān)系能給決策者更多的指導(dǎo)和信心。

如何進(jìn)行因果推斷?

1、不同的干預(yù)效應(yīng)

估計(jì)因果效應(yīng)與估計(jì)你的利益結(jié)果變量的干預(yù)效應(yīng)是一樣的。根據(jù)具體的研究或業(yè)務(wù)問(wèn)題,可以選擇不同的治療效果進(jìn)行估計(jì)。假設(shè)Y是結(jié)果變量,其中Y?是沒(méi)有干預(yù)的結(jié)果,Y1是有干預(yù)的結(jié)果。T為虛擬變量,表示單位i是在干預(yù)組(T=1)還是對(duì)照組(T=0):  

  • 平均干預(yù)效應(yīng)(ATE): 

平均而言,干預(yù)組和對(duì)照組之間的結(jié)果變量有何不同?  

因果推理“三問(wèn)”:是什么?為什么需要?如何使用? 

 平均干預(yù)效應(yīng)

  • 平均干預(yù)效應(yīng)(ATT):

平均而言,干預(yù)組中的單位在接受和不接受干預(yù)的情況下,結(jié)果變量的差異是什么?

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

平均干預(yù)效果 

在這里,E(Y1|T=1)是干預(yù)組單位的預(yù)期結(jié)果,它是可觀察的。然而,E(Y?|T=1)是不可觀察的,因?yàn)樗羌僭O(shè)的。一個(gè)單位只能有Y?和Y1這兩種結(jié)果中的一種,這取決于這個(gè)單位所在的組別。如果這個(gè)單位已經(jīng)接受了干預(yù),我們可以觀察Y1,并使用不同的技術(shù)來(lái)估計(jì)Y?這個(gè)反事實(shí)變量。我將在后面討論不同的技術(shù)。

  • 條件平均干預(yù)效應(yīng)(CATE):

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?  

條件平均干預(yù)效果 

條件平均干預(yù)效果是應(yīng)用某些條件x來(lái)估計(jì)ATE。在某些情況下,干預(yù)會(huì)對(duì)不同的子組產(chǎn)生不同的影響,并且ATE可以為零,因?yàn)檫@些效果被抵消了。CATE可以用于估計(jì)子組之間的異質(zhì)效應(yīng)。 

  • 個(gè)體干預(yù)效應(yīng)(ITE)

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

個(gè)體干預(yù)效果

個(gè)體干預(yù)效應(yīng)與CATE相同,應(yīng)用的條件是單位是單位 i。

2,假設(shè)

如上所述,在聲明因果關(guān)系之前,需要采取許多措施。在進(jìn)行因果推斷時(shí),請(qǐng)記住以下假設(shè): 

  • 無(wú)選擇偏差:每個(gè)單位都有同等可能被分配到干預(yù)組。

  • 在估計(jì)干預(yù)效果時(shí),沒(méi)有未控制的混淆變量。

  • 結(jié)果變量Y是可觀察的,它可以用來(lái)估計(jì)干預(yù)后的干預(yù)效果。

  • SUTVA:穩(wěn)定單位處理值假設(shè)。這個(gè)假設(shè)有兩個(gè)方面。對(duì)于實(shí)驗(yàn)中的任何單位: 

1、單位i接受干預(yù)不會(huì)影響其他單位的結(jié)果,即無(wú)網(wǎng)絡(luò)效應(yīng)。
2、如果單位i在干預(yù)組中,其接受的干預(yù)與干預(yù)組中的所有其他單位一樣,即只有一個(gè)種干預(yù)類型。

3、工作流程

因果推理最大的挑戰(zhàn)是,我們只能觀察到每個(gè)單位i的Y1或Y?,我們永遠(yuǎn)無(wú)法完美測(cè)量每個(gè)單位i的干預(yù)效果,為了應(yīng)對(duì)這個(gè)問(wèn)題,我們需要為干預(yù)組找到完美的對(duì)照組,使兩組之間唯一的區(qū)別就是干預(yù)。這可以通過(guò)運(yùn)行隨機(jī)化實(shí)驗(yàn)或在隨機(jī)化不切實(shí)際的情況下尋找匹配的干預(yù)組和對(duì)照組(準(zhǔn)實(shí)驗(yàn))來(lái)實(shí)現(xiàn)。以下是我認(rèn)為有用的工作流程:

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

隨機(jī)對(duì)照試驗(yàn)(RCT)

如果總能隨機(jī)分出干預(yù)組和對(duì)照組,生活就會(huì)輕松很多! 隨機(jī)分配干預(yù)后,我們可以分別估計(jì)治療組和對(duì)照組的結(jié)果變量,其差異就是平均治療效果(ATE)。由于單位是隨機(jī)選入干預(yù)組的,所以干預(yù)組和對(duì)照組的單位之間唯一的區(qū)別就是是否接受過(guò)干預(yù)。因此,結(jié)果變量的差異就是干預(yù)的效果。但是,有時(shí)由于網(wǎng)絡(luò)效應(yīng)或技術(shù)問(wèn)題,無(wú)法將干預(yù)組和對(duì)照組隨機(jī)化?;蛘甙延脩舴殖蓛山M成本太高。例如,在估計(jì)促銷活動(dòng)的效果時(shí),如果將部分用戶排除在促銷活動(dòng)之外,會(huì)對(duì)用戶的滿意度產(chǎn)生負(fù)面影響。在這種情況下,我們可以進(jìn)行準(zhǔn)實(shí)驗(yàn),也就是不依賴隨機(jī)分配的實(shí)驗(yàn)。

差異(DID):

DID通常是在對(duì)照組和干預(yù)組之間存在已存在差異時(shí)使用的。但是,我們認(rèn)為干預(yù)組和對(duì)照組的結(jié)果變量增長(zhǎng)趨勢(shì)沒(méi)有顯著差異(平行趨勢(shì)假設(shè))。也就是說(shuō),按照下表的定義,兩組在結(jié)果變量上的差異在治療前后是相同的,d_post=d_pre:

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

干預(yù)組的結(jié)果差異為d_t,定義為Y(1,1)-Y(1,0),對(duì)照組的結(jié)果差異為d_c,定義為Y(0,1)-Y(0,0)。d_t和d_c之間的差值為DID,即干預(yù)效果,如下圖所示。

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

DID = d_t-d_c=(Y(1,1)-Y(1,0))-(Y(0,1)-Y(0,0))  
平行趨勢(shì)假設(shè)是一個(gè)很強(qiáng)的假設(shè),當(dāng)違背這個(gè)假設(shè)的時(shí)候,DID估計(jì)就會(huì)出現(xiàn)偏差。

匹配

盡管不可能進(jìn)行隨機(jī)實(shí)驗(yàn),但我們可以找到完美匹配的干預(yù)組,在不進(jìn)行干預(yù)的情況下量化結(jié)果變量。我們可以根據(jù)interests特征構(gòu)建一個(gè)人工對(duì)照組。例如,我們可以在一個(gè)城市給予促銷活動(dòng),并與其他沒(méi)有促銷活動(dòng)的城市進(jìn)行結(jié)果變量的比較。這些城市除了促銷活動(dòng)外,其他因素都是相似的。這就像一個(gè)橫向比較。

我們可以使用的另一種方法是時(shí)間序列比較,這叫做switch-back檢驗(yàn)。例如,我們可以選擇一個(gè)城市,在一周內(nèi)給出促銷活動(dòng),然后將結(jié)果變量與最近一段時(shí)間沒(méi)有促銷活動(dòng)的這個(gè)城市進(jìn)行比較。差異將是促銷的效果。

這些技術(shù)在面對(duì)網(wǎng)絡(luò)效應(yīng)時(shí)相當(dāng)有用。使用橫向比較或時(shí)間序列比較,我們不需要把一個(gè)市場(chǎng)分成不同的群體。因此,我們不需要擔(dān)心同一市場(chǎng)中群體之間的溢出效應(yīng)。在對(duì)整個(gè)市場(chǎng)進(jìn)行比較時(shí),必須確保對(duì)照組和干預(yù)組市場(chǎng)之間的唯一差異是干預(yù)。

內(nèi)生性

當(dāng)獨(dú)立變量X(干預(yù))與回歸中的誤差項(xiàng)相關(guān),從而使估計(jì)結(jié)果(干預(yù)對(duì)結(jié)果變量Y的影響)產(chǎn)生偏差時(shí),就會(huì)產(chǎn)生內(nèi)生性。引起內(nèi)生性的方式有三種:

  • 遺漏變量:
    當(dāng)我們沒(méi)有將混淆變量作為控制變量納入回歸,或無(wú)法量化混淆變量時(shí)。例如,如果我們想估計(jì)教育(干預(yù))對(duì)未來(lái)收入(結(jié)果變量)的影響,就需要在回歸中加入一個(gè)稱為 "能力 "的混淆變量。作為一個(gè)混淆變量,"能力 "會(huì)增加接受高等教育的機(jī)會(huì),增加獲得高收入的機(jī)會(huì)。但是,由于我們無(wú)法輕易地量化 "能力",所以很難將其納入回歸中。簡(jiǎn)單地用 "學(xué)歷 "對(duì) "收入 "進(jìn)行回歸,會(huì)使處理效果出現(xiàn)偏差。如果我們能夠量化混淆變量,我們就可以將它們?nèi)考{入回歸中。如果不能,我們需要使用回歸不連續(xù)或工具變量來(lái)進(jìn)行隨意推斷。我將在后面討論它們。
    如果我們可以量化混雜變量,則可以將它們?nèi)堪诨貧w中。如果不是,我們需要使用回歸不連續(xù)性或工具變量來(lái)進(jìn)行因果推斷。稍后再討論。  

  • 反向因果關(guān)系:
    當(dāng)X可以影響Y,Y也可以影響X時(shí),就存在反向因果關(guān)系。例如,如果我們?cè)诔薪o在這家超市購(gòu)物的顧客發(fā)放優(yōu)惠券。優(yōu)惠券會(huì)增加收到優(yōu)惠券的顧客的銷售額,這些顧客會(huì)更多的出現(xiàn)在超市,也更有可能收到更多的優(yōu)惠券。循環(huán)下去。在應(yīng)對(duì)這個(gè)問(wèn)題的時(shí)候,我們需要在中間引入一些隨機(jī)化。比如,我們并不是給所有出現(xiàn)在超市的顧客發(fā)放優(yōu)惠券,而是隨機(jī)選擇一些顧客發(fā)放優(yōu)惠券,并估算出差異。引入一定程度的隨機(jī)化會(huì)減少估計(jì)的偏差。

  • 選擇偏差:
    如上所述,如果具有某些特征的單位更容易被選入干預(yù)組,那么我們就面臨選擇偏差。我們觀察到的結(jié)果變量的差異不僅是由干預(yù)引起的,也是由于組間其他預(yù)先存在的差異。如果我們相信治療組和對(duì)照組有平行的趨勢(shì),即它們之間的差異不會(huì)因?yàn)橹委熁驎r(shí)間而改變,我們可以使用DID來(lái)估計(jì)治療效果。否則,我們可以尋求其他解決方案。

處理內(nèi)生性問(wèn)題總是很麻煩。除了包括所有混淆變量和引入一些隨機(jī)化外,回歸不連續(xù)和工具變量是解決內(nèi)生性問(wèn)題的另外兩種方法。 

1、回歸不連續(xù)

回歸不連續(xù)是在一個(gè)分界點(diǎn)測(cè)量干預(yù)效果。用一個(gè)例子會(huì)更容易理解。假設(shè)我們想估計(jì)發(fā)放獎(jiǎng)學(xué)金對(duì)學(xué)生成績(jī)的影響。簡(jiǎn)單地估計(jì)有獎(jiǎng)學(xué)金和沒(méi)有獎(jiǎng)學(xué)金的學(xué)生之間的成績(jī)差異,會(huì)因?yàn)閮?nèi)生性而使估計(jì)結(jié)果出現(xiàn)偏差。獲得獎(jiǎng)學(xué)金的學(xué)生即使沒(méi)有獎(jiǎng)學(xué)金,也更有可能獲得更好的成績(jī)。如果我們有一個(gè)給獎(jiǎng)學(xué)金的臨接點(diǎn),我們可以利用回歸不連續(xù)來(lái)估計(jì)獎(jiǎng)學(xué)金的效應(yīng)。例如,如果我們給成績(jī)高于80分的學(xué)生發(fā)放獎(jiǎng)學(xué)金,那么我們就可以估計(jì)成績(jī)接近80分的學(xué)生的成績(jī)差異。這背后的直覺(jué)是,在影響成績(jī)的其他特征方面,得到79分的學(xué)生很可能與得到81分的學(xué)生相似。對(duì)于成績(jī)?cè)?9到81之間的學(xué)生來(lái)說(shuō),被分配到干預(yù)組(有獎(jiǎng)學(xué)金)和對(duì)照組(沒(méi)有獎(jiǎng)學(xué)金)是大致隨機(jī)的。因此,我們只能看這個(gè)子人群的成績(jī)差異來(lái)估計(jì)治療效果。更多詳情請(qǐng)查看維基百科頁(yè)面。

2、工具變量

工具變量指的是與自變量X高度相關(guān),但與因變量Y不直接相關(guān)的變量,它們的關(guān)系就像下圖。

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

  工具變量

由于工具變量與結(jié)果變量并不直接相關(guān),如果改變工具變量引起結(jié)果變量的變化,那一定是干預(yù)變量的原因。例如,在估計(jì)教育對(duì)未來(lái)收入的影響時(shí),常用的工具變量是父母的教育水平。父母的教育水平與孩子的教育水平高度相關(guān),而與孩子的收入并不直接相關(guān)。為具體的研究問(wèn)題尋找工具變量是很困難的,它需要對(duì)相關(guān)文獻(xiàn)和領(lǐng)域知識(shí)有充分的了解。在得到工具變量后,我們可以用2SLS回歸來(lái)檢驗(yàn)這個(gè)工具變量是否好用,如果好用,處理效果如何。詳情請(qǐng)參考維基百科頁(yè)面

這些就是因果推理的what、why和how。希望本文可以幫助你總結(jié)基本概念和技術(shù),感謝您的閱讀。


AI研習(xí)社是AI學(xué)術(shù)青年和AI開(kāi)發(fā)者技術(shù)交流的在線社區(qū)。我們與高校、學(xué)術(shù)機(jī)構(gòu)和產(chǎn)業(yè)界合作,通過(guò)提供學(xué)習(xí)、實(shí)戰(zhàn)和求職服務(wù),為AI學(xué)術(shù)青年和開(kāi)發(fā)者的交流互助和職業(yè)發(fā)展打造一站式平臺(tái),致力成為中國(guó)最大的科技創(chuàng)新人才聚集地。

如果,你也是位熱愛(ài)分享的AI愛(ài)好者。歡迎與譯站一起,學(xué)習(xí)新知,分享成長(zhǎng)。

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

因果推理“三問(wèn)”:是什么?為什么需要?如何使用?

分享:
相關(guān)文章

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識(shí),讓語(yǔ)言不再成為學(xué)習(xí)知識(shí)的門(mén)檻。(原雷鋒字幕組)
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)