北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

本文作者：青暮

編輯：劉曉坤

2020-09-18 13:06

導(dǎo)語：對多個物體的注意是交替性、節(jié)律性、非靜態(tài)的采樣

作者 | 青暮

編輯 | 叢末

6月22日，北京智源大會舉行了認(rèn)知神經(jīng)基礎(chǔ)專題論壇，來自北京師范大學(xué)認(rèn)知神經(jīng)科學(xué)與學(xué)習(xí)國家重點(diǎn)實(shí)驗(yàn)室的畢彥超教授、北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院的方方教授、北京師范大學(xué)心理學(xué)部的劉嘉教授、北京大學(xué)計(jì)算機(jī)系的吳思教授、中國科學(xué)院自動化研究所的余山教授分別做了報(bào)告，共同探究認(rèn)知神經(jīng)科學(xué)能為AI帶來什么啟發(fā)。

第二位報(bào)告者是北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院院長方方教授，題目為《人類注意力圖和功能》。

方方教授在報(bào)告中討論了人腦注意的兩個重要屬性：注意力圖和動態(tài)注意機(jī)制。注意力圖有兩種。注意顯著圖（Saliency map）源于自下而上的注意，注意優(yōu)先圖（Priority map）則結(jié)合了自上而下和自下而上的活動，以及任務(wù)相關(guān)性。對多個物體的注意是交替性、節(jié)律性、非靜態(tài)的采樣。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

以下是演講全文，AI科技評論做了不改變原意的整理。

我們一般說注意是對外界信息的一種選擇性加工。解釋注意最好的例子就是交替呈現(xiàn)以下兩張圖。它們之間有一個非常大的差別，如果不加注意就無法看出。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

兩者的差別就在雕像的背后

注意是認(rèn)知科學(xué)里最大的一個領(lǐng)域，每年有超過1萬篇文章研究注意現(xiàn)象。Corbetta和Shulman在2002年描述了關(guān)于注意控制的神經(jīng)模型，總結(jié)出兩條注意通路。藍(lán)色區(qū)域表示背側(cè)額頂網(wǎng)絡(luò)，負(fù)責(zé)自上而下的注意控制。橙色區(qū)域表示腹側(cè)額頂網(wǎng)絡(luò)，負(fù)責(zé)刺激驅(qū)動的注意控制。

注意最主要的功能是調(diào)節(jié)感覺皮層的神經(jīng)活動，Reynolds和Heeger描述了兩種典型方式。第一種是乘法縮放。對于一個方向選擇性神經(jīng)元，注意可以整體提高神經(jīng)元在各個方向上的反應(yīng)。如下圖左所示，不注意（藍(lán)線）和注意（紅線）之間的變換是一種乘法關(guān)系。第二種是銳化。注意可以增強(qiáng)神經(jīng)元對特定方向的反應(yīng)，讓神經(jīng)元對外界刺激的選擇性更強(qiáng)。這是注意的一些基本功能和神經(jīng)結(jié)構(gòu)。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

注意力圖

三維世界投射到我們眼睛上就變成了二維世界，這個二維世界有非常多物體和細(xì)節(jié)。關(guān)于哪些東西更重要的空間分布，就叫注意力圖。它分為兩種：

一種是注意顯著圖(Saliency map)，指自下而上的注意。例如一個非常奇怪的東西出現(xiàn)在視野中，就會自動吸引你的注意。

另一種叫注意優(yōu)先圖(Priority map)，則是我們整合自上而下的活動和自下而上的活動形成的注意力圖。

做任務(wù)時(shí)的任務(wù)屬性也會影響注意放在何處。比如我正在做報(bào)告，那么我的注意會更多放在面前的計(jì)算機(jī)屏幕上。這兩種地圖如何產(chǎn)生，是我們所關(guān)注的問題。

關(guān)于Saliency map ，首先講最簡單的自下而上的注意力圖。下圖左邊是一張海景圖，通過計(jì)算模型可以算出右邊的Saliency map。越亮的部分表示越有吸引力。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

如何得到右圖？我們根據(jù)Itti和Koch在1998年提出的模型，計(jì)算一張圖片在不同尺度上顏色、亮度以及朝向的差異對比度，進(jìn)行多個尺度的整合，形成Saliency map。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

有很多重要的文獻(xiàn)探討Saliency map在大腦什么地方產(chǎn)生。不同的結(jié)論包括在頂葉、前額葉眼區(qū)、上丘整合等等。但是我認(rèn)為視皮層V1區(qū)就可以充分解釋Saliency map。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

為什么以前很多文章都說注意在比較高級的頂葉、額葉等產(chǎn)生？一個可能的原因就是，以前的生命科學(xué)研究混淆了自上而下和自下而上的信號。如果我們要研究Saliency map，必須研究純粹的自下而上的刺激。怎么樣才能做到？我們用無意識的方法，在沒有任何自上而下的干擾下，實(shí)現(xiàn)研究自下而上的注意。

實(shí)驗(yàn)示意圖如下?！笆帧笔菂⑴c者的注視點(diǎn)，四個“減號”是Saliency map的位置。它會顯著吸引我們的注意，而且經(jīng)過實(shí)驗(yàn)操縱后不會被意識到。我們改變“減號”的角度，將“減號”和“I”之間的夾角分別設(shè)為0度、15度、30度和90度。隨著夾角增加，它吸引注意的能力逐漸增強(qiáng)。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

如何把這個刺激變得無意識？下圖是我們的實(shí)驗(yàn)流程。首先呈現(xiàn)線索圖片(Cue) 50ms，然后呈現(xiàn)掩蔽圖片(Mask) 100ms，然后呈現(xiàn)注視點(diǎn) 50ms，最后是探測任務(wù)，探測第四張圖十字下面兩個點(diǎn)的相對位置。由于線索僅僅呈現(xiàn)非常短的50ms，又緊跟著100ms的掩蔽圖片，所以被試完全不會意識到線索的存在。但是探測任務(wù)放在線索的顯著區(qū)，被試依然有較好的表現(xiàn)。任務(wù)放在對側(cè)的話，被試的表現(xiàn)就比較差。兩個條件的差別就代表自下而上的注意強(qiáng)度。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們接著利用視皮層V1區(qū)神經(jīng)元的屬性構(gòu)建注意模型。看看下圖的數(shù)據(jù)，隨著朝向傾斜角度增加，注意的吸引力也逐漸增強(qiáng)，跟計(jì)算模型吻合得非常好。我們發(fā)現(xiàn)Saliency map跟V1的神經(jīng)元活動是有關(guān)系的。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

從初級視覺層到頂葉，Saliency map的效果逐漸減小。最明顯的是V1區(qū)域，可以產(chǎn)生自下而上的注意。我們上面的研究基于人工刺激，下圖則基于自然場景。圖中的馬具有非常高的顯著度，甲殼蟲具有較低的顯著度。他們在大腦皮層誘發(fā)出的信號有沒有區(qū)別？

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們重復(fù)了這個行為學(xué)實(shí)驗(yàn)，發(fā)現(xiàn)馬確實(shí)可以誘發(fā)出更強(qiáng)的注意信號，甲殼蟲則不可以。并且還是在V1區(qū)域展示了注意的分布，所以我們再一次用自然場景證明了Saliency map跟V1是相關(guān)的。

基于這個生理學(xué)依據(jù)，我們構(gòu)建了一個動態(tài)注意模型。這個模型的大致框架有三個組件：第一部分參考感覺反應(yīng)，模擬V1神經(jīng)元對自然場景做稀疏編碼；第二部分是中央凹圖像多分辨率金字塔方法。對于自然場景，如果盯住這個紅色十字注視點(diǎn)，編碼會非常清晰，但是對外圍的編碼就非常粗糙；第三部分模擬視覺工作記憶，注視一個場景后很難立刻再跳回去。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們把這三個組件放在注意模型里，構(gòu)建了一個基于圖論的模型。這個動態(tài)的注意模型將V1神經(jīng)元構(gòu)成網(wǎng)絡(luò)，用該網(wǎng)絡(luò)搜尋圖片上最富有信息的區(qū)域，然后跳到第二富有刺激信息的區(qū)域。下圖中最下方圖的紅線代表在自然場景里人類的眼球運(yùn)動軌跡，中間是我們模型預(yù)測的軌跡。實(shí)驗(yàn)結(jié)果表明我們的模型和實(shí)際情況吻合得更好。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

關(guān)于Priority map，回到那張海景圖，Saliency map是中間上圖。任務(wù)要求尋找圖上的小島，于是小島被高亮標(biāo)記。中間這兩張圖并在一起后，小島應(yīng)該仍是高亮的。Priority map整合了自下而上的顯著性，與當(dāng)前任務(wù)的相關(guān)性。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們又用人的面孔進(jìn)行實(shí)驗(yàn)。面孔比人工刺激復(fù)雜得多，還具有倒立效應(yīng)，即同樣的臉倒過來后很難識別。這也非常影響Priority map在面孔上的分布。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們給被試看正立臉、倒立臉和相位打亂的面孔，讓被試的眼睛在面孔上隨便跳動。另外，掃描被試視皮層對面孔的反應(yīng)，得到行為學(xué)的數(shù)據(jù)和腦活動的數(shù)據(jù)。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們重構(gòu)出任意一個視皮層對面孔每一個部分的反應(yīng)。下圖右下角是模型重構(gòu)的反應(yīng)，顏色越暖說明視皮層相應(yīng)區(qū)域?qū)γ婵椎姆磻?yīng)更強(qiáng)。右上角是行為學(xué)數(shù)據(jù)，我們第一眼看面孔時(shí)注視什么地方。顏色越暖說明第一次著眼此處的概率越大，也就是該區(qū)域越容易吸引眼球。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

下圖是這個實(shí)驗(yàn)最主要的結(jié)果。我們測量最左邊正臉和倒臉吸引眼球的程度，描述了視皮層V1、V2、V3區(qū)域?qū)φ樅偷鼓樂磻?yīng)的分布。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

我們發(fā)現(xiàn)V2和V3對正臉的表征是最精確的，遠(yuǎn)遠(yuǎn)高于其他三種情況。V1對正臉和倒臉的反應(yīng)表征的精準(zhǔn)度都比較低，但是V2和V3對正臉表征的精準(zhǔn)度比對倒臉表征高很多。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

總結(jié)一下就是，人類早期視皮層，從V1區(qū)域到V3區(qū)域，V1對Saliency map即自下而上的注意起到很好的表征作用，V2和V3則對Priority map即自上而下的、任務(wù)驅(qū)動的注意起到很好的表征作用。

注意的動態(tài)機(jī)制

過去關(guān)于注意采樣的大部分觀點(diǎn)認(rèn)為，我們一旦注意到一個物體，對它的注意是持續(xù)的、靜止的。但事實(shí)是不是這樣的？從現(xiàn)在的數(shù)據(jù)來看，不一定。

另外一種觀點(diǎn)是有數(shù)據(jù)支持的，特別是同時(shí)注意兩個物體的時(shí)候。如下圖所示，一種理論提出注意把關(guān)注點(diǎn)分割為兩塊，同時(shí)關(guān)注藍(lán)色和黃色方塊，這是一種平行和穩(wěn)定的關(guān)系。另外一種理論認(rèn)為，注意在這兩個物體之間切換。我們希望用實(shí)驗(yàn)來提供進(jìn)一步證據(jù)。在我們的腦成像實(shí)驗(yàn)之前，行為學(xué)研究已經(jīng)發(fā)現(xiàn)，如果同時(shí)注意左右兩個物體，注意其實(shí)是左右切換的、順序的、周期性的交替采樣過程。我們的腦成像結(jié)果也證明，對多個物體的注意是交替性的、節(jié)律性的采樣，而不是一種靜態(tài)的過程。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

下圖表示隨著不同的任務(wù)要求（100%注意A并且0%注意B、75%注意A并且25%注意B、50%注意A并且50%注意B），注意在不同的物體之間節(jié)律性分配。它不僅僅對靜態(tài)物體有用。對于動態(tài)的物體，比如兩個運(yùn)動的小球，同樣可以發(fā)現(xiàn)類似的節(jié)律性采樣過程。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

上面講的是對于物體的采樣和對于空間的采樣，如果同時(shí)注意多個特征，采樣是怎么樣的過程呢？這個問題相當(dāng)復(fù)雜。比如對于任何一個朝向、任何一個運(yùn)動方向來說，有很多神經(jīng)元同時(shí)進(jìn)行反應(yīng)，怎樣描述這種同時(shí)的反應(yīng)？我們做了一個腦磁實(shí)驗(yàn)，呈現(xiàn)一個刺激，測量腦磁信號。這些信號由大腦中不同朝向神經(jīng)元的不同通道反應(yīng)組合而成。然后我們用腦磁信號反解出每個通道的反應(yīng)。

北大心理與認(rèn)知學(xué)院院長方方：人類注意力圖和動態(tài)機(jī)制

實(shí)驗(yàn)表明，如果我們同時(shí)注意兩個特征，對這兩個特征的表征同樣是交替性的，而且是反相位的。無論是基于空間的注意、基于客體的注意，還是基于特征的注意，都不是靜態(tài)的過程，而是在不同的空間、客體和特征之間交替。

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

青暮

編輯

發(fā)私信

當(dāng)月熱門文章