聲音和詞語在大腦中并行處理，顛覆傳統(tǒng)研究 | Cell

本文作者：我在思考中

2021-08-30 14:27

導(dǎo)語：站在生物神經(jīng)學(xué)的參照系下，AI語言處理被賦予更精細的洞察

作者 | 吳彤

編輯 | 青暮

受到生物神經(jīng)網(wǎng)絡(luò)的啟發(fā)，目前深度神經(jīng)網(wǎng)絡(luò)已經(jīng)被證實效果很好。如今，深度神經(jīng)網(wǎng)絡(luò)在計算機視覺、語音識別和自然語言處理等許多重要問題上有著出色的表現(xiàn)。

神經(jīng)網(wǎng)絡(luò)本身是一般的函數(shù)逼近，這就是為什么它們幾乎可以應(yīng)用于任何從輸入到輸出空間復(fù)雜映射的機器學(xué)習(xí)問題。

然而深度神經(jīng)網(wǎng)絡(luò)更多的是關(guān)心所謂的端到端學(xué)習(xí)，內(nèi)部發(fā)生什么事情它并不關(guān)心。這在認知科學(xué)里面叫“弱等價”，也就是說人和機器可以干同一件事，但是它們的內(nèi)部過程并不是一樣的。

或許深度神經(jīng)網(wǎng)絡(luò)在增加內(nèi)部的認知過程中，要向生物系統(tǒng)不斷近似，以一定智能的方式解釋世界復(fù)雜度。此時，科學(xué)家站在生物神經(jīng)學(xué)的參照系下，希望賦予AI語言處理更精細的洞察。

經(jīng)過多年研究，神經(jīng)科學(xué)家發(fā)現(xiàn)了人類大腦中處理語言聲音的運行規(guī)則

近日，美國加州大學(xué)舊金山分校的研究人員在《細胞》雜志上發(fā)表論文稱，聽覺處理和語言處理是并行進行的。這與長期以來認為大腦先處理聽覺信息，然后將其轉(zhuǎn)化為語言信息的理論相矛盾。

最新研究表明：當(dāng)含有語意的聲音傳到耳中，耳蝸將其轉(zhuǎn)換成電信號，然后發(fā)送到位于顳葉的聽覺皮層。

聲音和詞語在大腦中并行處理，顛覆傳統(tǒng)研究 | Cell

人腦左半球聽覺皮層的位置和分區(qū)示意圖

幾十年來，科學(xué)家們一直認為，聽覺皮層在處理語音時像工廠流水線一樣有先后工序：首先，初級聽覺皮層處理簡單的聲音信息，比如聲音頻率。然后，顳上回（superior temporal gyrus，STG）提取更重要的特征，如輔音和元音，將聲音轉(zhuǎn)換為有含義的單詞。

但一直以來，這一理論缺乏直接證據(jù)的支持，因為它需要整個聽覺皮層極高時空分辨率的詳細神經(jīng)生理學(xué)記錄。這是一個挑戰(zhàn)，原因是初級聽覺皮層位于大腦額葉和顳葉的裂口深處。

論文作者美國加州大學(xué)舊金山分校神經(jīng)科學(xué)家、神經(jīng)外科醫(yī)生Edward Chang說："所以我們進行了這項研究，希望找到聲音等低級表征轉(zhuǎn)化為詞匯等高級表征的證據(jù)。"

Edward Chang

這項研究的開展離不開一些患者的支持。幾年時間里，有9名患者參與了實驗。因為需要切除腦部腫瘤或定位引發(fā)癲癇的病灶，這些患者接受了神經(jīng)外科手術(shù)。與此同時，他們同意讓醫(yī)生在手術(shù)過程中將微電極陣列放置在他們的聽覺皮層，收集神經(jīng)信號，用于分析語言功能和定位癲癇，以及研究聽覺皮層如何處理語音信息。

"這是我們第一次可以直接從大腦表面同時覆蓋聽覺皮層的所有區(qū)域，研究聲音到字詞的轉(zhuǎn)換。"Chang教授說。相比過去只能在有限的幾個點記錄神經(jīng)活動的電信號，無疑是巨大的進步。

聲音和詞語在大腦中并行處理，顛覆傳統(tǒng)研究 | Cell

通過電極直接記錄信號和給予刺激發(fā)現(xiàn)語音信息處理的并行通路

接著，在實驗中，研究人員開始向參與者播放詞組和短句，試圖尋找信息從初級聽覺皮層流向顳上回的跡象。按照原來的假設(shè)，這兩個腦區(qū)應(yīng)該會先后被激活。

然而，事實并非如此。他們觀察到，播放句子時，顳上回某些區(qū)域的反應(yīng)速度與初級聽覺皮層一樣快，也就是說，這兩個區(qū)域同時開始處理聲音信息。

在另一項實驗中，研究人員用微弱的電流刺激患者的聽覺皮層。按照原來的假設(shè)，刺激初級聽覺皮層，很可能會扭曲患者對言語的感知。然而，這些患者表示，盡管刺激引起了某些聲音的幻聽，但他們?nèi)阅芮宄芈牭讲⒅貜?fù)對他們播放的字詞。

相反，當(dāng)研究人員用電流刺激患者的顳上回，患者報告說他們能聽到有人在講話，"但分辨不出字詞"。"事實上，有一名患者說，聽起來就像單詞的音節(jié)發(fā)生了互換。"Chang教授說道。

綜合這些證據(jù)，研究小組認為，大腦聽覺皮層對聲音和語音的信息處理是并行的，而不是傳統(tǒng)模型所認為的串行處理。傳統(tǒng)語音處理模型過于簡化，甚至很可能是錯誤的。研究人員推測，顳上回可能獨立于初級聽覺皮層而發(fā)揮作用，而不是作為初級聽覺皮層處理的下一步。

"雖然這是向前邁出的重要一步，但我們還不了解這個平行聽覺系統(tǒng)。這些發(fā)現(xiàn)表明，聲音信息的傳遞可能與我們想象的非常不同。這無疑帶來了更多問題。"Chang說。

這一點，或許將提示人工智能語言處理在神經(jīng)網(wǎng)絡(luò)層面，不僅僅是通過單一通路、單向處理來實現(xiàn)，而是多通路的。進一步，基于計算神經(jīng)科學(xué)的發(fā)現(xiàn)，這一過程甚至可能是多向的、動態(tài)的，通過不同腦區(qū)之間的交互來實現(xiàn)。生物學(xué)上的腦科學(xué)新研究對下一步AI的發(fā)展究竟有什么影響呢？

站在生物神經(jīng)學(xué)的參照系下，AI語言處理被賦予更精細的洞察

北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授吳思，在今年以“人工智能的認知神經(jīng)基礎(chǔ)”為主題的北京智源大會上分享了自己對于人工智能和腦科學(xué)之間相互錯位的觀點和思考：

生物神經(jīng)元構(gòu)成一層一層的網(wǎng)絡(luò)，梯度進行特征提取，這是深度學(xué)習(xí)已經(jīng)模擬的。其實大腦還有一個根本不同，我們識別物體的時候不是像深度學(xué)習(xí)網(wǎng)絡(luò)一樣由簡單到復(fù)雜的特征提取，而是有多條通路。

我們看到一個物體的時候，第一步會快速地從皮層下通路，對物體的整體的性質(zhì)進行識別，這些信息到了高級腦區(qū)，和記憶、先驗知識等進行融合，先猜測出來是什么東西，通過神經(jīng)反饋再和深度學(xué)習(xí)模擬的那個慢速的腹側(cè)通路進行動態(tài)交互，這個過程可能會經(jīng)過幾個回合，整個識別的過程都是輸入和大腦內(nèi)部的先驗知識不斷的相互比較印證的過程。而這個過程在目前是深度學(xué)習(xí)沒有包含的，也是圖像理解這個數(shù)學(xué)上不適定問題（ill-posed problem）的一個解決方案。

那為什么好像深度學(xué)習(xí)網(wǎng)絡(luò)用得很好，或許是因為現(xiàn)在我們的任務(wù)太簡單了。因為我們沒有包含動態(tài)的過程，如果只是做靜態(tài)圖像的識別根本不需要交叉印證，但是如果真的要做一個能夠與環(huán)境動態(tài)交互、很自主的機器人，這樣的計算需求就會出現(xiàn)，那個時候就需要動態(tài)交互的過程了。

而深度學(xué)習(xí)一般認為是黑盒子，每個人的模型得到大致相同的結(jié)果，但是也不完全一樣，那么這里的一致性和不一致性到底體現(xiàn)在哪里。如果生物神經(jīng)在語言處理方面搞得很清楚的話，實際上對深度神經(jīng)網(wǎng)絡(luò)的架構(gòu)也會很有幫助。

資料來源：

https://mp.weixin.qq.com/s/agDJMUtJZf7XccdR6yzqlQ

https://mp.weixin.qq.com/s/h5C9s7nqsGBUTfITnjG8pQ

贈書福利

AI科技評論本次聯(lián)合中信出版社為大家?guī)?strong>5本人工智能先驅(qū)、圖靈獎得主Yann LeCun教授的自傳《科學(xué)之路》正版新書。

聲音和詞語在大腦中并行處理，顛覆傳統(tǒng)研究 | Cell

在AI科技評論8月29日頭條文章（注意不是本文，僅限AI科技評論微信公眾號端）留言區(qū)留言，歡迎大家暢所欲言，談一談你對本書的看法和期待。在綜合留言質(zhì)量（留言是敷衍還是走心）和留言點贊最高（注：點贊最高的前5不意味著一定會中獎）的讀者中選出5位讀者獲得贈書。獲得贈書的讀者請聯(lián)系 AI 科技評論客服（aitechreview）。

留言內(nèi)容會有篩選，例如“選我上去”、“這書寫的很棒（僅僅幾個字）”等內(nèi)容將不會被篩選，亦不會中獎。
留言送書活動時間為2021年8月29日 - 2021年9月02日（23:00），活動推送時間內(nèi)僅允許贈書福利中獎一次。

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)特約稿件，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

我在思考中

運營

發(fā)私信

當(dāng)月熱門文章

聲音和詞語在大腦中并行處理，顛覆傳統(tǒng)研究 | Cell

聲音和詞語在大腦中并行處理，顛覆傳統(tǒng)研究 | Cell