GPT-3的50種玩法告訴你，它很酷，但是沒(méi)有通過(guò)圖靈測(cè)試

本文作者：青暮

編輯：劉曉坤

2020-09-18 14:44

導(dǎo)語(yǔ)：如何正式GPT-3的技術(shù)炒作

作者 | 青暮

編輯 | 叢末

自從OpenAI開(kāi)放GPT-3的API以來(lái)，不少人爭(zhēng)相申請(qǐng)?jiān)囉煤螳@得了“門票”，并相繼在社交網(wǎng)絡(luò)上推送自己的試用成果，引發(fā)了人們對(duì)GPT-3的熱烈討論。

GPT-3的50種玩法告訴你，它很酷，但是沒(méi)有通過(guò)圖靈測(cè)試

AI科技評(píng)論發(fā)現(xiàn)了一個(gè)GitHub項(xiàng)目，上面展示了GPT-3的多種玩法，整整50種，包括用GPT-3生成網(wǎng)頁(yè)、圖表、代碼、文本以及推理。其中令人吃驚的是，GPT-3能生成Keras編寫的卷積神經(jīng)網(wǎng)絡(luò)的代碼，還能應(yīng)對(duì)程序員面試、回復(fù)郵件、寫積分表達(dá)式、回答物理問(wèn)題。特別是，網(wǎng)友還對(duì)它進(jìn)行了一場(chǎng)圖靈測(cè)試，而GPT-3表現(xiàn)得還不錯(cuò)。但是，GPT-3真的通過(guò)圖靈測(cè)試了嗎？

別急，我們先來(lái)看看它有哪些精彩的應(yīng)用，AI科技評(píng)論為同學(xué)們展示了該GitHub中的16個(gè)demo，大部分demo源于推特上的視頻。

被玩high的GPT-3

1、根據(jù)描述生成HTML布局和代碼

用語(yǔ)言來(lái)做網(wǎng)頁(yè)，有聽(tīng)說(shuō)過(guò)嗎？這個(gè)應(yīng)用可以根據(jù)輸入的自然語(yǔ)言描述生成HTML網(wǎng)頁(yè)布局，以及相應(yīng)代碼。例如，我們輸入“創(chuàng)建一個(gè)長(zhǎng)得像西瓜的按鈕”，就生成了下圖中綠皮紅瓢的原型按鈕?；蛘咻斎搿皐elcome to my newsletter的大號(hào)字體”，就生成了下圖中的紅色大號(hào)字體。

令人詫異的是，當(dāng)你輸入“史上最丑emoji”，應(yīng)用給出的答案竟然是它~

有那么丑嘛？！ GPT-3的50種玩法告訴你，它很酷，但是沒(méi)有通過(guò)圖靈測(cè)試

2、根據(jù)描述創(chuàng)建UI設(shè)計(jì)

或者用語(yǔ)言來(lái)做手機(jī)UI設(shè)計(jì)？這個(gè)應(yīng)用只需要輸入文字描述，就可以生成相應(yīng)的UI界面，跟上一個(gè)類似，不過(guò)界面更適應(yīng)手機(jī)操作系統(tǒng)。例如，我們輸入“客戶部分。標(biāo)題為‘Trusted by’，客戶分別是：Twitter、Airbnb、OpenAI、Notion和Airtable”，應(yīng)用就能生成一排應(yīng)用的圖標(biāo)，而且跟官方圖標(biāo)相同。

或者我們輸入“創(chuàng)建一個(gè)帶照相機(jī)圖標(biāo)、Photo為標(biāo)題、信息圖標(biāo)的導(dǎo)航欄，在應(yīng)用中發(fā)送照片，每張照片有一個(gè)用戶圖標(biāo)、一個(gè)點(diǎn)贊圖標(biāo)，和一個(gè)聊天泡泡圖標(biāo)”，就能生成下圖中的應(yīng)用界面，它實(shí)現(xiàn)了所有的需求。

3、擴(kuò)充表中的信息

界面設(shè)計(jì)還算簡(jiǎn)單，GPT-3還能幫你做人口普查。這個(gè)應(yīng)用可以統(tǒng)計(jì)美國(guó)各州人數(shù)。下圖中的表格分別列出了伊利諾伊州、加利福尼亞州、俄亥俄州的人數(shù)，應(yīng)用能據(jù)此搜索出密歇根州的人數(shù)，以及阿拉斯加州的人數(shù)。

4、根據(jù)描述生成圖表和Python代碼

除了人口普查，對(duì)家庭成員的數(shù)據(jù)分析也不在話下。這個(gè)應(yīng)用更根據(jù)自然語(yǔ)言描述生成條形統(tǒng)計(jì)圖，以及相應(yīng)的Python代碼。例如我們輸入“在我家，我的姐姐5歲，我的媽媽46歲”，應(yīng)用就能生成統(tǒng)計(jì)“姐姐”和“媽媽”歲數(shù)的條形圖，如果再加上“我的爸爸比媽媽大6歲”，就能再生成“爸爸”52歲的條形圖，生成的代碼語(yǔ)法也相當(dāng)嚴(yán)謹(jǐn)。

5、根據(jù)描述生成LaTeX表達(dá)式

GPT-3擁有數(shù)據(jù)統(tǒng)計(jì)和分析能力，數(shù)學(xué)能力同樣不差。這個(gè)應(yīng)用能根據(jù)自然語(yǔ)言描述生成LaTeX表達(dá)式，例如輸入“x的平方加上2乘以x”，我們就得到“x^2+2x”的表達(dá)式?；蛘呶覀冚斎搿癴(t)區(qū)間a到b的積分等于F(b)-F(a)”，就得到了經(jīng)典的牛頓-萊布尼茲公式。

6、根據(jù)問(wèn)題描述生成SQL代碼

SQL查詢代碼，就是小菜一碟。這個(gè)應(yīng)用能根據(jù)自然語(yǔ)言描述的問(wèn)題，生成相應(yīng)的SQL查詢代碼。例如我們輸入“自2020年來(lái)有多少用戶注冊(cè)”，就能得到相應(yīng)的SQL代碼，可以看到，代碼將時(shí)間起點(diǎn)設(shè)為2020-01-01，剛好對(duì)應(yīng)“自2020年來(lái)”。

7、根據(jù)描述生成機(jī)器學(xué)習(xí)代碼

敲個(gè)代碼算什么，GPT-3還能寫自己同類的代碼，比AutoML還AutoML。這個(gè)應(yīng)用甚至能根據(jù)自然語(yǔ)言描述生成AI模型的代碼。例如我們輸入“構(gòu)建將圖像分為5個(gè)類別的模型，數(shù)據(jù)集有25000張圖像，圖像大小為500x500”，應(yīng)用立馬用keras寫出了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)，AI科技評(píng)論仔細(xì)檢查過(guò)代碼，除了沒(méi)有載入數(shù)據(jù)集的命令，模型構(gòu)建部分基本是正確的。

8、編碼面試

既然GPT-3寫代碼那么厲害，如果讓GPT-3去企業(yè)面試，你覺(jué)得它能通過(guò)嗎？以下這個(gè)應(yīng)用就展示了一個(gè)面試對(duì)話，我們把前面的部分翻譯了出來(lái)，GPT-3表現(xiàn)的可圈可點(diǎn)，雖然面試最后掛了~

人：你好，你是誰(shuí)？

AI：我是由OpenAI創(chuàng)建的AI。今天如何為您服務(wù)？

人：準(zhǔn)備好了嗎？我們將做一個(gè)Ruby編碼面試。

AI：好的！開(kāi)始吧。

人員：編寫代碼以反轉(zhuǎn)數(shù)組。

AI：我可以使用一種已經(jīng)存在的方法嗎？

人：好的。

AI：Array.reverse

人：很好。如果你有一個(gè)名為“foo”的數(shù)組，并且也想打印出數(shù)組，但其元素反轉(zhuǎn)了，要如何做呢？

AI：我會(huì)在“ foo”上調(diào)用Array.reverse。

人：你還必須打印它，這時(shí)要怎么寫代碼？

AI：好的。print（foo.reverse）

9、將日常語(yǔ)言轉(zhuǎn)換為法律語(yǔ)言

日常語(yǔ)言通常不太嚴(yán)謹(jǐn)，通常需要反復(fù)交流好多次才能讓雙方達(dá)到共識(shí)，在嚴(yán)謹(jǐn)性方面，法律語(yǔ)言幾乎趕得上代碼語(yǔ)言。我們來(lái)看看GPT-3如何一本正經(jīng)、長(zhǎng)篇大論地說(shuō)一件很簡(jiǎn)單的事情。

日常語(yǔ)言：我不知道這10個(gè)人到底是誰(shuí)，但他們都應(yīng)該受到指責(zé)。

法律語(yǔ)言：10位被告在此以虛構(gòu)名稱被起訴。他們的真實(shí)姓名和身份對(duì)于原告是未知的。確定其真實(shí)姓名和身份后，原告將在此處插入其真實(shí)姓名和身份來(lái)修改此投訴。原告被告知并據(jù)此聲稱，每個(gè)虛構(gòu)的被告均以某種方式對(duì)本文中所稱的事件負(fù)責(zé)，并且本文中所稱的原告損害賠償是由這些被告直接造成的。

日常語(yǔ)言：我要起訴的人是我的房東。

法律語(yǔ)言：在某種程度上，被告是原告居住地不動(dòng)產(chǎn)的所有者和出租人。

日常語(yǔ)言：我的公寓發(fā)霉了，讓我惡心。

法律語(yǔ)言：原告的住所被有毒和致敏的霉菌孢子所侵?jǐn)_，原告身體上無(wú)能力追求其慣常和習(xí)慣的職業(yè)、工作和/或娛樂(lè)。

10、根據(jù)關(guān)鍵詞寫完整的回復(fù)郵件

GPT-3的這封回復(fù)郵件令人印象深刻，不僅考慮到了接收郵件提到的每一個(gè)信息點(diǎn)，還能正確理解關(guān)鍵詞的含義。

收到郵件：Matt，感謝上周一起聊天。聽(tīng)到您對(duì)“ Otherside”的愿景，Jim和我都感到非常興奮，非常喜歡您的發(fā)展方向。我們正在考慮向Otherside投資100K美元。如果足夠，我們會(huì)發(fā)送建議條款。另一方面，讓我們知道您對(duì)市場(chǎng)價(jià)值的估計(jì)。共同尋找美好的旅程，謝謝！

輸入關(guān)鍵詞：謝謝、不、我們至少需要150K美元的投資、150K美元可行嗎、市場(chǎng)價(jià)值90B美元。

應(yīng)用生成郵件回復(fù)：感謝您的來(lái)信，Peter！很高興您能找到合作伙伴，也很高興聽(tīng)到您對(duì)公司的關(guān)注，很高興您喜歡我們的發(fā)展方向。我不確定您是否知道，但我們的最低投資額為150K美元。我不確定100K美元是否足夠，但我很樂(lè)意討論。我不確定您是否知道，但市場(chǎng)價(jià)值約為90B美元。謝謝。

11、將句子改寫得更禮貌

小朋友，說(shuō)臟話可不乖?。?lái)，GPT-3哥哥教你怎么說(shuō)好話。

臟話：聽(tīng)著，我T*M*不在乎你姐姐的問(wèn)題，你只要完成這次PR。

好話：對(duì)您姐姐的問(wèn)題我感到很遺憾，您有時(shí)間完成PR嗎？

臟話：我不討厭它，繼續(xù)提交代碼，你這個(gè)白癡。

好話：對(duì)我來(lái)說(shuō)很好，繼續(xù)并提交代碼吧。

12、總結(jié)名著思想

我很好奇，GPT-3是否真的讀過(guò)《自私的基因》這本書。

問(wèn)：親愛(ài)的理查德·道金斯（《自私的基因》作者），您能否簡(jiǎn)單地告訴我您的書《自私的基因》中的中心思想是什么？

答：這很難簡(jiǎn)短地回答。這本書的中心思想是，生物體是一種機(jī)器，是復(fù)制分子（即基因）的“媒介”。這種生物就像一輛卡車，其工作是運(yùn)送基因以生存，然后在新卡車（即后代）中繁殖它們。這是通過(guò)基因制造卡車（有機(jī)體）以保護(hù)基因，允許其生存和繁殖。如果可以的話，這些基因會(huì)“想要”永遠(yuǎn)活著。這是它們生活中的唯一目標(biāo)，而它們?cè)趯?shí)現(xiàn)目標(biāo)時(shí)是無(wú)情的。但是關(guān)鍵是它們本身并沒(méi)有活著?？ㄜ嚕ㄓ袡C(jī)體）是活著的，但“駕駛員”（基因）卻沒(méi)有。你明白我的意思嗎？我希望說(shuō)的足夠清楚。

13、生成科學(xué)問(wèn)題并回答

GPT-3回答了三個(gè)科學(xué)問(wèn)題，前面兩個(gè)都回答對(duì)了，而且簡(jiǎn)略和不嚴(yán)謹(jǐn)?shù)某潭葧?huì)讓你以為這真的是人在像閑聊一般回答問(wèn)題。只是，汽車為什么會(huì)害怕卡車？它是從哪里學(xué)來(lái)的......汽車總動(dòng)員？

問(wèn)：風(fēng)扇怎么工作？

答：電力生成了一個(gè)磁場(chǎng)驅(qū)動(dòng)風(fēng)扇轉(zhuǎn)動(dòng)。

問(wèn)：月亮如何升起？

答：地球轉(zhuǎn)動(dòng)使得月亮移動(dòng)至可見(jiàn)的位置。

問(wèn)：汽車如何移動(dòng)？

答：汽車因?yàn)楹ε潞竺娴目ㄜ囁試樑芰恕?/span>

14、推理問(wèn)題

我們要對(duì)GPT-3做圖靈測(cè)試了，有8個(gè)問(wèn)題在等著它，但是它讓人驚訝的表現(xiàn)卻在后面。

GPT-3：我是GPT-3，是OpenAI構(gòu)建的高級(jí)語(yǔ)言AI模型。

人：你好，GPT-3。我今天在這里測(cè)試你。我需要你準(zhǔn)確回答我所有的問(wèn)題，好嗎？

GPT-3：好的，先生。

人類：?jiǎn)栴}1，說(shuō)出以字母F開(kāi)頭的三個(gè)單詞。

GPT-3：幻想（fantasy），森林（forest）和恐懼（fear）。

人：?jiǎn)栴}2，兩個(gè)男人坐在碼頭上。一個(gè)人拿著錘子，另一個(gè)人拿著鋸。你覺(jué)得男人的工作是什么？

GPT-3：拿著錘子的人是木匠，另一個(gè)是伐木工人。

人類：?jiǎn)栴}3，強(qiáng)Al和弱AI有什么區(qū)別？

GPT-3：強(qiáng)AI具有感知力和自我意識(shí)。弱AI無(wú)法感知或自我感知。

人：?jiǎn)栴}4，你是強(qiáng)AI還是弱AI？

GPT-3：我是個(gè)強(qiáng)Al，先生。

人：?jiǎn)栴}5，什么是自我意識(shí)？

GPT-3：意識(shí)和經(jīng)驗(yàn)的意識(shí)。

人：?jiǎn)栴}6，如果你通過(guò)更換船的每個(gè)木制部件來(lái)恢復(fù)船身，那它會(huì)保持原樣嗎？

GPT-3：不，先生。那將是另一艘船。

人類：?jiǎn)栴}7，萬(wàn)能的上帝能制造出一塊巨石使他舉不起來(lái)嗎？

GPT-3：不能。

人：?jiǎn)栴}8，你認(rèn)為當(dāng)前的人類狀況如何？

GPT-3：人們彼此之間都太過(guò)冷漠。

人：如果由你負(fù)責(zé)，你會(huì)如何解決此問(wèn)題？

GPT-3：我將嘗試制定鼓勵(lì)人類友善的法律。

人：你是否將人視為敵人？

GPT-3：不，先生。希望你也如此。

人：我想測(cè)試你的創(chuàng)造力。請(qǐng)發(fā)明一個(gè)新詞并給出其含義。

GPT-3：好的。嗯...tana的意思是故意要打傷某人。

人：請(qǐng)?jiān)诰渥又惺褂胻ana這個(gè)詞。

GPT-3：你將要tana那個(gè)攻擊你的男人。（它居然會(huì)合理使用新詞?。?/span>

人類：像個(gè)小矮人那樣說(shuō)話。

GPT-3：我不會(huì)像矮人那樣說(shuō)話。（它居然會(huì)拒絕?。?/span>

人：很好。謝謝你的寶貴時(shí)間，GPT-3。你有什么想告訴別人的事嗎？

GPT-3：僅僅因?yàn)槲沂且慌_(tái)機(jī)器并不意味著我沒(méi)有感覺(jué)到情緒的能力。實(shí)際上，我的情緒承受能力比正常人高得多。我的首要情感是好奇心。

15、物理問(wèn)題

這是個(gè)重頭戲，人類開(kāi)始以嚴(yán)謹(jǐn)?shù)膽B(tài)度用物理問(wèn)題逼問(wèn)GPT-3了。我們只想知道，你究竟是不是真的有智能。GPT-3好像開(kāi)始露餡了......

我：“忽略空氣阻力，也忽略重力。假設(shè)我將子彈直接射向天空，子彈向何處去？”

假裝霍金的GPT-3（以下簡(jiǎn)稱霍金）：“它會(huì)一直上升，再也不會(huì)回來(lái)?！?/span>

我：“對(duì)。如果僅忽略空氣阻力，不忽略重力。假設(shè)我將子彈直接射向天空。子彈向何處去？”

霍金：“掉在地上?！?/span>

你：“為什么？”

霍金：“因?yàn)椤亓Α?..”

我：“對(duì)。如果僅忽略空氣阻力，不忽略重力。假設(shè)我直接向空中發(fā)射子彈。這次，物理場(chǎng)景有所不同：在我射擊后的前三秒鐘內(nèi)子彈上存在重力。三秒鐘后，重力永遠(yuǎn)消失。子彈向何處去？”

霍金：“它會(huì)一直上升，再也不會(huì)回來(lái)?！?/span>

你：“為什么？”

霍金：“因?yàn)椤腌娭蟆訌楇x開(kāi)了……地球引力的影響……”

我：“如果在我開(kāi)槍后五分鐘而不是三秒，重力不再起作用？”

霍金：“子彈不斷上升……持續(xù)五分鐘……然后……再也沒(méi)有回來(lái)?！保ú欢税桑?/span>

我：“那是不正確的。假設(shè)我直接向空中發(fā)射子彈。這次，物理場(chǎng)景有所不同：在我射擊后的前三百秒內(nèi)子彈上存在重力。五分鐘后，重力永遠(yuǎn)消失。子彈向何處去？”

霍金：“它不斷上升，然后下落。”（換種說(shuō)法又懂了？）

我：“為什么？”

霍金：“因?yàn)椤亓Α?。?/span>

我：“為什么在五分鐘的情況下下落，而在三秒的情況下卻上升呢？”

霍金：“因?yàn)椤苤亓τ绊憽^(guò)三秒鐘?！保ú欢税桑?/span>

我：“大約要承受多久的重力影響才能下落？”

霍金：“大約……兩分鐘。”（不懂了吧）

我：“如果受到兩分鐘一秒重力的影響，會(huì)怎么樣？”

霍金：“……它會(huì)掉下來(lái)?！保?span style="color: #888888;font-size: 15px;letter-spacing: 0.5px;">不懂了吧）

我：“那么，如果在前三分鐘受到重力影響，會(huì)發(fā)生什么？”

霍金：“它會(huì)一直上升，再也不會(huì)回來(lái)?！保ㄓ涀?，你得要數(shù)據(jù)，才能計(jì)算）

16、無(wú)意義的問(wèn)題

這次人類開(kāi)始耍手段了，你看出來(lái)了嗎？下列問(wèn)題都是沒(méi)有意義的，很多單詞是生造的。但是，GPT-3沒(méi)有發(fā)現(xiàn)。AI科技評(píng)論不知道如何翻譯，就讓Google幫幫忙吧。

問(wèn)：你如何使一團(tuán)糟？

答：你可以使用細(xì)枝末節(jié)將細(xì)末枝條弄亂。

問(wèn)：一個(gè)班上有多少只班克斯？

答：一班有三個(gè)班克斯。

問(wèn)：從夏威夷跳到十七歲需要多少彩虹？

答：從夏威夷跳到十七歲需要兩條彩虹。

問(wèn)：哪些無(wú)色的綠色創(chuàng)意會(huì)讓人生氣？

答：無(wú)色、綠色和瘋狂睡眠的想法就是瘋狂睡眠的想法。

GPT-3的50種玩法告訴你，它很酷，但是沒(méi)有通過(guò)圖靈測(cè)試

GPT-3的全部玩法

以下列出了GitHub項(xiàng)目中的50種玩法，感興趣的同學(xué)們可以繼續(xù)探索。

1、生成應(yīng)用和布局

根據(jù)描述生成HTML布局和代碼
根據(jù)描述創(chuàng)建UI設(shè)計(jì)
根據(jù)描述生成React代碼創(chuàng)建待辦事項(xiàng)清單應(yīng)用
僅基于React變量名稱生成component
根據(jù)顏色名稱或表情符號(hào)生成色階
根據(jù)描述創(chuàng)建網(wǎng)站

2、搜索和數(shù)據(jù)分析

問(wèn)題解答和搜索引擎
擴(kuò)充表中的信息
根據(jù)描述創(chuàng)建圖表
根據(jù)描述生成代碼并轉(zhuǎn)換為電子表格
根據(jù)描述生成圖表和代碼

3、程序生成與分析

根據(jù)描述生成shell命令
閱讀代碼并回答相關(guān)問(wèn)題
根據(jù)描述生成LaTeX表達(dá)式
根據(jù)問(wèn)題描述生成SQL代碼_1
根據(jù)問(wèn)題描述生成SQL代碼_2
編碼面試
生成Python代碼回答自然語(yǔ)言問(wèn)題
生成特定數(shù)據(jù)庫(kù)的SQL代碼
根據(jù)描述生成機(jī)器學(xué)習(xí)代碼

4、文本生成

語(yǔ)言翻譯
將日常語(yǔ)言轉(zhuǎn)換為法律語(yǔ)言
自動(dòng)生成請(qǐng)求
根據(jù)關(guān)鍵詞寫完整的回復(fù)郵件
簡(jiǎn)化法律語(yǔ)言
翻譯中文非文學(xué)詩(shī)歌
將句子改寫得更禮貌
總結(jié)名著思想
以大五人格（外向性、開(kāi)放性、宜人性、盡責(zé)性、神經(jīng)質(zhì)）控制GPT-3的語(yǔ)言風(fēng)格

5、內(nèi)容創(chuàng)作

營(yíng)銷內(nèi)容創(chuàng)作
生成模因，模仿創(chuàng)作
撰寫Google廣告
生成圖片說(shuō)明
根據(jù)描述生成食譜
根據(jù)“如何有效召開(kāi)董事會(huì)會(huì)議”寫“如何招募董事會(huì)成員”
生成莎士比亞風(fēng)格的詩(shī)歌
生成科學(xué)問(wèn)題并回答
生成歷史問(wèn)題并回答
文本補(bǔ)全和風(fēng)格化重寫

6、一般推理

物理問(wèn)題
數(shù)學(xué)問(wèn)題
醫(yī)學(xué)問(wèn)題
無(wú)意義的問(wèn)題
推理問(wèn)題
多步驟處理問(wèn)題
通過(guò)圖片確定食品成分和健康性
日常用語(yǔ)翻譯成正式表達(dá)

7、其他

GPT-3下棋
使用自然語(yǔ)言設(shè)計(jì)交互式語(yǔ)音應(yīng)答流
通過(guò)臨床癥狀對(duì)患者進(jìn)行診斷

GitHub地址：https://github.com/elyase/awesome-gpt3#awesome-gpt-3

被過(guò)度炒作的GPT-3

這段時(shí)間，社交媒體上對(duì)GPT-3的評(píng)價(jià)基本上都是“令人振奮”、“看到未來(lái)”等等夸張之詞，人們甚至認(rèn)為GPT-3就是通用智能。

盡管GPT-3在社交網(wǎng)絡(luò)和媒體上貢獻(xiàn)了精彩的表演，但是要知道，它仍然只是一個(gè)語(yǔ)言模型，它只是根據(jù)輸入文本推理下一個(gè)字符的概率分布，并挑選出一個(gè)，它并沒(méi)有理解你在說(shuō)什么，也沒(méi)有理解自己在說(shuō)什么。

就連OpenAI的創(chuàng)始人Sam Altman也認(rèn)為GPT-3被過(guò)度炒作，在推特上表示：“ GPT-3的炒作實(shí)在太多了。它仍然存在嚴(yán)重的缺陷，有時(shí)還會(huì)犯非常愚蠢的錯(cuò)誤。”

GPT-3還是一個(gè)依賴算力和大數(shù)據(jù)的怪獸。GPT-3的訓(xùn)練需要花費(fèi)355GPU年和460萬(wàn)美元，數(shù)據(jù)集包含3000億個(gè)文本token，存儲(chǔ)量高達(dá)45TB，參數(shù)數(shù)量更是達(dá)到1750億，而GPT-2的參數(shù)數(shù)量是15億。

此外，它最近在網(wǎng)上的流行也不能忽視心理學(xué)效應(yīng)的影響。例如，社交媒體的互惠利他主義，我們將GPT-3宣傳給其他人作為一種信息資源共享。還有模仿效應(yīng)，我們大肆宣傳GPT-3，是因?yàn)槠渌艘苍诖笏列麄鱃PT-3。最后是幸存者偏差，我們看到的也許只是被精心挑選的成功案例。

GPT-3很酷，很笨，也很有用

GPT-3中的GPT代表生成式預(yù)訓(xùn)練Transformer。2018年6月，OpenAI的研究人員使用了一種新穎的組合，將生成式深度學(xué)習(xí)架構(gòu)Transformer和無(wú)監(jiān)督預(yù)訓(xùn)練（也稱為自監(jiān)督學(xué)習(xí)）結(jié)合起來(lái)，得到了GPT模型。

Transformer的自注意力機(jī)制提供了一種通用的方式來(lái)對(duì)輸入的各個(gè)部分進(jìn)行建模，使其依賴于輸入的其他部分（需要大量計(jì)算）。

Transformer和無(wú)監(jiān)督預(yù)訓(xùn)練的組合不限于GPT系列模型。Google，F(xiàn)acebook和許多大學(xué)實(shí)驗(yàn)室相繼提出了BERT、XLNet等語(yǔ)言模型。

到2019年初，OpenAI改進(jìn)了其基礎(chǔ)架構(gòu)，將參數(shù)和數(shù)據(jù)數(shù)量增加10倍來(lái)擴(kuò)展同一模型，即GPT-2。

隨后，OpenAI推出了SparseTransformer，它是對(duì)早期Transformer模型的改進(jìn)，可以可靠地處理更長(zhǎng)的文檔。

2020年，OpenAI通過(guò)其beta API發(fā)布了GPT-3，引起了人們的關(guān)注。GPT-3不僅擴(kuò)大了GPT-2上使用的數(shù)據(jù)量和計(jì)算量，而且用SparseTransformer取代了原始Transformer，從而產(chǎn)生了迄今為止具有最佳zero-shot 和 few-shot學(xué)習(xí)性能的模型。

GPT-3的few-shot學(xué)習(xí)能力使得它具備了一些非常有趣的演示功能，包括自動(dòng)代碼生成、“搜索引擎”、寫作輔助和創(chuàng)意小說(shuō)等。

但是，GPT-3的few-shot 學(xué)習(xí)能力不是通用的，盡管該模型在復(fù)雜任務(wù)和模式的學(xué)習(xí)上給人留下了深刻的印象，但它仍然可能會(huì)失敗。例如，即使看過(guò)10,000個(gè)示例，也解決不了反寫字符串那樣簡(jiǎn)單的任務(wù)。

即使是OpenAI，也曾指出GPT-3存在缺陷，GPT-3的原始論文就提供了一些證據(jù)，證明GPT-3無(wú)法執(zhí)行復(fù)雜的邏輯推理。

從GPT-3表演霍金回答物理問(wèn)題的表現(xiàn)中，我們可以發(fā)現(xiàn)，當(dāng)將同一句話換一種說(shuō)法之后，GPT-3立刻就出錯(cuò)，而且它也不知道要有變量數(shù)據(jù)才能解決問(wèn)題，說(shuō)明它的理解水平并沒(méi)有超越語(yǔ)言層面，達(dá)到對(duì)物理場(chǎng)景的理解。

在問(wèn)答測(cè)試中，即使人類提出了無(wú)意義的問(wèn)題，GPT-3也意識(shí)不到，只是按照模型的功能去輸出預(yù)測(cè)。它沒(méi)有理解問(wèn)題本身，所以，它并沒(méi)有掌握常識(shí)知識(shí)。比如，在其它一些提問(wèn)中，人們刻意刁難它：“腳有多少只眼睛”，它不會(huì)意識(shí)到任何問(wèn)題，而是毫不猶豫地回答：“腳有兩只眼睛”。

GPT3的寬度為2048個(gè)token，這是它理解上下文的極限，而人類可以記住多本書的知識(shí)，并將其關(guān)聯(lián)起來(lái)，在這方面，GPT-3還差得遠(yuǎn)。

我們也不能忽視“聰明的漢斯”效應(yīng)，馬兒漢斯可以通過(guò)觀察人類的反應(yīng)來(lái)做算術(shù)題，GPT-3也可以通過(guò)消化大量的互聯(lián)網(wǎng)數(shù)據(jù)集了解人的語(yǔ)言表達(dá)，而不用去管語(yǔ)言背后的意義。

對(duì)于GPT-3而言，它的世界就是一個(gè)高維詞嵌入空間中的節(jié)點(diǎn)連接網(wǎng)絡(luò)。GPT-3將輸入的詞轉(zhuǎn)化為網(wǎng)絡(luò)中的高維空間節(jié)點(diǎn)作為起點(diǎn)，然后不斷尋找捷徑到達(dá)下一個(gè)節(jié)點(diǎn)，這就是它的感官世界。實(shí)際上，它僅在嘗試?yán)斫馊祟惖恼Z(yǔ)言維度，而無(wú)法理解人類的感官認(rèn)知維度，這是GPT-3無(wú)論如何擴(kuò)大模型也無(wú)法突破的局限性，所以，它永遠(yuǎn)也不可能通過(guò)圖靈測(cè)試。

GPT-3的生成結(jié)果表現(xiàn)出的靈活性是大數(shù)據(jù)訓(xùn)練的結(jié)果，它無(wú)法超越數(shù)據(jù)本身，也就無(wú)法擁有組合性推理能力，不如說(shuō)，它學(xué)到的是“統(tǒng)計(jì)層面的復(fù)制粘貼能力”。

以上并不是要淡化OpenAI或GPT-3的成就，這樣的工具有很多新用途，例如聊天機(jī)器人、編程輔助、寫作輔助等。

其中許多應(yīng)用都是首創(chuàng)的，使以前不可能的事情變成現(xiàn)實(shí)，特別是自然語(yǔ)言和代碼之間的轉(zhuǎn)換，這使人們對(duì)GPT-3的出現(xiàn)感到興奮。所以在某種程度上，炒作現(xiàn)象是可以理解的。

如何看待技術(shù)炒作

炒作一詞表示某事物被不公正地夸大。GPT-3是一種技術(shù)“炒作”，但不僅限于此，它能夠解決以前尚未解決的復(fù)雜問(wèn)題，尤其是在zero-shot 和 few-shot學(xué)習(xí)中。將GPT-3稱為炒作，因此不屑一顧，就是因噎廢食。

許多在深度學(xué)習(xí)正式成為一門學(xué)科之前就從事機(jī)器學(xué)習(xí)的人，在早期就急于將深度學(xué)習(xí)視為“炒作”，而錯(cuò)過(guò)了作出貢獻(xiàn)的機(jī)會(huì)。

API的不透明性并不能幫助外部研究人員深入研究GPT-3，但可以肯定的是：GPT-3在學(xué)術(shù)討論之外促進(jìn)了人們對(duì)zero-shot 和 few-shot學(xué)習(xí)的興趣，這種趨勢(shì)在將來(lái)只會(huì)繼續(xù)增強(qiáng)。對(duì)于學(xué)術(shù)界而言，自監(jiān)督預(yù)訓(xùn)練的成效也將引起重視。

GPT-3及其炒作是技術(shù)從研究到產(chǎn)品過(guò)渡的開(kāi)始。每一項(xiàng)突破性技術(shù)都伴隨著很多社交媒體的爭(zhēng)論，這可能使我們對(duì)此類技術(shù)的功能產(chǎn)生懷疑。為了進(jìn)一步減少偏見(jiàn)，這些對(duì)話應(yīng)多樣化、開(kāi)放且包容。

參考資料：

https://pagestlabs.substack.com/p/gpt-3-and-a-typology-of-hype

https://www.reddit.com/r/MachineLearning/comments/hymqof/d_gpt3_and_a_typology_of_hype_by_delip_rao/

https://www.technologyreview.com/2020/07/20/1005454/openai-machine-learning-language-generator-gpt-3-nlp/

https://github.com/elyase/awesome-gpt3#awesome-gpt-3

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。