4
本文作者: 逸炫 | 2016-04-22 16:38 |
圖:機器學(xué)習(xí)支持的算法預(yù)測了囧雪諾的最終命運。圖片來源:慕尼黑理工大學(xué)。
慕尼黑理工大學(xué)的科學(xué)家用人工智能、機器學(xué)習(xí)和大數(shù)據(jù)預(yù)測了《冰與火:權(quán)力的游戲》人物命運。《權(quán)力的游戲》終極懸念:薛定諤的囧雪諾。上一季大結(jié)局中,身中n刀的Stark家族成員囧雪諾,到底死了嗎?活了嗎?死了嗎活了嗎??
官方一致回答,死了死了死了。誰信啊。網(wǎng)絡(luò)上時不時就會看到“囧雪諾如何復(fù)活”的預(yù)測帖。
現(xiàn)在,“囧雪復(fù)活”陣營獲得了超硬的技術(shù)支持:慕尼黑理工大學(xué)的學(xué)霸Guy Yachday博士在一門關(guān)于人工智能、機器學(xué)習(xí)和而大數(shù)據(jù)的JavaScript 課程中指導(dǎo)了一個項目——預(yù)測結(jié)果是:囧雪諾死亡的概率只有11%。
Happy了嗎?還有呢。龍母丹尼斯·坦格利安會成為權(quán)力的游戲大贏家,雖然,有高達95%的死亡率。
該項目名為“冰與數(shù)據(jù)之歌”(好冷…)。項目有一個工具,追蹤每個角色相關(guān)的推文,記錄他們在馬丁創(chuàng)造的虛擬世界中的足跡,并且收集數(shù)據(jù),預(yù)測七大王國的未來。
項目發(fā)起人Yachdav博士來自以色列,在哥倫比亞大學(xué)完成了計算機科學(xué)和政治科學(xué)本科學(xué)位,以及MBA(金融與創(chuàng)業(yè)方向)學(xué)位,去年在慕尼黑理工大學(xué)完成生物信息科學(xué)博士學(xué)位。他還是醫(yī)藥數(shù)據(jù)庫和軟件研究公司Biosof的聯(lián)合創(chuàng)始人及CEO?!斑@個項目很好玩。我們研究小組的日常,是用數(shù)據(jù)挖掘和機器學(xué)習(xí)算法回答復(fù)雜的生物學(xué)問題。這個項目中我們運用了類似的技術(shù)。只是這次,研究的是人氣電視劇?!癥achdav博士說?!睌?shù)據(jù)挖掘和機器學(xué)習(xí)讓數(shù)字機器從現(xiàn)代生物學(xué)中獲益,進行疾病診斷、治療和預(yù)防。這樣一個‘真實世界’挑戰(zhàn),使得這個課程贏得了學(xué)生們的心。”慕尼黑理工大學(xué)生物信息學(xué)教授Burkhardt Rost說,“而且項目創(chuàng)造的互動視覺地圖可能打開一種數(shù)據(jù)視覺化的新方法,我們可以在未來的研究中繼續(xù)跟進。”
Yachdav博士說,他在圣誕假期期間有了“冰與數(shù)據(jù)之歌”的想法,因為放假沒有什么事情做(這…)?!耙荒臧胍郧?,我坐著,無聊,就開始自己做這件事。我開始收集信息,制作所有角色的屬性,但是放假完了還得回去工作,作為我博士項目的一部分,我得教一門課。”他說。“馬丁創(chuàng)造的史詩級復(fù)雜世界,提供了無窮的多維度數(shù)據(jù)資源,對于我們的課程來說是一個完美的設(shè)(借)定(口)?!?/strong>因此,他決定把項目作為JavaScript和數(shù)據(jù)課程的一部分,讓學(xué)生們一起來玩。
——學(xué)霸們無聊起來,特別任性啊。我們一起看看項目網(wǎng)站的介紹,如何利用人工智能算出主角們的終極命運。
機器學(xué)習(xí)
機器學(xué)習(xí)技術(shù)讓我們可以進行預(yù)測。它研究大量的過往數(shù)據(jù),然后自動生成數(shù)據(jù),來預(yù)測未來事件的可能性。《冰與火之歌》系列的一大“亮點”就是很多角色掛了,包括我們最愛的主角們。只有很少是壽終正寢,大部分都是死于非命。這些死亡是隨機的?還是因為角色們自帶哪些“找死”屬性?這些屬性可能是年齡、家族和性別。也可能是他們在人生關(guān)鍵點做出的錯誤決定。
這個項目里,我們希望找到所有已故角色的共同設(shè)定,以此預(yù)測健在角色的死亡率——預(yù)測誰最可能掛掉。
數(shù)據(jù)抽取
我們?nèi)ナ占怂心苷业降年P(guān)于角色的數(shù)據(jù)。要總結(jié)5本書、2028個角色的所有數(shù)據(jù),《冰與火》維基百科大概是信息的最好來源。針對每一個角色,我們都從維基中抽取了生死結(jié)果和各種屬性信息,共有超過30個不同的屬性。我們有了一個描述每個角色的信息庫。
屬性選擇
機器學(xué)習(xí)可以比較已故角色和健在角色的屬性,選擇那些”生死攸關(guān)“的屬性。我們將所有的屬性和角色名字輸入到機器學(xué)習(xí)算法中。
為選擇屬性,我們使用了RELIEF功能,用WEKA平臺的參數(shù)作為初始值。我們最后選出的“生死攸關(guān)”的屬性包括:角色在《群鴉盛宴》書中的出場、所屬家族、社會群體、角色在《與龍共舞》書中的出場、是否是貴族、性別、頭銜、年齡、婚姻狀況、配偶是死是活…...等24種屬性。
方法描述
我們使用了John Platt的序列最小優(yōu)化算法,來訓(xùn)練一個使用多項式核函數(shù)的支持向量機,由WEKA提供。為了訓(xùn)練和測試模型,我們將數(shù)據(jù)庫分為10個同等大小的子數(shù)據(jù)庫。我們在9組子數(shù)據(jù)中訓(xùn)練模型,用剩下的一組來測試。我們輪換不同的子數(shù)據(jù),讓每一組子數(shù)據(jù)都被測試過一次。這個過程叫做“十折交叉驗證”,可以驗證精度。最終結(jié)果的精度為74%。
在“冰與數(shù)據(jù)之歌”網(wǎng)站上,可以按角色姓名、受歡迎度或者死亡幾率排名查看角色,或者,直接輸入你最愛的角色,看看他/她的命運如何。
以下是人工智能最不看好的角色前五名:
冠軍獲得者:托曼·拜拉席恩Tommen Baratheon 97%死亡率
瑟曦·蘭尼斯特和羅伯特·拜拉席恩的兒子。果然,坐上鐵王座都是同一個命運。
第二名:史坦尼斯·拜拉席恩 Stannis Baratheon 96%死亡率
羅伯特·拜拉席恩的弟弟,有女巫助陣的“七大王國合法繼承人”之一。
第三名:丹尼斯·坦格利安 95%死亡率
我們來看看推特上大家對龍母的感情,正面的推文28227條,負面的推文13091條,龍母人氣棒棒噠。
第四名:“洋蔥騎士”戴佛斯·席渥斯 Davos Seaworth 91%死亡率
史坦尼斯國王的司令和忠實支持者。
并列第四名:“小手指頭”培提爾·貝里席 Petyr Baelish 91%死亡率
特殊行業(yè)從業(yè)者,野心小人物。不過從“冰與數(shù)據(jù)之歌”收集的數(shù)據(jù)來看——6975條正面推文,3253條負面推文——雖然人氣不如龍母,亦正亦邪的小拇指頭還是很受歡迎嘛。
Via 慕尼黑理工大學(xué) 及 冰與數(shù)據(jù)之歌
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。