10
本文作者: 恒亮 | 2016-11-05 09:12 |
還記得谷歌DeepMind團隊開發(fā)的人工智能機器人阿爾法狗(AlphaGo)與圍棋職業(yè)九段李世石的大戰(zhàn)么?現(xiàn)在DeepMind對人工智能機器人又有了新的想法:打游戲。
近日,DeepMind宣布,與暴雪娛樂達成了合作協(xié)議,將共同開發(fā)界面,讓人工智能研究員可以將機器學習軟件與《星際爭霸2》這款游戲連接在一起。讓人工智能技術去玩《星際爭霸2》,未來不排除與人類玩家展開新一輪“人機”大戰(zhàn)的可能。
DeepMind尚未開發(fā)出專業(yè)的《星際爭霸》軟件。該公司研究科學家 Oriol Vinyals 表示:“我們目前距離挑戰(zhàn)高手玩家還有很遠的距離?!辈贿^最新宣布的消息表明,該公司計劃將《星際爭霸》作為機器學習技術又一新的突破口。
Oriol Vinyals表示,人工智能研究員對《星際爭霸》感興趣是因為,相對于象棋和圍棋,游戲內的環(huán)境更接近于“復雜的真實世界”。他表示:“能夠勝任《星際爭霸》的軟件需要有效地運用存儲,有能力去進行長期規(guī)劃,以及使計劃適應最新信息。”而能夠掌握這些技能,勝任《星際爭霸》的機器學習系統(tǒng)“最終也將適用于真實世界任務”。
在《星際爭霸》中,玩家需要在蟲族、人族和神族3個種族中選擇其一,而每個種族都有各自的優(yōu)勢和劣勢。在游戲中玩家需要發(fā)展經濟,開拓新的領土,防止敵人隨時可能的入侵,并試圖對敵人造成盡可能多的傷害。成功的玩家需要記住關于地點的大量信息,即使這些地點在地圖上沒有顯示。
另外,《星際爭霸》的難度還在于玩家對對手行動的直觀了解非常少,甚至需要憑借經驗去推測敵人可能采取的策略,例如在哪里開礦,在哪里打怪,這與圍棋和象棋不同。此外,《星際爭霸》并非回合制游戲,機器學習系統(tǒng)需要面對持續(xù)變化的環(huán)境。對于《星際爭霸》,玩家一方面需要制定長線策略,一方面也要運用好短線戰(zhàn)術。讓軟件同時具備這兩方面的能力將是一個非常大的挑戰(zhàn)。
Facebook和微軟的研究人員此前也曾發(fā)表論文,介紹了如何讓人工智能系統(tǒng)去掌握早期版本的《星際爭霸》。事實上,能夠操控《星際爭霸》游戲的機器人軟件已被研發(fā)成功,但到目前為止這些系統(tǒng)還無法擊敗人類的高手玩家。
相關閱讀:
谷歌 DeepMind 的可微分神經計算機 DNC 怎么樣?看 Facebook AI 研究員田淵棟、賈揚清怎么說
只訓練一次數(shù)據就能識別出物體,谷歌全新 AI 算法“單次學習”
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。