0
本文作者: 黃善清 | 2019-02-28 22:32 |
雷鋒網(wǎng) AI 科技評論:Facebook AI 小組今日在博客開源了一個仿真 3D 環(huán)境平臺 Habitat,該平臺讓我們可以在其中訓練與評估 AI 智能體,正式宣告「3D 訓練時代」來臨。雷鋒網(wǎng)將之編譯如下。
在將學習到的技能運用到現(xiàn)實世界以前,Habitat 允許我們在逼真、高效的 3D 模擬器中對 AI 智能體(虛擬機器人)進行訓練。過去基于靜態(tài)數(shù)據(jù)集(ImageNet、COCO、VQA)的「互聯(lián)網(wǎng) AI」,搖身一變成在現(xiàn)實環(huán)境運作的「具身 AI」,進而賦予 AI 積極感知、長期規(guī)劃、從交互中學習以及基于環(huán)境的對話等能力。
為啥叫 Habitat ?因為這是 AI 智能體生活的地方。
總的來說,Habitat 是一個落實「具身 AI」研究的平臺,當中包括了 Habitat-Sim、Habitat-API 以及 Habitat Challenge。
Habitat-Sim
一個配備了可配置智能體、多款傳感器、通用 3D 數(shù)據(jù)集處理器(內(nèi)置支持 SUNCG、MatterPort3D、Gibson 及其他數(shù)據(jù)集)的靈活、高性能 3D 模擬器。以 Matterport3D 數(shù)據(jù)集的場景渲染過程為例,Habitat-Sim 的單線程運行高達數(shù)千幀/秒(FPS),且只需單個 GPU 就能實現(xiàn)超過 10,000 FPS 的多線程運行!
Github 網(wǎng)址:https://github.com/facebookresearch/habitat-sim
Habitat-API
Habitat-API 是一個能夠?qū)崿F(xiàn)「具身 AI」端到端開發(fā)任務的模塊化高級庫,這些開發(fā)任務包括:定義「具身 AI」任務(導航、指令跟蹤、問答等)、配置「具身」智能體(物理形式、傳感器、功能等),培訓這些智能體(通過模仿或強化學習,或者像經(jīng)典 SLAM 那樣完全不學習)以及通過標準指標對其定義任務的表現(xiàn)進行基準測試。
Github 網(wǎng)址:https://github.com/facebookresearch/habitat-api
Habitat 挑戰(zhàn)賽
我們將舉辦自動導航挑戰(zhàn)賽(在 EvalAI 平臺上舉行),旨在加速推動「具身 AI」的基準測試與研發(fā)進展。與傳統(tǒng)基于圖像數(shù)據(jù)集的「互聯(lián)網(wǎng) AI」挑戰(zhàn)賽(如 ImageNet LSVRC、COCO、VQA)不同的是,我們將基于參與者的上傳代碼而非預測結(jié)果進行評判。上傳的智能體會在最新的(隱形的)環(huán)境中進行評估,以測試其泛化能力。如果您有興趣參與,請在此表格中填寫姓名與電子郵件地址,我們將在提交生效后回復您。挑戰(zhàn)賽的獲勝者名單將會在 CVPR-2019 的 Habitat:Embodied Agents Challenge and Workshop 上宣布。
Github 網(wǎng)址:https://github.com/facebookresearch/habitat-challenge
其他類似平臺
OpenAI 的 Gym Retro
該平臺同樣主打智能體能力泛化,不過就局限在游戲領(lǐng)域,發(fā)布至今響應者眾。簡單來說,Gym Retro 可以幫助研究智能體在本質(zhì)相似但外觀不同的游戲之間進行泛化的能力,尤其關(guān)注同一游戲的不同級別之間進行泛化的比較容易的問題,涉及了包括世嘉和任天堂在內(nèi)的 1000 多款游戲。隨著 Gym Retro 一同發(fā)布的尚有一款集成工具,讓我們輕松添加游戲 ROM,進而創(chuàng)建儲存狀態(tài)、尋找內(nèi)存位置以及設計強化學習智能體實施方案。不過,該平臺依然存在一項棘手問題,那就是經(jīng)訓練的智能體存在 farm 獎勵現(xiàn)象,也就是專注于游戲得分,因此忽略了真正的隱藏任務,是它下一階段需要取得突破的地方。
英偉達的 Isaac
英偉達傾力打造的終極機器人 AI 虛擬訓練環(huán)境,與 Habitat 平臺性質(zhì)更接近,然而發(fā)布至今響應者寥寥。該平臺充分利用英偉達在物理引擎上的造詣,旨在打造一個遵從物理定律的「alternate universe」(替代空間),除了時間,該虛擬訓練空間將完全遵從現(xiàn)實世界的物理定律。該平臺希望在模擬機中學習過的機器人,就能達到貌似在現(xiàn)實世界中預訓練過的水平。在時間上,機器人 AI 將以多重「分身」在 Isaac 中進行訓練,每輪訓練中最聰明的那一個,將進入下一輪分配給每個智能體;再從中選出表現(xiàn)最好的那一個進入下一輪,取代上一輪的所有智能體——如此往復,以訓練出最聰明的機器人 AI。
via https://aihabitat.org/?fbclid=IwAR2nzCWxWuOy2klH7dnCKbTZ940F4UjKNwPGAT8CYViMHKWLkAKXDbK4M5c
雷鋒網(wǎng) AI 科技評論 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。