丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李菁瑛
發(fā)送

4

Google新開發(fā)一款A(yù)I系統(tǒng),它可以“教”機(jī)器人模仿狗狗的動(dòng)作

本文作者: 李菁瑛 2020-04-04 11:42
導(dǎo)語:研究人員用大約2億個(gè)樣本訓(xùn)練了一個(gè)模擬機(jī)器人來模擬運(yùn)動(dòng)技能。

本周發(fā)表的一篇預(yù)印本論文和博客文章顯示,谷歌研究人員開發(fā)了一款可以學(xué)習(xí)和模擬動(dòng)物的動(dòng)作的AI系統(tǒng),以賦予機(jī)器人更大的靈活性。該論文的合著者認(rèn)為,他們的方法可以促進(jìn)機(jī)器人的發(fā)展,從而讓機(jī)器人能夠完成生活中一些對(duì)靈活性要求較高的任務(wù),例如在多層倉庫和履行中心之間運(yùn)輸材料。

該團(tuán)隊(duì)的框架采用動(dòng)物(在本例中是狗)的動(dòng)作捕捉片段,并使用強(qiáng)化學(xué)習(xí)(reinforcement learning)來訓(xùn)練控制策略,強(qiáng)化學(xué)習(xí)是一種通過獎(jiǎng)勵(lì)激勵(lì)軟件代理完成目標(biāo)的訓(xùn)練技術(shù)。

研究人員說,為該系統(tǒng)提供不同的參考運(yùn)動(dòng),使他們能夠“教”一個(gè)四足Unitree-Laikago機(jī)器人執(zhí)行一系列行為,從快速行走(速度高達(dá)每小時(shí)2.6英里)到跳躍和轉(zhuǎn)身。

為了驗(yàn)證他們的方法,研究人員首先編制了一組真實(shí)的狗表演各種技能的數(shù)據(jù)集。(訓(xùn)練主要在物理模擬中進(jìn)行,以便能夠密切跟蹤參考運(yùn)動(dòng)的姿勢(shì))。然后,通過使用獎(jiǎng)勵(lì)函數(shù)中的不同運(yùn)動(dòng)(描述了行為者的行為方式),研究人員用大約2億個(gè)樣本訓(xùn)練了一個(gè)模擬機(jī)器人來模擬運(yùn)動(dòng)技能。

Google新開發(fā)一款A(yù)I系統(tǒng),它可以“教”機(jī)器人模仿狗狗的動(dòng)作

但模擬器通常只提供對(duì)真實(shí)世界的粗略近似。為了解決這個(gè)問題,研究人員采用了一種自適應(yīng)技術(shù),該技術(shù)可以隨機(jī)化模擬中的動(dòng)力學(xué),例如改變物理量,例如機(jī)器人的質(zhì)量和摩擦力。使用編碼器將這些值映射到數(shù)字表示(即編碼),該數(shù)字表示作為輸入傳遞給機(jī)器人控制策略。當(dāng)將該策略部署到實(shí)際的機(jī)器人上時(shí),研究人員移除了編碼器,并直接搜索一組變量,這些變量使機(jī)器人能夠成功執(zhí)行技能。

該團(tuán)隊(duì)說,他們能夠在大約50個(gè)試驗(yàn)中使用不到8分鐘的真實(shí)數(shù)據(jù)來使策略適應(yīng)實(shí)際情況。此外,他們還演示了真實(shí)的機(jī)器人學(xué)習(xí)模仿狗的各種動(dòng)作,包括踱步和小跑,以及藝術(shù)家動(dòng)畫的關(guān)鍵幀動(dòng)作,如動(dòng)態(tài)跳躍轉(zhuǎn)身。

“我們證明,通過利用參考運(yùn)動(dòng)數(shù)據(jù),一種基于學(xué)習(xí)的方法能夠自動(dòng)合成控制器,以實(shí)現(xiàn)有腿機(jī)器人的各種行為?!痹撜撐牡暮现邔懙馈!巴ㄟ^將有效的領(lǐng)域自適應(yīng)樣本技術(shù)整合到培訓(xùn)過程中,我們的系統(tǒng)能夠?qū)W習(xí)模擬中的自適應(yīng)策略,然后可以快速將其應(yīng)用于實(shí)際部署中。”

Google新開發(fā)一款A(yù)I系統(tǒng),它可以“教”機(jī)器人模仿狗狗的動(dòng)作

然而,這種控制策略不是十全十美的。由于算法和硬件的限制,它無法學(xué)習(xí)高度動(dòng)態(tài)的行為(例如大的跳躍和奔跑),并且不如最佳的手動(dòng)設(shè)計(jì)控制器那樣穩(wěn)定。(在5種情節(jié)中,每種方法總共進(jìn)行15次試驗(yàn),現(xiàn)實(shí)世界中的機(jī)器人在6秒后踱步時(shí)平均下降;在5秒后向后小跑時(shí)平均下降;在旋轉(zhuǎn)時(shí)平均下降9秒)。對(duì)此,研究人員表示,將繼續(xù)改進(jìn)控制器的魯棒性,并開發(fā)可以從其他運(yùn)動(dòng)數(shù)據(jù)源(如視頻剪輯)學(xué)習(xí)的框架。(雷鋒網(wǎng)雷鋒網(wǎng))

注:本文由雷鋒網(wǎng)編譯自venturebeat

原文鏈接:

https://venturebeat.com/2020/04/03/googles-ai-learns-motions-from-dogs-applies-to-real-world-robot/

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

雷鋒網(wǎng)認(rèn)證編輯

關(guān)注云計(jì)算、5G、智慧教育賽道,微信號(hào):lijingying0451,業(yè)務(wù)交流請(qǐng)注明公司+職位。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說