智東西(公眾號(hào):zhidxcom)
編譯 |? 陳駿達(dá)
編輯 |? Panken

智東西8月1日消息,7月15日,迪士尼公布了一篇16頁(yè)的論文,詳細(xì)介紹了他們新型雙足機(jī)器人BD-X的主要設(shè)計(jì)和控制方法。這個(gè)機(jī)器人外形酷似《機(jī)器人總動(dòng)員》里的“瓦力”,靈感源自于《星球大戰(zhàn)》中的同名機(jī)器人。其硬件采用標(biāo)準(zhǔn)零件和3D打印外殼,腿部有5個(gè)自由度,通過(guò)強(qiáng)化學(xué)習(xí)掌握了動(dòng)畫(huà)人物的行走姿態(tài),動(dòng)作靈巧流暢,還鍛煉出跨越復(fù)雜地形的能力。

在不久前的IEEE活動(dòng)上,這個(gè)迪士尼機(jī)器人還跟杭州宇樹(shù)科技的機(jī)器狗面對(duì)面炫技斗舞。

迪士尼是怎么做雙足機(jī)器人的?

▲迪士尼BD-X機(jī)器人與宇樹(shù)Go2互動(dòng)(圖源:YouTube)

更早之前,它在今年3月的英偉達(dá)GTC大會(huì)上作為驚喜嘉賓壓軸出場(chǎng),與英偉達(dá)創(chuàng)始人兼CEO黃仁勛親密互動(dòng),還搖頭晃腦撒嬌賣(mài)萌。

迪士尼是怎么做雙足機(jī)器人的?

▲酷似瓦力的BD-X機(jī)器人與黃仁勛在GTC大會(huì)上互動(dòng)(圖源:英偉達(dá))

這一機(jī)器人以?shī)蕵?lè)為目的的設(shè)計(jì)理念極大降低了硬件復(fù)雜度與成本。但迪士尼為這臺(tái)機(jī)器人加上了額外的揚(yáng)聲器、天線、頭燈和眼睛,這讓它能以更多的方式表現(xiàn)自己的“情緒”。

雖然BD-X看上去活靈活現(xiàn),似乎真的能理解人們說(shuō)的話,但其實(shí)它并不具備主動(dòng)的感知和行為能力。它的一舉一動(dòng)都是通過(guò)人工操作實(shí)現(xiàn)的。這臺(tái)機(jī)器人配備了來(lái)自英偉達(dá)的機(jī)載計(jì)算機(jī)Jetson,能將人類(lèi)指令與訓(xùn)練時(shí)積累的經(jīng)驗(yàn)結(jié)合,輸出最終的行動(dòng)指令。

迪士尼是怎么做雙足機(jī)器人的?

▲論文首頁(yè)截圖(圖源:迪士尼)

論文地址:https://la.disneyresearch.com/publication/design-and-control-of-a-bipedal-robotic-character/

一、機(jī)械設(shè)計(jì)簡(jiǎn)單有效,服務(wù)娛樂(lè)與創(chuàng)意目的

迪士尼在設(shè)計(jì)BD-X機(jī)器人時(shí)選擇了與大多數(shù)企業(yè)都不同的路徑。他們并不追求最好、最強(qiáng)大的機(jī)械設(shè)計(jì),而是選擇了能夠滿(mǎn)足創(chuàng)意和娛樂(lè)目的的簡(jiǎn)單設(shè)計(jì)。研究者成功集成了動(dòng)畫(huà)內(nèi)容、設(shè)計(jì)、控制、實(shí)時(shí)操縱等元素,并用不到1年的時(shí)間實(shí)現(xiàn)了定制機(jī)器人角色的快速開(kāi)發(fā)。

這一機(jī)器人主要使用了市面上的標(biāo)準(zhǔn)化零件,而外殼則是3D打印的,但經(jīng)過(guò)軟件調(diào)試后,仍然可以在降低硬件復(fù)雜度的前提下實(shí)現(xiàn)不錯(cuò)的表現(xiàn)。

迪士尼是怎么做雙足機(jī)器人的?

▲迪士尼BD-X機(jī)器人設(shè)計(jì)圖(圖源:迪士尼)

這一雙足機(jī)器人的總重為15.4公斤,高度為0.66米。每條腿上有5個(gè)自由度,而頭部與頸部則有4個(gè)自由度。腿部的高自由度使得這一機(jī)器人能完成大幅度的動(dòng)作,而頭頸部的高自由度則讓機(jī)器人可以通過(guò)動(dòng)作表現(xiàn)各種妙趣橫生、情感豐富的動(dòng)作。

迪士尼是怎么做雙足機(jī)器人的?

▲B(niǎo)D-X機(jī)器人在迪士尼樂(lè)園亮相,畫(huà)面最右側(cè)的二人為操作員(圖源:YouTube)

迪士尼的工程師還通過(guò)巧妙的設(shè)計(jì)讓機(jī)器人能在沒(méi)有膝蓋彎曲執(zhí)行器的情況下,依賴(lài)與地面的接觸實(shí)現(xiàn)逼真的膝蓋彎曲效果。這一機(jī)器人配備一塊微控制器驅(qū)動(dòng)的通訊板,能以600赫茲的頻率實(shí)現(xiàn)內(nèi)置電腦、執(zhí)行器和慣性測(cè)量單元之間的通訊。1塊可拆卸電池為機(jī)器人供電,能維持至少1個(gè)小時(shí)的運(yùn)轉(zhuǎn)時(shí)間。

有趣的是,除了頭部和軀干上配備的揚(yáng)聲器,這臺(tái)機(jī)器人還有具備執(zhí)行器的天線、能點(diǎn)亮的眼睛和一盞頭燈。這些設(shè)備為機(jī)器人提供了更多表現(xiàn)情緒的方式,同時(shí)其控制和驅(qū)動(dòng)都是相對(duì)獨(dú)立的,因此可以選擇是否搭載這些功能。

二、利用強(qiáng)化學(xué)習(xí)掌握動(dòng)畫(huà)動(dòng)作,在英偉達(dá)Isaac Gym中模擬訓(xùn)練

為了給機(jī)器人動(dòng)作提供一個(gè)清晰的框架,迪士尼的研究人員將機(jī)器人的動(dòng)作分為以下3類(lèi)。

1、持續(xù)性動(dòng)作:沒(méi)有明確的起點(diǎn)和終點(diǎn)。機(jī)器人保持平衡,并對(duì)測(cè)量到的狀態(tài)和連續(xù)的控制輸入流做出響應(yīng)。

2、周期性運(yùn)動(dòng):有一個(gè)周期性的相位信號(hào)傳遞給策略。在這種模式下,相位信號(hào)無(wú)限循環(huán)。

3、偶發(fā)性運(yùn)動(dòng):有預(yù)定的持續(xù)時(shí)間。策略接收單調(diào)遞增的相位信號(hào),一旦運(yùn)動(dòng)結(jié)束,就會(huì)強(qiáng)制過(guò)渡到新的運(yùn)動(dòng)。

迪士尼是怎么做雙足機(jī)器人的?

▲B(niǎo)D-X機(jī)器人的3種運(yùn)動(dòng)類(lèi)型(圖源:迪士尼)

機(jī)器人的控制策略是機(jī)器人學(xué)中的重要概念,指的是將機(jī)器人的狀態(tài)映射為動(dòng)作或電機(jī)命令的函數(shù),使機(jī)器人能實(shí)現(xiàn)預(yù)期的行為和任務(wù)。

研究人員讓BD-X機(jī)器人通過(guò)強(qiáng)化學(xué)習(xí)的方式掌握了多種控制策略,分別針對(duì)上述3種類(lèi)型的動(dòng)作。

根據(jù)機(jī)器人的CAD模型,迪士尼的研究人員構(gòu)建出了這一機(jī)器人的準(zhǔn)確物理形態(tài)、執(zhí)行器和它與環(huán)境的互動(dòng),并通過(guò)英偉達(dá)的機(jī)器人訓(xùn)練平臺(tái)Isaac Gym模擬出這一機(jī)器人的剛體動(dòng)力學(xué)特征。研究人員還通過(guò)定制的執(zhí)行器模型進(jìn)一步模擬了這一機(jī)器人的完整動(dòng)力學(xué)特征。

迪士尼是怎么做雙足機(jī)器人的?

▲B(niǎo)D-X模擬訓(xùn)練系統(tǒng)(圖源:迪士尼)

BD-X機(jī)器人的動(dòng)作是根據(jù)動(dòng)畫(huà)內(nèi)容學(xué)習(xí)的。迪士尼的研究人員提取了動(dòng)畫(huà)中人物的特定動(dòng)作指標(biāo),如軀干的全局位置、關(guān)節(jié)的位置和矢量等信息,這些信息將用來(lái)訓(xùn)練這一BD-X機(jī)器人模仿動(dòng)畫(huà)中的動(dòng)作。

在Isaac Gym的模擬訓(xùn)練中,機(jī)器人會(huì)收到強(qiáng)化學(xué)習(xí)系統(tǒng)的獎(jiǎng)勵(lì)和懲罰。這一系統(tǒng)會(huì)考慮動(dòng)作與動(dòng)畫(huà)人物的相似度、動(dòng)作的規(guī)范程度(如有無(wú)關(guān)節(jié)扭曲、動(dòng)作是否流暢)以及機(jī)器人是否生存(“死亡”被定義為頭和軀干與地面接觸,或頭和軀干碰撞),并給出相應(yīng)的獎(jiǎng)懲。

訓(xùn)練過(guò)程中,系統(tǒng)還會(huì)模擬出隨機(jī)的擾動(dòng)、牽引力還有不同的地貌,這提升了機(jī)器人的魯棒性(Robustness,指抗干擾性或穩(wěn)定性)。

三、并無(wú)主動(dòng)感知和行動(dòng)能力,通過(guò)復(fù)雜控制器實(shí)現(xiàn)運(yùn)動(dòng)

迪士尼的研究人員稱(chēng),在發(fā)布這篇論文時(shí),BD-X機(jī)器人已經(jīng)有過(guò)累計(jì)10小時(shí)的公開(kāi)展示運(yùn)行時(shí)間,在這10小時(shí)里這一機(jī)器人表現(xiàn)完美,一次都沒(méi)有摔倒。許多觀眾都被這一機(jī)器人可愛(ài)的外表吸引,而未注意到這一機(jī)器人的操縱者。

實(shí)際上,BD-X機(jī)器人并無(wú)任何主動(dòng)的行為和感知能力,其動(dòng)作都是通過(guò)專(zhuān)業(yè)人員操縱一個(gè)復(fù)雜的控制器實(shí)現(xiàn)的。在運(yùn)行期間,操作員可以使用直觀的遙控互動(dòng)界面控制這一機(jī)器人。這一操縱設(shè)備較為復(fù)雜,有2個(gè)搖桿、2塊路徑板,正反面總計(jì)有十幾個(gè)按鍵。

迪士尼是怎么做雙足機(jī)器人的?

▲B(niǎo)D-X通過(guò)控制器實(shí)現(xiàn)靈動(dòng)的動(dòng)作(圖源:迪士尼)

在虛擬訓(xùn)練結(jié)束后,神經(jīng)控制策略的權(quán)重被凍結(jié),策略網(wǎng)絡(luò)被部署到機(jī)器人的機(jī)載計(jì)算機(jī)Jetson上。部署后的控制策略和低層次控制器直接與機(jī)器人的硬件交互,還能融入慣性測(cè)量單元和執(zhí)行器的測(cè)量數(shù)據(jù)。

機(jī)器人內(nèi)置的動(dòng)畫(huà)引擎能自動(dòng)將操作員輸入的指令,與機(jī)器人內(nèi)置的策略控制命令、展示功能信號(hào)(天線、眼睛、頭燈的控制信號(hào))和聲音信號(hào)結(jié)合起來(lái),為控制策略生成最終指令。

迪士尼是怎么做雙足機(jī)器人的?

▲操作員在英偉達(dá)GTC 2024的后臺(tái)調(diào)試BD-X機(jī)器人(圖源:YouTube)

人工操縱指令和內(nèi)置策略控制命令的結(jié)合能避免機(jī)器人出現(xiàn)訓(xùn)練過(guò)程中研究人員希望規(guī)避的動(dòng)作,如摔倒、動(dòng)作僵硬不流暢等等。

迪士尼是怎么做雙足機(jī)器人的?

▲B(niǎo)D-X機(jī)器人展現(xiàn)出很強(qiáng)的魯棒性,能在多種復(fù)雜地面情況下保持穩(wěn)定(圖源:迪士尼)

展示功能和音頻是機(jī)器人的受控元素,在表現(xiàn)角色方面起著關(guān)鍵作用,但不會(huì)影響系統(tǒng)的動(dòng)態(tài)。它們的行為通過(guò)動(dòng)畫(huà)引擎發(fā)出的動(dòng)畫(huà)信號(hào)和狀態(tài)反饋與機(jī)器人的運(yùn)動(dòng)同步。

結(jié)語(yǔ):AI讓動(dòng)畫(huà)人物走進(jìn)現(xiàn)實(shí),“不實(shí)用”的機(jī)器人也有價(jià)值

其實(shí)迪士尼是機(jī)器人領(lǐng)域的資深玩家,從上世紀(jì)60年代以來(lái)他們就一直深耕機(jī)器人相關(guān)研究,并且在迪士尼樂(lè)園中嘗試部署他們的研究成果,探索讓動(dòng)畫(huà)人物走進(jìn)現(xiàn)實(shí)世界的各種方式和場(chǎng)景。

迪士尼是怎么做雙足機(jī)器人的?

▲迪士尼過(guò)去在機(jī)器人領(lǐng)域的相關(guān)研究(圖源:迪士尼)

AI技術(shù)的發(fā)展讓機(jī)器人的一舉一動(dòng)都更為逼真自然,而強(qiáng)化學(xué)習(xí)讓專(zhuān)業(yè)動(dòng)畫(huà)師制作的人物動(dòng)作在現(xiàn)實(shí)中落地。雖然BD-X機(jī)器人并不像其它雙足機(jī)器人那樣能進(jìn)工廠、上流水線,但我們也樂(lè)見(jiàn)娛樂(lè)目的的機(jī)器人技術(shù)進(jìn)一步發(fā)展,讓普通人也能享受到機(jī)器人帶來(lái)的快樂(lè)。

來(lái)源:迪士尼