機器人前瞻(公眾號:robot_pro)
作者|葛文婷
編輯|漠影

機器人前瞻4月3日報道,當?shù)貢r間4月2日,美國AI機器人公司Generalist AI發(fā)布了最新具身基礎(chǔ)模型——GEN-1。

GEN-1基于50萬小時預訓練數(shù)據(jù),不僅把任務(wù)平均成功率從上一代模型的64%提升至99%、將機器人工作速度提高了近3倍、還能能夠讓新任務(wù)的適配數(shù)據(jù)需求大幅降,僅需1小時機器人數(shù)據(jù)就能完成單項訓練任務(wù)。

Generalist AI由前谷歌DeepMind高級研究科學家Pete Florence創(chuàng)立,核心團隊匯聚了來自波士頓動力、OpenAI、Waymo等頂尖公司的資深研究人員。該公司致力于“讓通用機器人成為現(xiàn)實”,目前已獲得英偉達旗下風投機構(gòu)NVentures、Spark Capital、Boldstart Ventures、Bezos Expeditions以及NFDG等知名機構(gòu)的投資,估值突破3億美元(約合人民幣20億元)。

值得注意的是,距離其推出第一代基礎(chǔ)模型GEN-0,才過去不到半年

一、1小時數(shù)據(jù)即可訓練機器人完成單項任務(wù),預訓練數(shù)據(jù)超50萬

GEN-0是該公司推出的第一款專注于多模態(tài)訓練的基礎(chǔ)模型,它的出現(xiàn)首次證明了機器人領(lǐng)域同樣遵循scaling law,并驗證了機器人通用化、規(guī)?;嵘目尚行?,但當時該模型的表現(xiàn)尚未達到商用標準。

而如今的GEN-1是Generalist AI在機器人學習擴展領(lǐng)域的最新成果,相較于GEN-0,GEN-1在任務(wù)執(zhí)行速度、成功率處理效率、應(yīng)變能力以及訓練數(shù)據(jù)集五個維度上均實現(xiàn)了顯著跨越:

1、速度倍增: GEN-1的執(zhí)行速度達到GEN-0的三倍。

2、成功率質(zhì)變: 任務(wù)平均成功率由64%大幅提升至99%。

3、效率優(yōu)化: 訓練機器人完成單項任務(wù)僅需1小時機器人數(shù)據(jù)。

4、應(yīng)變能力強: 具備意外情況下的自我恢復能力,展現(xiàn)出一定的臨場應(yīng)變能力。

5、數(shù)據(jù)擴容: 預訓練數(shù)據(jù)從之前的27萬小時擴展到50 萬小時高保真操作,涵蓋全球數(shù)千個家庭、倉庫、工廠、面包店、自助洗衣店等場景,數(shù)據(jù)運營每周新增超過 1 萬小時。

在測試中,GEN-1無需人工干預,便能長時間穩(wěn)定完成多項任務(wù),包括:

  • 持續(xù)1小時以上的汽車配件分揀;

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

  • 連續(xù)折疊86件T恤;

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

  • 連續(xù)完成200余次掃地機器人維護;

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

  • 連續(xù)完成1800余次積木裝箱;

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

  • 連續(xù)折疊紙箱超過200次;

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

  • 連續(xù)打包手機超過100次等。

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

上述任務(wù)的成功率均突破了99%。

其中,在維護掃地機器人任務(wù)中,GEN-1 平均成功率達到 99%,而 GEN-0 僅 50%;折疊紙盒任務(wù)上,GEN-1 達到 99%,而GEN-0為 81%;在手機裝盒任務(wù)上,GEN-1 達到 99%,GEN-0 為 62%。作為對比,沒有經(jīng)過預訓練的GEN-0,平均成功率只有 19%

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

▲GEN-1、GEN-0和未經(jīng)訓練的GEN-0在維護掃地機器人任務(wù)中的平均成功率

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

▲GEN-1、GEN-0和未經(jīng)訓練的GEN-0在折疊紙箱任務(wù)中的平均成功率

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

▲GEN-1、GEN-0和未經(jīng)訓練的GEN-0在打包手機任務(wù)中的平均成功率

二、工作速度提升3倍,還能隨機應(yīng)變處理突發(fā)意外

在速度上,GEN-1打破了機器人領(lǐng)域長期存在的“速度屏障”。

以折疊紙盒為例,GEN-0及同期其他模型(如π0)耗時約34秒,而GEN-1將這一時間壓縮至12秒,速度提升2.8倍。在手機裝盒任務(wù)中,GEN-1僅需15.5秒,同樣是GEN-0的2.8倍,任務(wù)完成速度達到行業(yè)最優(yōu)水平的3倍左右。

更關(guān)鍵的是,GEN-1的作業(yè)速度已超越人類演示水平,能在高速狀態(tài)下精準適配物體的物理特性,并做出實時響應(yīng)。

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

據(jù)悉,GEN-1速度突破的核心支撐源于三大技術(shù)協(xié)同

1、經(jīng)驗學習(RL): 模型通過經(jīng)驗迭代自主優(yōu)化動作效率,實現(xiàn)高速執(zhí)行。

2、Harmonic Reasoning推理架構(gòu)升級: 全新的推理架構(gòu)大幅提升了實時決策效率。

3、高質(zhì)量預訓練數(shù)據(jù): 通過低成本可穿戴設(shè)備采集海量人類行為數(shù)據(jù)進行訓練,實現(xiàn)知識遷移。

另外,GEN-1的另一大亮點在于其“隨機應(yīng)變”能力

當工作中遇到突發(fā)意外(如分揀時零件被撞歪),GEN-1也不會傻傻地僵在原地等待人工調(diào)試,而是能自主選擇多種應(yīng)對方案 ,例如將墊片放回重抓,或借助卡槽將歪斜的零件復位。面對更復雜的情況,它甚至能調(diào)用另一只手實現(xiàn)雙手協(xié)同,順利完成工作。

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

▲GEN-1可以自主處理突發(fā)意外

12秒折完一個紙箱,速度快三倍,Generalist AI最強具身模型發(fā)布了!

▲GEN-1可以協(xié)同雙手完成復雜任務(wù)

這種能力讓GEN-1能夠靈活面對各種超出訓練范圍的突發(fā)行為,有效解決各類長尾問題,保障任務(wù)的穩(wěn)定推進。

結(jié)語:GEN-1并非完美無缺,GEN系列的研發(fā)之路仍任重而道遠

GEN-1將任務(wù)平均成功率從64%提升至99%,標志著通用智能機器人在靈巧操作領(lǐng)域取得了重大突破。

不過需要強調(diào)的一點是:GEN-1 并非完美無缺。

我們需要清楚的認識到,盡管GEN-1在多項靈巧操作任務(wù)中已實現(xiàn)99%的成功率,但它并非所有的測試任務(wù)都能達到這一水準,在部分工業(yè)落地場景中,模型仍需更高的成功率與執(zhí)行效率才能實現(xiàn)實用化部署,這些都是當前版本亟待補強的短板。

對此,Generalist AI 團隊已明確研發(fā)方向并展現(xiàn)出充足信心,他們將致力于讓下一代模型解鎖更廣泛、更復雜的任務(wù)能力,并持續(xù)優(yōu)化模型結(jié)構(gòu),進一步降低機器人單項任務(wù)的數(shù)據(jù)需求。