機(jī)器人前瞻(公眾號(hào):robot_pro)
作者 | 江宇
編輯 | 漠影

過去一年,具身智能賽道在模型、硬件和應(yīng)用層面不斷取得進(jìn)展,一個(gè)共識(shí)正在業(yè)內(nèi)逐漸形成:真正限制具身智能進(jìn)一步Scale的,是真實(shí)、可復(fù)用的數(shù)據(jù)。

“目前機(jī)器人領(lǐng)域的發(fā)展,核心還是離不開訓(xùn)練數(shù)據(jù),”在近期的一次公開分享中,宇樹科技創(chuàng)始人王興興這樣概括他對(duì)具身行業(yè)的判斷。

也正因如此,數(shù)據(jù)問題正在成為具身智能進(jìn)一步擴(kuò)展能力邊界時(shí),繞不開的核心約束。正是在這樣的背景下,鹿明機(jī)器人選擇了一條不一樣的路。

近日,鹿明機(jī)器人發(fā)布全球首款背包版UMI數(shù)采設(shè)備FastUMI Pro(背包版),并同步啟動(dòng)真實(shí)場(chǎng)景數(shù)據(jù)采集計(jì)劃。

奔向百萬小時(shí)數(shù)據(jù)量,鹿明帶著“背包”走向工廠、餐館和商場(chǎng)

按照規(guī)劃,鹿明將在多個(gè)城市投放1萬臺(tái)背包版FastUMI Pro,進(jìn)入工業(yè)、家庭、酒店、餐館、商場(chǎng)、辦公等六大真實(shí)場(chǎng)景,目標(biāo)直指百萬小時(shí)級(jí)數(shù)據(jù)量,構(gòu)建面向具身智能訓(xùn)練的規(guī)模化數(shù)據(jù)基礎(chǔ)設(shè)施。與此同時(shí),鹿明“FastUMI Pro數(shù)據(jù)超市”也將上線。

這一動(dòng)作,也讓鹿明首次以“數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)者”與“具身智能送水人”的身份,站到了具身智能行業(yè)的聚光燈下。

圍繞該數(shù)采計(jì)劃,機(jī)器人前瞻也與鹿明機(jī)器人聯(lián)席CTO丁琰進(jìn)行了交流。

丁琰將這一選擇概括為一次“工程階段的推進(jìn)”,要將采集推向更真實(shí)、更復(fù)雜的場(chǎng)景,讓數(shù)據(jù)真正覆蓋模型未來要面對(duì)的真實(shí)世界。

一、當(dāng)模型開始“卡在數(shù)據(jù)上”,具身智能不得不正視真實(shí)世界

在具身智能逐步走向真實(shí)應(yīng)用的過程中,數(shù)據(jù)的局限往往比模型能力更早暴露出來。

丁琰把數(shù)據(jù)采集拆成了清晰的階段:第一階段在數(shù)采場(chǎng)的里做采集,光線、環(huán)境、背景、人員管理都可控。

他提到,鹿明機(jī)器人在這一階段持續(xù)完善采集SOP、采集軟件與硬件迭代,以及對(duì)數(shù)據(jù)質(zhì)量的評(píng)估機(jī)制,“基本上在數(shù)采廠里可以實(shí)現(xiàn)自動(dòng)運(yùn)轉(zhuǎn)”。

但當(dāng)任務(wù)難度抬升,模型開始被迫面對(duì)更復(fù)雜的物理約束與環(huán)境噪聲時(shí),可控場(chǎng)景的數(shù)據(jù)分布很快會(huì)顯出邊界。

丁琰的一個(gè)判斷是:之所以行業(yè)里會(huì)出現(xiàn)仿真、視頻、強(qiáng)化學(xué)習(xí)等多種數(shù)據(jù)路線,很大程度上是因?yàn)椴簧偃蝿?wù)在早期還相對(duì)簡(jiǎn)單,多種方式“看起來都能做”??梢坏┻M(jìn)入更真實(shí)、更凌亂的作業(yè)場(chǎng)景,數(shù)據(jù)的真實(shí)性與一致性就會(huì)變成硬約束。

他舉了工廠質(zhì)檢場(chǎng)景為例:這不是在實(shí)驗(yàn)室里“干凈環(huán)境”的抓取,是在復(fù)雜工況里完成更強(qiáng)約束的操作與判斷,“如果只是做一些簡(jiǎn)單的仿真,或者其他東西就已經(jīng)很難去滿足這種客戶的要求了”。

在他看來,這也是為什么真實(shí)、可靠的真機(jī)數(shù)據(jù)最終不可回避:視頻數(shù)據(jù)可以訓(xùn)練“看懂世界”,仿真可以擴(kuò)展一定的組合空間,但當(dāng)目標(biāo)是“上手干活”,與物理世界交互的那部分能力,最終還是要靠真實(shí)交互數(shù)據(jù)來支撐。

換句話說,隨著任務(wù)復(fù)雜度上升,數(shù)據(jù)問題是決定模型能否繼續(xù)往前走的底層條件。

二、為什么是背包形態(tài)?讓數(shù)據(jù)從數(shù)采場(chǎng)走向真實(shí)場(chǎng)景

當(dāng)“走進(jìn)真實(shí)世界”成為下一階段的共識(shí),新的問題隨之出現(xiàn):真實(shí)場(chǎng)景數(shù)據(jù)如何穩(wěn)定采到、如何在采集當(dāng)下就判斷好壞、如何把采集與后續(xù)訓(xùn)練推理打通?

丁琰解釋稱:背包是一種“很天然的形態(tài)”。對(duì)UMI這種多傳感器采集系統(tǒng)而言,如果把數(shù)據(jù)完全離線存下來,數(shù)據(jù)量與吞吐會(huì)很可怕,很難有一個(gè)很好的離線存儲(chǔ)的方式,因此需要把數(shù)據(jù)落到隨身的計(jì)算單元上。

更關(guān)鍵的是,背包里的“小電腦”不只是存儲(chǔ)節(jié)點(diǎn),也是質(zhì)量評(píng)估與任務(wù)管理節(jié)點(diǎn)。

丁琰強(qiáng)調(diào),鹿明團(tuán)隊(duì)非??粗?span style="color: #0f59a4">數(shù)據(jù)質(zhì)量,希望采完一條數(shù)據(jù)能即時(shí)做質(zhì)量評(píng)估,告訴采集者好還是不好、為什么不好,否則采了一天的數(shù)據(jù)可能都是廢掉的,而且在較長(zhǎng)時(shí)間里都不知道問題出在哪里。

背包形態(tài)使得這種“邊采邊評(píng)估”成為可能,同時(shí)也方便任務(wù)分配、打卡登記與人員管理。再疊加8小時(shí)續(xù)航,背包版FastUMI Pro在形態(tài)上更像一套可移動(dòng)的標(biāo)準(zhǔn)數(shù)采工作站,讓采集真正能夠從可控場(chǎng)地走進(jìn)工廠、酒店、餐館等開放環(huán)境。

三、萬臺(tái)級(jí)真實(shí)場(chǎng)景采集,“大規(guī)?!北澈笫切袠I(yè)稀缺的工程能力

萬臺(tái)設(shè)備、六大場(chǎng)景、百萬小時(shí)真機(jī)數(shù)據(jù)量,本身就是一個(gè)足以引發(fā)行業(yè)關(guān)注的數(shù)字。

但更值得討論的,它隱含的門檻:當(dāng)采集從少量樣本進(jìn)入規(guī)?;A段,真正決定上限的往往是數(shù)據(jù)體系能否持續(xù)復(fù)用、持續(xù)擴(kuò)展。

丁琰提到,鹿明之所以選擇在這個(gè)時(shí)間點(diǎn)把采集推向真實(shí)場(chǎng)景,是因?yàn)?span style="color: #0f59a4">鹿明已經(jīng)完成了數(shù)采第一階段——自建“數(shù)采場(chǎng)”采集體系的打磨。光線、環(huán)境、人員管理全部可控,采集SOP、軟件系統(tǒng)、硬件迭代、數(shù)據(jù)質(zhì)量評(píng)估體系等條件全部具備。

同時(shí),業(yè)務(wù)側(cè)也出現(xiàn)了明確的牽引:鹿明機(jī)器人在交付了100萬條數(shù)據(jù)后,客戶開始提出更進(jìn)階的需求,希望獲得真實(shí)場(chǎng)景的數(shù)據(jù),這推動(dòng)團(tuán)隊(duì)去探索更有價(jià)值、更有難度的采集方式。

放在具身智能行業(yè),丁琰的判斷是:不同團(tuán)隊(duì)在數(shù)據(jù)管線(數(shù)據(jù)生產(chǎn)、數(shù)據(jù)質(zhì)量評(píng)估、數(shù)據(jù)治理以及訓(xùn)練形態(tài))上,差異可能比外界想象得更早出現(xiàn)。

他把這稱為“數(shù)據(jù)決定的東西很多”:一旦選擇了某種數(shù)據(jù)管道,后續(xù)很多算法研究與訓(xùn)練方式都會(huì)隨之變化。

更重要的是,鹿明所選擇的“無本體”采集方式在速度、擴(kuò)展性和一致性上更容易形成積累優(yōu)勢(shì):采集更快,數(shù)據(jù)積累速度更快;傳感器模態(tài)的擴(kuò)展更順滑,數(shù)據(jù)處理管線也更容易復(fù)用;采(數(shù)據(jù)采集)、訓(xùn)(策略訓(xùn)練)、推(模型推理)在同一交互形態(tài)下保持一致,有利于把現(xiàn)場(chǎng)“不會(huì)的任務(wù)”更快轉(zhuǎn)化為可用策略。

這些點(diǎn)共同構(gòu)成了鹿明這番“大規(guī)?!眲?dòng)作的用意:把真實(shí)世界的復(fù)雜性變成一套可運(yùn)行的工程系統(tǒng),并且讓系統(tǒng)能夠長(zhǎng)時(shí)間、跨場(chǎng)景地穩(wěn)定產(chǎn)出。

四、“采–訓(xùn)–推”閉環(huán),是數(shù)據(jù)基礎(chǔ)設(shè)施的核心能力

數(shù)據(jù)的價(jià)值,最終取決于它能否被快速轉(zhuǎn)化為模型能力。如果僅從產(chǎn)品層面看,F(xiàn)astUMI Pro是一套數(shù)采軟硬件系統(tǒng),但從鹿明機(jī)器人的戰(zhàn)略路線看,它承擔(dān)的角色顯然不止于此。

丁琰在采訪中反復(fù)強(qiáng)調(diào),鹿明已經(jīng)把“采–訓(xùn)–推”的基建打通,這也是團(tuán)隊(duì)敢把真實(shí)場(chǎng)景采集推向規(guī)?;牡讱庵?。

▲FastUMI Pro在工業(yè)及家庭場(chǎng)景的多個(gè)任務(wù)中,完成“數(shù)據(jù)采集-策略訓(xùn)練-模型推理”閉環(huán)。

數(shù)據(jù)不是采完就結(jié)束,而是能被快速消化、快速反饋,進(jìn)而反過來指導(dǎo)下一輪采集與任務(wù)擴(kuò)展,也正是在這種閉環(huán)基礎(chǔ)上,鹿明機(jī)器人把“真實(shí)場(chǎng)景規(guī)模化采集”定義為下一階段的重點(diǎn):用更多、更真實(shí)的場(chǎng)景數(shù)據(jù),推高模型能力上限,突破模型能力的天花板。

與此同時(shí),配套上線的“FastUMI Pro數(shù)據(jù)超市”,則把通用數(shù)據(jù)進(jìn)一步產(chǎn)品化,嘗試以更標(biāo)準(zhǔn)的方式讓數(shù)據(jù)進(jìn)入流通體系,用戶可直接通過其官網(wǎng)商城購(gòu)買覆蓋多場(chǎng)景、多任務(wù)的標(biāo)準(zhǔn)化操作數(shù)據(jù)。

結(jié)語:真實(shí)數(shù)據(jù),是具身智能繞不開的底座

從背包版FastUMI Pro的推出,到萬臺(tái)級(jí)真實(shí)場(chǎng)景采集計(jì)劃的啟動(dòng),鹿明機(jī)器人所做的,并不只是一次新品發(fā)布或規(guī)模擴(kuò)張。

丁琰在其小紅書帖子《2026具身數(shù)據(jù)基建戰(zhàn)》中寫道:“在模型之外,還有一個(gè)同樣關(guān)鍵、且在后期更難整體調(diào)整的因素:數(shù)據(jù)從哪里來,以及以什么形態(tài)進(jìn)入系統(tǒng)。”

他提到,“從長(zhǎng)期看,真正昂貴的并不是采集一次數(shù)據(jù),而是反復(fù)重建整套數(shù)據(jù)體系?!痹谶@條邏輯下,UMI讓能力擴(kuò)展盡量發(fā)生在同一入口之上,數(shù)據(jù)基建保持相對(duì)穩(wěn)定,系統(tǒng)能力逐步疊加。

從行業(yè)角度看,當(dāng)越來越多真實(shí)操作數(shù)據(jù)被系統(tǒng)性采集和利用,具身智能才真正具備走出實(shí)驗(yàn)室和數(shù)采場(chǎng)、走向復(fù)雜現(xiàn)實(shí)世界的可能性。

而鹿明此次用萬臺(tái)背包版FastUMI Pro,把數(shù)據(jù)采集推向真實(shí)場(chǎng)景,本質(zhì)上是在回答一個(gè)更底層的問題——當(dāng)數(shù)據(jù)成為決定模型上限的關(guān)鍵變量,誰能夠穩(wěn)定構(gòu)建真實(shí)世界的數(shù)據(jù)基礎(chǔ)設(shè)施,誰就將在下一階段的競(jìng)爭(zhēng)中占據(jù)結(jié)構(gòu)性優(yōu)勢(shì)。