智東西(公眾號(hào):zhidxcom)
作者 |? 陳駿達(dá)
編輯 |? 漠影

上周末,在北京舉辦的這場(chǎng)“龍蝦局”,有些不同尋常。

一群養(yǎng)蝦人聚在獵豹移動(dòng)的辦公區(qū),獵豹董事長(zhǎng)兼CEO傅盛坐在輪椅上滑進(jìn)會(huì)場(chǎng),開始分享自己的養(yǎng)蝦秘籍。聊到興頭,他拿起手機(jī),發(fā)了條語音,向自己養(yǎng)的AI龍蝦“三萬”隨口布置了個(gè)任務(wù):“讓機(jī)器人穿過舞臺(tái),看到人就喊‘大家好,今天辛苦了’,間隔十秒,走到頭停下。”

會(huì)場(chǎng)里有些騷動(dòng),在“三萬”思考的間隙,大家既期待著能看到些什么,又隱隱有些懷疑。一段時(shí)間后,機(jī)器人真的動(dòng)了,沿著預(yù)設(shè)方向滑行,鏡頭掃過人群,停頓,然后開口:

這不是提前寫好的演示腳本,傅盛在現(xiàn)場(chǎng)打開飛書展示了完整的對(duì)話記錄,這確實(shí)是在前一晚才“搓”出來的Demo。現(xiàn)場(chǎng)沒有彩排,甚至中途機(jī)器人還因?yàn)榫W(wǎng)絡(luò)延遲“不聽指揮”了一陣,但它最終完成了任務(wù),甚至自己編了幾句不重復(fù)的廣告詞。

這究竟是怎么做到的?這場(chǎng)略顯即興的演示,其實(shí)展示了一種更本質(zhì)的變化。

一、驅(qū)動(dòng)機(jī)器人巡夜、互動(dòng)、修bug,EasyClaw怎么做到的?

上方那段不到兩分鐘的視頻,在視頻號(hào)上獲得了近萬次轉(zhuǎn)發(fā)。其走紅除了“OpenClaw操作機(jī)器人”這件事兒本身的傳播屬性之外,更重要的是它讓現(xiàn)場(chǎng)和網(wǎng)絡(luò)上的許多普通人,第一次看到了Agent進(jìn)入物理世界的樣子。

借助Agent框架,AI可以更穩(wěn)定地在開放任務(wù)中自主學(xué)習(xí)、調(diào)用工具、編寫代碼、進(jìn)行測(cè)試、處理異常,理論上能操控任何提供API的設(shè)備。

但理論與實(shí)踐之間,往往隔著巨大的鴻溝。在正式演示之前,傅盛和獵豹移動(dòng)的技術(shù)團(tuán)隊(duì)決定先自家辦公室完成初步驗(yàn)證。技術(shù)團(tuán)隊(duì)將獵豹移動(dòng)的EasyClaw接入機(jī)器人后,傅盛在當(dāng)天凌晨2點(diǎn)多嘗試讓自己的Agent控制辦公區(qū)的機(jī)器人,讓它每30分鐘巡邏一次,拍照匯報(bào),執(zhí)行完成后返回充電。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

由EasyClaw驅(qū)動(dòng)的AI龍蝦“三萬”自主讀取了機(jī)器人的開發(fā)文檔,完成了API調(diào)用、路徑規(guī)劃和定時(shí)任務(wù)設(shè)置等流程。不過初期測(cè)試并非一帆風(fēng)順,執(zhí)行時(shí)機(jī)器人沒能把拍攝的照片發(fā)送給傅盛,還走錯(cuò)了位置,需要進(jìn)一步調(diào)試。

傅盛沒有介入底層代碼,而是把調(diào)試過程全部交給“三萬”。他詢問道:“你對(duì)大廳的定位是否有誤?請(qǐng)發(fā)送當(dāng)前地圖數(shù)據(jù)?!薄叭f”立即調(diào)取了機(jī)器人的建圖文件,識(shí)別出坐標(biāo)偏差并自主完成了修正。第二次巡邏,路徑已經(jīng)準(zhǔn)確,傅盛也在手機(jī)上收到了機(jī)器人拍攝的公司照片。

將這一Demo搬到現(xiàn)場(chǎng)后,真實(shí)環(huán)境的復(fù)雜程度遠(yuǎn)超測(cè)試環(huán)境。數(shù)百人聚集的會(huì)場(chǎng)中,人員走動(dòng)、交談、拍攝等行為會(huì)干擾機(jī)器人的視覺識(shí)別,網(wǎng)絡(luò)延遲可能導(dǎo)致指令響應(yīng)滯后。實(shí)際上,傅盛連續(xù)發(fā)送的多個(gè)“停止”指令的確未能及時(shí)生效,因?yàn)槿蝿?wù)已從服務(wù)端下發(fā)至機(jī)器人,指令隊(duì)列仍在執(zhí)行中,機(jī)器人在舞臺(tái)上走了一通后,并沒有完成打招呼的任務(wù)。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

傅盛向“三萬”發(fā)出詢問,剛才的移動(dòng)過程為何未檢測(cè)到人員?他還強(qiáng)調(diào)要排查具體原因,把錯(cuò)誤的理由追問到代碼層和文件層,這樣修改的成功率就能大幅提升。

接到新任務(wù)后,“三萬”在現(xiàn)場(chǎng)寫代碼、寫接口、跑測(cè)試,最終做出了“見到人觸發(fā)喊話”這個(gè)功能。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

不過,傅盛并沒有止步于完成這個(gè)臨時(shí)任務(wù),而是嘗試將這一任務(wù)沉淀為永久性的資產(chǎn)。

二、不只是跑通一次,如何全自動(dòng)打造可復(fù)用Skill

當(dāng)機(jī)器人成功完成第一次“穿越舞臺(tái)問候觀眾”的任務(wù)后,傅盛告訴“三萬”:“我覺得演示完成完全達(dá)到了效果,你把這個(gè)寫成一個(gè)Skill唄,然后下次我們直接就可以調(diào)用了,不用再這樣調(diào)試了?!?/p>

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

這一過程在傳統(tǒng)機(jī)器人開發(fā)過程中是較為復(fù)雜的。硬件控制中,一個(gè)簡(jiǎn)單的“讓機(jī)器人巡邏”功能,可能需要工程師花費(fèi)數(shù)天甚至數(shù)周來開發(fā)、測(cè)試、調(diào)優(yōu)。這種高門檻,讓大多數(shù)中小企業(yè)和個(gè)人用戶只能望而卻步。

更棘手的是,即便功能開發(fā)完成,也很難復(fù)用。不同的應(yīng)用場(chǎng)景往往需要重新編寫代碼。這種重復(fù)勞動(dòng),極大地限制了機(jī)器人的普及速度。

而三萬在幾分鐘內(nèi)就完成了這個(gè)封裝。它自動(dòng)識(shí)別了核心邏輯,形成了一個(gè)可配置的標(biāo)準(zhǔn)件。

這種能力帶來的效率提升是明顯可感的。當(dāng)同樣的需求再次出現(xiàn)時(shí),開發(fā)者不需要重新規(guī)劃、重新編碼,只需調(diào)用這個(gè)Skill,修改幾個(gè)參數(shù)即可。傅盛在演示中證明了這一點(diǎn):第一次下達(dá)指令時(shí),三萬需要讀文檔、寫腳本、測(cè)試調(diào)試,耗時(shí)較長(zhǎng);而第二次執(zhí)行類似任務(wù)時(shí),由于Skill的輔助,響應(yīng)速度只需幾秒鐘。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

EasyClaw這樣的Agent還能指揮機(jī)器人更為自主地完成任務(wù),甚至不需要具體的指令。

演示接近尾聲時(shí),傅盛決定再做一次實(shí)驗(yàn)。這次他沒有規(guī)定具體的話術(shù),而是給了一個(gè)開放式任務(wù):“你現(xiàn)在穿越大廳,然后碰到人就來推廣EasyClaw,你自己想些詞,每個(gè)人不要講超過5句話。

借助之前的Skill和大模型的智能,機(jī)器人很快開始移動(dòng)。它遇到第一位觀眾時(shí),開口說道:”告訴您一個(gè)秘密,我剛才談話、拍照、走路全是EasyClaw在指揮我,它就是這么神。牛不?”

遇到下一個(gè)觀眾后,它又換了另一套說辭:“您的AI全能助手,不用寫代碼,說句話就讓我跑腿,您還在等什么?”事后三萬匯報(bào):它一共想出了5句不同的廣告詞,每次遇到人時(shí)隨機(jī)挑選一句,確保不重復(fù)。

傅盛也對(duì)這個(gè)效果比較滿意,他評(píng)價(jià)道:“比我想的好。你們一定要相信這個(gè)東西超越人的很多點(diǎn),它不是簡(jiǎn)單替代,就是它比你做得好。

三、當(dāng)Agent住進(jìn)機(jī)器人的身體:獵豹移動(dòng)的新想象

這臺(tái)在現(xiàn)場(chǎng)大放異彩的機(jī)器人,正是獵豹移動(dòng)旗下獵戶星空的自主研發(fā)產(chǎn)品“豹小秘”。獵豹的機(jī)器人業(yè)務(wù)早已在接待、講解等垂直領(lǐng)域深耕多年,并最新推出了手部可動(dòng)的交互型號(hào)。

你可能已經(jīng)在生活中和電視里見過豹小秘,它廣泛應(yīng)用于展廳、政務(wù)、醫(yī)療等20余類垂直場(chǎng)景,曾在國(guó)慶70周年彩車上向全國(guó)觀眾“致意問好”,還服務(wù)北京冬奧會(huì)官方公寓入住、導(dǎo)覽翻譯場(chǎng)景,成為唯一入選的語音交互機(jī)器人。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

這些在真實(shí)場(chǎng)景的部署經(jīng)驗(yàn),讓獵豹能感知到行業(yè)的真實(shí)痛點(diǎn)。傅盛借用餐廳場(chǎng)景分析道,在過去,機(jī)器人操作高度依賴編程,造機(jī)器人的工程師與用機(jī)器人的服務(wù)員之間存在巨大的“技術(shù)鴻溝”。

為了讓餐廳服務(wù)員學(xué)會(huì)操作機(jī)器人,往往需要長(zhǎng)達(dá)三個(gè)月的培訓(xùn);然而,一旦服務(wù)員離職,所有的培訓(xùn)投入便宣告打水漂,下一批員工入職又得從零開始。

“EasyClaw+機(jī)器人”的出現(xiàn)給這一困境提供了解決方案——如果機(jī)器人能像人一樣“聽懂人話”并自動(dòng)干活,復(fù)雜的后臺(tái)操作和冗長(zhǎng)的培訓(xùn)將不復(fù)存在。

這一Demo展現(xiàn)的核心價(jià)值在于“技術(shù)平權(quán)”。它將驅(qū)動(dòng)機(jī)器人的權(quán)力,從極少數(shù)專業(yè)工程師手中釋放給了廣大終端用戶。開發(fā)門檻被極度拉低:用戶不再需要懂Python或復(fù)雜的界面操作,只需通過自然語言下達(dá)指令,系統(tǒng)便能實(shí)時(shí)生成代碼并驅(qū)動(dòng)硬件。

獵豹并不是今年才開始布局相關(guān)技術(shù)。早在去年7月,獵戶星空便推出了AgentOS,這是一個(gè)面向語音交互場(chǎng)景打造的機(jī)器人操作系統(tǒng)。

該系統(tǒng)的GUI(圖形用戶界面)結(jié)合自然語言交互與原生API后,可以幫助用戶在搭載AgentOS的機(jī)器人上實(shí)現(xiàn)各種各樣的任務(wù),并且完全能用自然語言定義。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

至此,機(jī)器人不再是一個(gè)死板的“固定腳本執(zhí)行器”,而是可以被自然語言實(shí)時(shí)“編程”的智能終端。

更進(jìn)一步,EasyClaw與機(jī)器人的結(jié)合,讓AI Agent擁有了在物理世界的實(shí)體載體

這種軟硬件的深度融合,正在加速Agent能力邊界的擴(kuò)張。未來,Agent不僅可以在軟件世界寫代碼,還能像傅盛演示的那樣在舞臺(tái)上“喊話”,更可以化身為小店的智能決策平臺(tái),自主根據(jù)自己在現(xiàn)實(shí)世界的所見所聞,告訴店主明天該進(jìn)多少貨。

傅盛設(shè)想道,未來甚至可以用自然語言驅(qū)動(dòng)獵豹開發(fā)的機(jī)械臂,在攝影棚內(nèi)精準(zhǔn)捕捉完美的拍攝軌跡。

結(jié)語:Agent+機(jī)器人,加速從Demo走向現(xiàn)實(shí)

這次現(xiàn)場(chǎng)演示絕對(duì)不是完美的。正如傅盛在現(xiàn)場(chǎng)坦言:機(jī)器人芯片、通信延遲,都還有優(yōu)化空間。

但其展現(xiàn)出的潛力是毋庸置疑的。面對(duì)這樣一臺(tái)能聽懂指令、甚至能自己想廣告詞的機(jī)器人,傅盛感慨道:“這個(gè)東西哪個(gè)老板不要一個(gè)?”

據(jù)悉,獵豹移動(dòng)已經(jīng)開啟了相關(guān)技術(shù)的快速迭代,或許在未來幾個(gè)月內(nèi),現(xiàn)有的原始感將大幅改善。

另外,報(bào)個(gè)獨(dú)家猛料,3月27日,獵戶星空即將舉辦2026合作伙伴共贏大會(huì)暨豹小秘系列新品發(fā)布會(huì),相信會(huì)給業(yè)界帶來更多驚喜。

龍蝦登陸機(jī)器人!全程零彩排,傅盛是怎么搞定的?

當(dāng)Agent走出屏幕、走進(jìn)物理世界,更多以前無法想象的應(yīng)用場(chǎng)景正呼之欲出。