智東西(公眾號:zhidxcom)
作者 |? 陳駿達(dá)
編輯 |? 心緣

智東西3月9日報(bào)道,就在剛剛,OpenClaw發(fā)布了2025.3.8版本的更新,引入CLI備份能力、macOS遠(yuǎn)程網(wǎng)關(guān)令牌配置、ACP溯源功能,并修復(fù)了飛書插件安裝后重復(fù)提示下載的問題,進(jìn)一步優(yōu)化了OpenClaw框架的安全性、提升了與外部服務(wù)的集成深度。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲OpenClaw2026.3.8更新(圖源:X平臺)

這是兩天內(nèi)OpenClaw發(fā)布的第二次更新,就在昨天,OpenClaw一口氣推出300多條修復(fù)、27項(xiàng)變更和1項(xiàng)重大變更,OpenClaw官方更是發(fā)文稱:“我們不搞那種瑣碎的小版本發(fā)布?!?strong>言下之意就是:要搞就搞大的。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲OpenClaw2026.3.7更新(圖源:X平臺)

OpenClaw創(chuàng)始人Peter Steinberger還在3月7日順勢轉(zhuǎn)發(fā)了專用于評估大模型在OpenClaw智能體任務(wù)中表現(xiàn)的基準(zhǔn)測試PinchBench,從32款模型評出最新養(yǎng)龍蝦大模型排行榜。

其中排名前三的,有兩個(gè)都是國產(chǎn)模型,分別是MiniMax M2.1和Kimi K2.5。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲Peter Steinberger轉(zhuǎn)發(fā)PinchBench(圖源:X平臺)

英偉達(dá)創(chuàng)始人兼CEO黃仁勛在上周摩根士丹利TMT大會發(fā)出感嘆:“Linux花了30年才達(dá)到的成就,OpenClaw只用了3周。”

雖然黃仁勛的表述可能有些夸張,不過事實(shí)是,自今年1月以來,OpenClaw的熱度迅速攀升。截至今天下午18點(diǎn),其GitHub星標(biāo)數(shù)量已經(jīng)達(dá)到27萬個(gè),超過了知名開源項(xiàng)目Linux、React,排名全球第一。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

一系列圍繞OpenClaw的活動、討論乃至“搞錢機(jī)會”多點(diǎn)開花。上周,在深圳,騰訊大廈門口免費(fèi)安裝OpenClaw的活動排起長隊(duì),有騰訊員工評價(jià)這一盛況堪比春節(jié)發(fā)紅包,甚至連馬化騰都在朋友圈感嘆:“沒有想到會這么火”。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲馬化騰感嘆OpenClaw熱度(圖源:雷鋒網(wǎng))

在美國紐約,一場以O(shè)penClaw為主題的ClawCon大會吸引了超1300人,從大學(xué)生、游戲開發(fā)者到硅谷程序員都紛紛報(bào)名,遠(yuǎn)超會場本身容量,600多人最后被拒之門外。一位參會者稱:“沒有人關(guān)心你本來是做什么的,大家只關(guān)心你在用OpenClaw Agent做什么?

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲ClawCon大會盛況(圖源:The Verge)

腦子活絡(luò)的網(wǎng)友已經(jīng)靠OpenClaw賺到第一桶金了,以O(shè)penClaw上門安裝為關(guān)鍵詞搜索,能找到不少帖子,一次上門安裝服務(wù)的價(jià)格在500元左右。有從業(yè)者甚至宣稱,短短數(shù)日內(nèi)憑借這門手藝賺了26萬元,不過這一數(shù)據(jù)的出處已經(jīng)無從考證。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲MiniMax股價(jià)逼近1000港元(圖源:騰訊自選股)

爆火之中摻雜著混亂。

今年2月,工業(yè)和信息化部網(wǎng)絡(luò)安全威脅和漏洞信息共享平臺監(jiān)測發(fā)現(xiàn)OpenClaw開源AI Agent部分實(shí)例在默認(rèn)或不當(dāng)配置情況下存在較高安全風(fēng)險(xiǎn),極易引發(fā)網(wǎng)絡(luò)攻擊、信息泄露等安全問題。相關(guān)部門建議,在部署和應(yīng)用OpenClaw時(shí),應(yīng)充分核查公網(wǎng)暴露情況、權(quán)限配置及憑證管理情況,關(guān)閉不必要的公網(wǎng)訪問。

OpenClaw創(chuàng)始人Peter Steinberger昨天在X上親自下場手撕國內(nèi)社交平臺上的“李鬼”賬號,明確強(qiáng)調(diào):OpenClaw目前在微博、B站沒有任何官方號。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

▲Peter Steinberger在打假(圖源:X平臺)

OpenClaw甚至帶動了A股和港股市場中“龍蝦概念股”的瘋漲,A股優(yōu)刻得、博睿數(shù)據(jù)等漲停,港股MiniMax收盤漲23.77%,總市值突破3100億港元,智譜、云知聲等相關(guān)股跟漲。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

一、OpenClaw框架大更新,安全與上下文成重點(diǎn)

OpenClaw項(xiàng)目在3月8日進(jìn)行的一次重磅更新,發(fā)布了300多條修復(fù)、27項(xiàng)變更和1項(xiàng)重大變更。貢獻(xiàn)者列表顯示,一共有194人參與,這對于一個(gè)開源項(xiàng)目來說已經(jīng)很多了。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

OpenClaw在X平臺的官方賬號,給這次更新劃了重點(diǎn):支持OpenAI、谷歌的新模型、優(yōu)化各大通訊平臺的兼容性問題、新增SecretRef安全驗(yàn)證以及新增可插拔上下文引擎等等,直指OpenClaw在日常使用中出現(xiàn)的多種痛點(diǎn),許多更新項(xiàng)目就是由用戶自己開發(fā)的,顯示出這一社區(qū)的活躍度。

這次更新解決了OpenClaw原版框架中無法自主選擇記憶管理插件的痛點(diǎn),還優(yōu)化了客戶端與Agent之間的通信協(xié)議的穩(wěn)定性,并提供持久性的Discord頻道與Telegram的綁定存儲。

中國開發(fā)者也貢獻(xiàn)了不少更新。OpenClaw在國內(nèi)常常與飛書一起搭配使用,但在與飛書生態(tài)的結(jié)合上還做得不是很好。國內(nèi)開發(fā)者@liuxiaopai-ai、@rexl2018、@kcinzgg和@aerelune等就提交多個(gè)更新,優(yōu)化了OpenClaw在飛書內(nèi)部進(jìn)行命令識別、消息交互、身份識別優(yōu)化時(shí)的效果。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

對于飽受詬病的安全性問題,OpenClaw項(xiàng)目也進(jìn)行了查缺補(bǔ)漏。最重大的變更是,如今網(wǎng)關(guān)認(rèn)證不再允許模棱兩可的配置——當(dāng)同時(shí)設(shè)置了認(rèn)證令牌和密碼時(shí),系統(tǒng)會強(qiáng)制要求明確指定認(rèn)證模式,而不是讓系統(tǒng)猜測或允許兩者共存,從根源上杜絕了因配置歧義導(dǎo)致的安全漏洞或服務(wù)啟動失敗。

OpenClaw的網(wǎng)關(guān)與模型驗(yàn)證現(xiàn)已支持SecretRef,這允許用戶以引用方式管理認(rèn)證令牌,而不再需要將明文密鑰直接寫在配置文件中。此外,系統(tǒng)為了防止信息意外外泄,移除了/status/models等用戶界面中的權(quán)限密鑰片段,并增加了在CLI輸入密碼時(shí)的硬化處理,避免密碼通過進(jìn)程列表泄露。

不過,除了底層框架的優(yōu)化之外,用OpenClaw搭建Agent也需要一個(gè)智慧的大腦,PinchBench的推出,正好為廣大用戶提供了一個(gè)標(biāo)準(zhǔn)。

二、Kilo Code推出“龍蝦基準(zhǔn)測試”,中國模型性價(jià)比突出

PinchBench目前包含23項(xiàng)不同類別的任務(wù),比如股票價(jià)格研究、文檔摘要、文件結(jié)構(gòu)創(chuàng)建、多步復(fù)雜工作流等,為的是全面評估模型在OpenClaw框架下完成編程、辦公、創(chuàng)作等多類型任務(wù)的能力。

目前,已經(jīng)有超30款模型參與了這一基準(zhǔn)測試。值得一提的是,中國模型展現(xiàn)出明顯的性能與價(jià)格優(yōu)勢。

在正確率榜單的前10名中,來自谷歌的Gemini 3 Flash Preview拿下第一,而MiniMax M2.1和Kimi K2.5分列第二、第三,接下來是來自谷歌、OpenAI和Anthropic的多款模型,阿里的Qwen3 Coder Next位列第十。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

在性價(jià)比方面,中國模型的優(yōu)勢更為明顯。比如,MiniMax M2.1與Gemini 3 Flash Preview的正確率差距為1.5%,而MiniMax M2.1的成本只有Gemini 3 Flash Preview的大約1/10;Kimi K2.5的表現(xiàn)超過了Claude Opus 4.6,而價(jià)格僅為后者的零頭。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

分?jǐn)?shù)之外,這些模型在具體場景的表現(xiàn)究竟如何?

拿下準(zhǔn)確率榜第一的Gemini 3 Flash Preview參加了11項(xiàng)任務(wù)的測試,滿分11分,得分為10.5。在日歷填寫、編程和文件操作等任務(wù)中,Gemini 3 Flash Preview拿到了滿分成績,不過在理解、寫作等任務(wù)中出現(xiàn)瑕疵,而在上下文記憶檢索任務(wù)中其表現(xiàn)最差,得分僅為80%。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

位列榜二的MiniMax M2.1同樣拿到10.5分的成績,在編程任務(wù)上,其得分略遜于Gemini 3 Flash Preview,在上下文記憶檢索任務(wù)其得分與Gemini 3 Flash Preview一致,都為80%。

在事實(shí)驗(yàn)證、寫作、研究等任務(wù)上,MiniMax M2.1拿到了滿分。此外,MiniMax M2.1在復(fù)雜多步驟工作流上的表現(xiàn)要比Gemini 3 Flash Preview好上3%,這類工作流在Agent任務(wù)中是極為常見的。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

位列第三的Kimi K2.5拿下寫作、編程、研究等7項(xiàng)滿分,不過同樣在上下文記憶檢索任務(wù)中踩坑。看來,對目前的大模型而言,長上下文中的信息捕捉能力仍是有待提升的短板。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

榜單上,還有幾款新發(fā)布的模型意外地表現(xiàn)不佳。比如,OpenAI最新發(fā)布的GPT-5.4任務(wù)正確率僅有76%,在總榜上排名第20,甚至不如2024年發(fā)布的GPT-4o。

其在上下文記憶檢索任務(wù)、復(fù)雜工作流、信息理解上的正確率僅有70%左右,在文檔總結(jié)、記憶兩項(xiàng)測試中得分為零。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

Qwen3 Max Thinking的任務(wù)正確率僅有46%,在部分涉及文件操作、腳本撰寫的任務(wù)上未能成功執(zhí)行,拿了零分。

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

從PinchBench的初步測評結(jié)果來看,我們已經(jīng)能總結(jié)出一些共性特點(diǎn)。

對于Agent這一任務(wù)場景來說,并不是模型越大就越好,也不是越新越好。許多進(jìn)入正確率排名前十的模型都不是最大、最強(qiáng)的版本,比如Gemini 3 Flash Preview的成績要優(yōu)于Gemini 3 Pro Preview,Claude Haiku 4.5的得分要優(yōu)于Claude Opus 4.6。

在Agent任務(wù)中,尤其是多步驟工作流、文件操作、編程等,模型通常需要多次調(diào)用工具或與環(huán)境交互。在這些任務(wù)中,輕量級模型更快的推理速度與響應(yīng)延遲,以及更短的思考長度,可能提升了整個(gè)工作流的穩(wěn)定性和成功率。

結(jié)語:OpenClaw熱度不減,開源生態(tài)持續(xù)推高熱度

以O(shè)penClaw為代表的Agent框架,正深刻影響著大模型行業(yè)的方方面面。比如,衡量模型在OpenClaw中表現(xiàn)的基準(zhǔn)測試“PinchBench”,未來有可能成為指導(dǎo)模型開發(fā)商優(yōu)化模型能力的重要參考,以便讓模型更好地適應(yīng)Agent工作流。

同時(shí),OpenClaw也在不斷補(bǔ)齊自身的安全與兼容性短板。OpenClaw的開源特性讓全球開發(fā)者都可以參與到這一框架的優(yōu)化過程中。隨著更多技術(shù)力量的匯入,這股“養(yǎng)龍蝦”的熱潮或許仍將持續(xù)發(fā)酵。