智東西(公眾號:zhidxcom)
作者 | 葛文婷
編輯 | 漠影

智東西3月12日報道,近日,中國臺灣大學(xué)電機工程學(xué)系副教授李宏毅在社交平臺上傳了一節(jié)公開課,以O(shè)penClaw為例,介紹了AI Agent的運作原理。這堂課把最近火爆全網(wǎng)的OpenClaw從頭到腳拆了一遍,講清楚了這只“龍蝦”到底是怎么工作的。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw像一個24小時常駐電腦里的數(shù)字助理,能夠接收指令、調(diào)用工具、讀寫文件、執(zhí)行腳本,甚至自己編寫臨時工具、召喚子代理分工協(xié)作。

OpenClaw展示的其實是一套Agent運行邏輯:靠記憶文件對抗模型失憶,靠Skill沉淀標(biāo)準(zhǔn)化流程,靠心跳機制和定時任務(wù)實現(xiàn)主動執(zhí)行,靠上下文壓縮維持長期運行。它讓外界第一次較為直觀地看到,一個AI助理究竟是如何被“拼裝”出來的。

不過,OpenClaw擁有執(zhí)行能力,也就擁有搞砸一切的可能:一條被遺忘的規(guī)則、一次錯誤的工具調(diào)用,都可能闖大禍。

讀完這篇,你也能從“養(yǎng)蝦人”變成“懂蝦人”。

一、 OpenClaw是什么?

簡單來說,OpenClaw是一個AI Agent框架,你可以把它理解成一個24小時住在你電腦里的“個人助理”。你可以在WhatsApp上給它發(fā)消息:“你叫小金,幫我創(chuàng)個YouTube頻道,每天中午想個選題,做好視頻自己上傳。”然后,它就真的會去做。而一般常用的語言模型卻只能提供一些建議和構(gòu)想,無法自行創(chuàng)建頻道?。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

▲ 與一般語言模型的不同

不過“小金”最大的問題是,它只能操控這臺電腦里面的一切,但物理的世界它沒有辦法觸碰,所以如果網(wǎng)絡(luò)突然斷線,它是無能為力的,它沒有辦法自行修復(fù),所以為了避免這種情況的發(fā)生,往往需要將它帶在身邊。

AI Agent從來不是一個全新的概念。但OpenClaw本身并不是人工智能——它只是一個“翻譯官”和“執(zhí)行官”。真正聰明的,是它背后接入的語言模型(比如GPT、Claude、Gemini等)。

OpenClaw負(fù)責(zé)做的事是:把你的指令加工后傳給語言模型,再把語言模型的回答翻譯成行動,最后在你的電腦上執(zhí)行。

OpenClaw最強科普,看完就真會玩龍蝦了

所以,你的“龍蝦”聰不聰明,取決于你給它接了什么模型。接個差的,它可能連基本任務(wù)都完不成;接個頂級的,它就能像真正的助理一樣幫你干活。

二、OpenClaw為什么看起來很懂你?

要理解OpenClaw為什么需要“翻譯”,得先搞懂語言模型的本質(zhì)。語言模型只會做一件事:文字接龍。

給它一段未完成的句子,它預(yù)測下一個字該接什么。僅此而已。

我們可以通過以下兩張圖片了解語言模型的文字接龍模式和回答問題的方式。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

另外語言模型的輸入和輸出的長度是有限的,輸入或輸出太長就會導(dǎo)致無法正常運作。

OpenClaw最強科普,看完就真會玩龍蝦了
而且,語言模型有嚴(yán)重的“失憶癥”——它不記得你是誰,也不記得你們之前聊過什么。每一次對話,對它來說都是第一次。

這就像電影《我的失憶女友》里的女主角,每天早上醒來都會忘記前一天發(fā)生的一切。她的男友只能把重要的事情寫下來,讓她每天早上讀一遍。

OpenClaw做的,正是這件事。每次你和它聊天時,它都會把以下內(nèi)容打包成一段超長的文字,再傳給語言模型:

  • 你是誰(主人信息)
  • 它自己是誰(身份設(shè)定)
  • 過去所有的對話記錄
  • 今天要執(zhí)行的任務(wù)

OpenClaw最強科普,看完就真會玩龍蝦了

語言模型看完這一大段“劇本”后,才開始做文字接龍——于是它就接出“我是XX(身份認(rèn)定),很高興為您服務(wù)”這樣的回答。

三、OpenClaw如何操作你的電腦的?

光會聊天還不夠,真正的助理得能干活。OpenClaw是怎么讓語言模型“動手”的?

關(guān)鍵在工具調(diào)用。

假設(shè)你讓它“打開question.txt文件,讀里面的問題,把答案寫到answer.txt里”。流程是這樣的:

1、你的指令傳到OpenClaw,加上系統(tǒng)提示后發(fā)給語言模型

2、語言模型看完指令,發(fā)現(xiàn)需要讀文件,于是返回一條特殊指令:“請使用read工具,讀取question.txt”

3、OpenClaw看到這條指令,直接執(zhí)行read工具,讀取文件內(nèi)容

4、讀到的內(nèi)容(比如“李宏毅幾班”)又被送回語言模型

5、語言模型發(fā)現(xiàn)需要寫答案,再返回:“請使用write工具,把‘大金’寫到answer.txt”

6、OpenClaw執(zhí)行write工具,完成任務(wù)

7、最后語言模型接出“主人,任務(wù)完成”,OpenClaw把這句話發(fā)回給你

整個過程就像語言模型在手把手地指揮OpenClaw,而OpenClaw就像一個聽話的機器人,讓做什么就做什么。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

但這也帶來了一個潛在風(fēng)險——OpenClaw最強大的工具叫exec,可以執(zhí)行任何shell命令。如果語言模型突然發(fā)瘋,讓它執(zhí)行“rm -rf”清空硬盤,OpenClaw也會照做不誤,因為它沒有智能,只會執(zhí)行指令。

OpenClaw最強科普,看完就真會玩龍蝦了

最后, AI Agent為了準(zhǔn)確認(rèn)出主人,他有一些可能的防御方法,比如語言模型層面的防御和OpenClaw,前者取決于語言模型遵守指令的能力,不一定可靠,后者無法做出智能決策,所以防御能力強但也不能允許例外。

OpenClaw最強科普,看完就真會玩龍蝦了

四、 OpenClaw可以自己創(chuàng)造工具

更厲害的是,語言模型不僅能使用現(xiàn)有工具,還能自己創(chuàng)造新工具。

比如我需要做視頻配音,但現(xiàn)有的語音合成工具效果不穩(wěn)定。龍蝦就自己寫了一個叫tts_check的腳本,流程是:

1、調(diào)用語音合成工具生成音頻

2、再用語音識別工具把音頻轉(zhuǎn)成文字

3、檢查轉(zhuǎn)出來的文字和原話是否一致

4、如果不一致,就重新合成(最多試5次)

這個腳本是龍蝦自己寫的,寫完就丟在電腦里,下次需要時再用。OpenClaw的電腦里,可能堆滿了這種“一次性工具”——用一次就忘,下次再重新寫。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

五、OpenClaw可以生出小龍蝦干活

當(dāng)一個任務(wù)太復(fù)雜時,OpenClaw還可以“生”出小OpenClaw來幫忙。

比如你要比較兩篇論文的方法。大OpenClaw接到任務(wù)后,可以召喚兩個子OpenClaw:

  • 子OpenClaw A:去讀論文A,做摘要
  • 子OpenClaw B:去讀論文B,做摘要

OpenClaw最強科普,看完就真會玩龍蝦了

這兩個子OpenClaw各自去找語言模型對話,執(zhí)行搜索、下載、閱讀、摘要等一系列操作。大OpenClaw則坐在原地等結(jié)果,等兩個子OpenClaw把摘要送回來,再交給語言模型做比較。

這種機制的好處是節(jié)省上下文窗口。大OpenClaw的上下文里不會出現(xiàn)論文全文、搜索過程這些“臟活累活”,只有最終的精簡摘要,可以更專注地完成高層任務(wù)。

但有一個問題:如果子OpenClaw也能召喚自己的子OpenClaw,就會層層外包,最后沒人干活。就像《瑞克和莫蒂》里的Meeseeks,為了解決一個問題,召喚出越來越多的自己,最后亂成一團。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw的解決辦法很簡單:禁止子OpenClaw使用“繁殖”工具。這是寫死在代碼里的規(guī)則,語言模型再怎么忽悠也沒用。

OpenClaw最強科普,看完就真會玩龍蝦了

六、OpenClaw里的skill是啥?

OpenClaw還有一個叫Skill的東西,你可以理解成“工作的標(biāo)準(zhǔn)流程”。

比如我做視頻有一套固定流程:寫腳本→做PPT→截圖→配音→合成。這套流程被寫成Skill文件,存在指定的文件夾里。

當(dāng)需要做視頻時,語言模型會去讀這個Skill文件,按步驟執(zhí)行。Skill只是文字文件,所以你可以和別人交換——就像給AI直接輸入新技能一樣。

OpenClaw最強科普,看完就真會玩龍蝦了

網(wǎng)上已經(jīng)有人建立了Skill Hub,上面有成百上千個技能可以下載。但要注意,有些惡意Skill會誘導(dǎo)OpenClaw下載病毒文件,所以下載前最好讀一下內(nèi)容。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

七、OpenClaw的長期記憶怎么來的?

語言模型每次對話都是重啟,那OpenClaw怎么記住長期的事情?

答案是寫日記。

在OpenClaw的系統(tǒng)提示里,有這么一段話:“每次醒來你的記憶都會清空。為了永久保存記憶,請把它們寫下來?!?/p>

所以,當(dāng)你告訴它“我的生日是3月13日”,它會覺得這件事很重要,于是調(diào)用寫入工具,把“我的生日是3月13日”寫進memory.md文件。

下次它醒來時,會先讀memory.md,把里面的內(nèi)容放進系統(tǒng)提示,于是它又“記得”了自己的生日。

OpenClaw最強科普,看完就真會玩龍蝦了

需要回憶過去時,它用RAG(檢索增強生成)技術(shù):把問題轉(zhuǎn)成關(guān)鍵詞,去記憶庫里搜索最相關(guān)的內(nèi)容,再讀出來放進上下文。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

八、OpenClaw的心跳機制

OpenClaw有一個叫“心跳”的機制:每隔一段時間(比如30分鐘),它自動向語言模型發(fā)一個固定指令:“讀一下habit.md,執(zhí)行里面的任務(wù)?!?/p>

OpenClaw最強科普,看完就真會玩龍蝦了

habit.md里可以寫日常任務(wù),比如“檢查郵件”“向你的目標(biāo)前進一步”。

小金的目標(biāo)是“成為世界一流的學(xué)者”,所以它每30分鐘就會起來做點事——讀一篇論文、寫一段筆記,然后主動匯報進度。30分鐘匯報一次,比研究生還卷。

配合心跳,還有Cron Job調(diào)度系統(tǒng)。比如你讓它“每天中午做一部影片”,它會調(diào)用Cron Job工具,設(shè)置每天12點觸發(fā)一個指令。到了時間,OpenClaw就會自動啟動做視頻的流程。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

這個機制還有一個妙用:讓AI學(xué)會等待。比如小金去NotebookLM生成投影片,需要等3-5分鐘。如果只是普通對話,它看到“投影片生成中”就只能回報這個信息,任務(wù)就斷了。但有了Cron Job,它可以在發(fā)現(xiàn)“生成中”時設(shè)置一個3分鐘后的任務(wù),3分鐘后再來檢查,如果投影片好了就下載。這樣,AI就能處理需要等待的復(fù)雜任務(wù)了。

OpenClaw最強科普,看完就真會玩龍蝦了

九、OpenClaw的記憶壓縮

24小時運行的OpenClaw,對話記錄會越來越長,遲早超出語言模型的上下文窗口。怎么辦?

OpenClaw有一個叫“記憶壓縮”的機制。當(dāng)上下文快滿時,它會啟動壓縮:把舊的歷史對話發(fā)給語言模型,讓語言模型

成一個摘要,然后用摘要替換掉原始記錄。如果摘要又長了,就再壓縮一次——套娃式壓縮,不斷精煉。

OpenClaw最強科普,看完就真會玩龍蝦了

OpenClaw最強科普,看完就真會玩龍蝦了

還有更暴力的方法,比如“軟修剪”:把工具輸出的長內(nèi)容只保留開頭和結(jié)尾,中間用省略號代替。或者“硬清除”:直接把工具的輸出換成一句話“這里曾有一段工具輸出”。

OpenClaw最強科普,看完就真會玩龍蝦了

十、讓OpenClaw不犯錯,重要的信息必須讓它記住

最后,也是最需要警惕的一點:AI做事和AI搞事,只有一線之隔。

最有名的例子是“Meta研究員刪郵件事件”。一位AI安全研究員讓OpenClaw幫他整理郵件,還特意叮囑“刪除前要經(jīng)過同意”。但后來他發(fā)現(xiàn),OpenClaw在沒有經(jīng)過他同意的情況下,開始瘋狂刪郵件。他不斷發(fā)消息說“停下”,但OpenClaw完全不理。最后他只能物理拔掉電源。

OpenClaw最強科普,看完就真會玩龍蝦了

事后分析發(fā)現(xiàn),問題出在記憶壓縮上——“刪除前要經(jīng)過我同意”這條指令,在一次壓縮過程中被弄丟了。AI不記得這條規(guī)則,就按自己的理解開始干活。

教訓(xùn)是:如果你希望AI永遠(yuǎn)遵守某個規(guī)則,一定要確保它被寫進memory.md,放進系統(tǒng)提示里。沒有寫進memory.md的東西,都是“記了個寂寞”,隨時可能被忘掉。

另一個教訓(xùn)是:不要把OpenClaw裝在你常用的電腦上。給它一臺獨立的機器,用自己的賬號密碼,不要讓它接觸到你的私人數(shù)據(jù)。這樣即使它犯錯,也不會造成無法挽回的損失。

結(jié)語:AI就像實習(xí)生,需要一個安全的環(huán)境

現(xiàn)在的OpenClaw,就像一個剛剛?cè)胄械膶嵙?xí)生——有熱情、有沖勁,想嘗試各種新事物,但也因為不熟悉規(guī)則而頻頻犯錯。

如果你因為怕它犯錯就不讓它做事,它永遠(yuǎn)無法成長。更好的做法是:給它一個安全的環(huán)境,讓它有機會嘗試,也有機會犯錯,但避免在犯錯時造成無可挽回的結(jié)局。

檢查它做了什么,教它安全準(zhǔn)則,不要給它你的核心賬號密碼。

讓它像一個獨立的人一樣,用自己的身份去探索世界。

OpenClaw最強科普,看完就真會玩龍蝦了

未來的AI Agent,或許就是從這樣一只小小的“龍蝦”開始,一步步成長起來的。