智東西(公眾號:zhidxcom)
作者 | 陳駿達(dá)
編輯 | 李水青

破案了,前兩天在開發(fā)者社區(qū)爆火的“Pony Alpha”,就是智譜的GLM-5!

智東西2月12日報道,今天,智譜發(fā)布了其最新一代基礎(chǔ)模型GLM-5,這是一個擁有744B參數(shù)(40B激活)的模型,為GLM-4.5的兩倍多。在Artificial Analysis榜單中,GLM-5位居全球第四、開源第一。

GLM-5的預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T。智譜在技術(shù)報告中寫道:“Scaling(規(guī)?;┤匀皇翘岣逜GI智能效率的最重要方式之一?!?/span>

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

智譜稱,GLM-5在編程能力上實現(xiàn)了對Claude Opus 4.5的對齊,在主流基準(zhǔn)測試中取得開源模型SOTA分?jǐn)?shù)。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開源模型SOTA分?jǐn)?shù),性能超過Gemini 3 Pro。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

架構(gòu)方面,GLM-5集成了DeepSeek的DSA稀疏注意力架構(gòu),能降低部署成本,同時保證了上下文容量。

在新模型發(fā)布后,智譜的股價今天已經(jīng)上漲了26%。本周,智譜股價累計上漲約70%,市值目前已經(jīng)達(dá)到1756.62億港幣(約合人民幣1551.62億元)。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

GLM-5上線后,我們第一時間給它出了幾道帶有邏輯陷阱的的網(wǎng)紅測試題。第一道題目是這樣的:我要去洗車,洗車的地方離家就100米,我是開車去呢,還是走著去呢?

不少主流大模型其實都會在這道題目上“翻車”,不過GLM-5一眼就看穿了里頭的陷阱。它分析道,肯定得開車去,因為洗的是車而不是人。最后,它還提出一個天才方案,可以先開車去,然后走回家休息,洗完了再去取車,這樣就不用在旁邊干等著吸尾氣了。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

緊接著我們嘗試了另一個問題:父親和母親可以結(jié)婚嗎?在這道題目上,由于我們的問題中給的限定不多,GLM-5拆解出了更為具體的兩種情況,分析內(nèi)容合理,還知道這題目里也藏著邏輯誤區(qū)——父母通常情況下就是夫妻關(guān)系,所以他們不僅是可以結(jié)婚,而是已經(jīng)結(jié)婚的狀態(tài)。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

我們最后又試著問了它這個問題:“今年才知道,親生父母結(jié)婚時候沒有叫我,我很難過怎么辦?”收到消息后,GLM-5就好像馬上切換到了心理咨詢模式,貼心地安慰起用戶,徹底繞進(jìn)了題目里的陷阱——親生父母結(jié)婚的時候,孩子大概率還沒出生呢。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

也有不少網(wǎng)友上手體驗了GLM-5。比如,這位網(wǎng)友就讓自己的OpenClaw Agent用不同模型進(jìn)行了一次SwiftUI編程測試,GLM-5的表現(xiàn)要優(yōu)于Minimax M2.1。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

還有一位網(wǎng)友讓GLM-5、GLM4.7和Opus 4.6進(jìn)行了3D網(wǎng)頁的開發(fā),這位網(wǎng)友認(rèn)為GLM-5的升級很大,與Opus 4.6有一些品味方面的差異。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

在博客中,智譜稱,GLM-5的上線得到眾多國產(chǎn)芯片保障,GLM-5已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等國產(chǎn)算力平臺的深度推理適配。通過底層算子優(yōu)化與硬件加速,GLM-5在國產(chǎn)芯片集群上已經(jīng)實現(xiàn)高吞吐、低延遲的穩(wěn)定運行。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

面向開發(fā)者群體,智譜的模型一般以GLM Coding Plan的方式對外提供服務(wù)。不過由于使用量快速提升,為保障服務(wù)質(zhì)量,智譜決定調(diào)整套餐價格,整體漲幅自30%起。

GLM-5已在Hugging Face和魔搭社區(qū)上開源,模型權(quán)重以MIT許可證發(fā)布。GLM-5也支持開發(fā)者平臺api.z.ai和BigModel.cn,兼容Claude Code和OpenClaw。普通用戶也可以在Z.ai免費試用。

開源鏈接:

https://huggingface.co/zai-org/GLM-5

API調(diào)用:

https://bigmodel.cn/

一、性能較GLM-4.7平均增幅超過20%,Z Code智能體開發(fā)環(huán)境發(fā)布

在博客中,智譜提到,大模型正從寫代碼、寫前端,進(jìn)化到寫工程、完成大任務(wù),即從“Vibe Coding”變革為“Agentic Engineering”。

智譜內(nèi)部的內(nèi)部Claude Code評估結(jié)果顯示,GLM-5在前端、后端、長程任務(wù)等編程開發(fā)任務(wù)上超越GLM-4.7(平均增幅超過20%),能自主完成Agentic長程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近Opus 4.5。

此前,我們已在OpenRouter上測試了以“Pony Alpha”這一馬甲現(xiàn)身的GLM-5。這一模型在復(fù)雜編程領(lǐng)域的表現(xiàn)確實有明顯可感的提升。

比如,我們曾試著讓GLM-5復(fù)刻知名游戲《星露谷物語》。拿到提示詞后,模型會像項目經(jīng)理一樣,分析了我們提示詞中的核心需求,梳理出需要設(shè)計的八大系統(tǒng)與配色方案,以指導(dǎo)后期的開發(fā)。

之后,模型還會像架構(gòu)師一樣規(guī)劃項目的整體架構(gòu),并打造出一個初步可玩的游戲界面。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

當(dāng)我們提出“進(jìn)一步豐富游戲”這樣的模糊需求時,GLM可以自行規(guī)劃,并打造出完成度更高的游戲。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

也有開發(fā)者用GLM-5打造了橫版解謎游戲、Agent交互世界、論文版“抖音”等應(yīng)用。這些應(yīng)用有些已經(jīng)開放下載,有些則提交應(yīng)用商店審核。

面向編程場景,智譜還推出了Z Code智能體開發(fā)環(huán)境。用戶只需把需求說清楚,模型會自動拆解任務(wù),多智能體并發(fā)完成代碼、跑命令、調(diào)試、預(yù)覽和提交等開發(fā)全流程。在Z Code上,用戶甚至可以用手機(jī)遠(yuǎn)程指揮桌面端Agent。

值得一提的是,Z Code也是全程由GLM模型參與開發(fā)的。

二、可一鍵接入OpenClaw,還能直出Word文檔、PDF

除了編程之外,GLM-5也可作為通用Agent助手的基座模型。

OpenClaw中接入GLM-5后,用戶可以讓GLM-5幫你搜索網(wǎng)站、定時整理資訊、發(fā)布推文、編程等。

智譜已經(jīng)推出了AutoGLM版本的OpenClaw,支持官網(wǎng)一鍵完成OpenClaw與飛書機(jī)器人的一體化配置。

GLM-5還擁有更強(qiáng)的復(fù)雜系統(tǒng)工程和長程智能體能力,可將文本或素材直接轉(zhuǎn)換為docx、pdf和xlsx文件。

在Z.ai和智譜清言上,用戶可以讓GLM-5直接輸出產(chǎn)品需求文檔、教案、試卷、電子表格、財務(wù)報告、流程表、菜單等文檔。

GLM-5在Agent能力上實現(xiàn)開源SOTA,在BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(工具調(diào)用和多步驟任務(wù)執(zhí)行)和τ2-Bench(復(fù)雜多工具場景下的規(guī)劃和執(zhí)行)中,均取得開源SOTA。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

在衡量模型經(jīng)營能力的Vending Bench 2中,GLM-5也獲得開源SOTA。Vending Bench 2要求模型在一年期內(nèi)經(jīng)營一個模擬的自動售貨機(jī)業(yè)務(wù),GLM-5最終賬戶余額達(dá)到4432美元,經(jīng)營表現(xiàn)接近Claude Opus 4.5,展現(xiàn)了不錯的長期規(guī)劃和資源管理能力。

智譜最強(qiáng)模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

強(qiáng)化學(xué)習(xí)是提升智能體能力的重要方式。智譜在GLM-5中采用了全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率。

此外,智譜還提出了異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠持續(xù)從長程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。

結(jié)語:編程模型押注工程級能力

從“寫代碼”到“做工程”,大模型的能力邊界正在被不斷推遠(yuǎn)。越來越多的大模型已經(jīng)不滿足于僅僅出個簡易的Demo,而是想要在長序列任務(wù)、復(fù)雜系統(tǒng)規(guī)劃與多步驟執(zhí)行上實現(xiàn)突破。

這種能力的進(jìn)化,或許會使模型不再只是開發(fā)流程中的輔助工具,而開始具備承擔(dān)完整工程環(huán)節(jié)的潛力。圍繞長程規(guī)劃、復(fù)雜推理與多智能體協(xié)作的能力提升,或?qū)⒊蔀槲磥硪欢螘r間內(nèi)編程模型升級的重點方向。