智東西(公眾號:zhidxcom)
作者 | 江宇
編輯 | 漠影

智東西12月23日報道,今日,智譜正式上線并開源了新版本GLM-4.7,跑分直指開源第一梯隊。

GLM-4.7在SWE-bench、Terminal Bench 2.0、τ2-Bench、HLE等十余項智能體與推理評測中,全面對齊甚至部分超越GPT-5.1與Claude Sonnet 4.5。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

而在訂閱門檻上,GLM-4.7堪比“價格屠夫”:每月最低20元即可使用Claude Pro三倍用量,主打一個“用得起”。

從技術(shù)上線時間點來看,這也是智譜在IPO前夜放出的關(guān)鍵一招。那么究竟效果如何?我們也第一時間在Z.ai上進行了實測。

GitHub:https://github.com/zai-org/GLM-4.5

Hugging Face:huggingface.co/zai-org/GLM-4.7

魔搭社區(qū):https://modelscope.cn/models/ZhipuAI/GLM-4.7

一、從“寫代碼”到“管任務”,技術(shù)指標全線飄紅

根據(jù)Code Arena面向全球開發(fā)者的專業(yè)編碼盲測榜單,GLM-4.7在Web開發(fā)方向排名第六,成為目前全球排名最高的開源模型,超過GPT-5.2與Claude Sonnet 4.5,位列國產(chǎn)模型第一。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

從更細致的基準測試來看,GLM-4.7最明顯的升級集中在三個方面:代碼、工具調(diào)用和推理能力。

代碼能力上,它在SWE-bench?Verified拿到73.8%,LiveCodeBench?V6達到84.9%,整體水平已經(jīng)對齊Claude Sonnet 4.5,在開源模型中處于第一梯隊。

更偏復雜推理的任務中,HLE(“人類最后的考試”)成績提升尤為明顯,工具輔助條件下達到42.8%,相比GLM?4.6提升超過12個百分點,也超過了GPT?5.1 High。

工具調(diào)用能力同樣是這一代的重點方向,在τ2?Bench中,GLM?4.7拿到87.4%的成績,BrowseComp在開啟上下文管理后提升至67.5%,在多輪網(wǎng)頁任務和交互式工具調(diào)用場景中表現(xiàn)穩(wěn)定,基本坐實了其“智能體向”模型的定位。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

與這些分數(shù)變化對應的,是其內(nèi)部思考機制的調(diào)整。

GLM?4.7在此前“交錯思考”的基礎(chǔ)上,引入了保留式思考與輪級思考控制:模型會在每次生成和工具調(diào)用前先進行推理,并在多輪任務中自動保留已有的思考結(jié)果,而不是反復從零開始推導。

同時,開發(fā)者也可以按輪次決定是否啟用推理過程,在簡單請求中降低時延,在復雜任務中換取穩(wěn)定性。

這種設(shè)計更強調(diào)長任務執(zhí)行中的一致性和可控性,也正是這些機制變化,支撐了它在代碼智能體、終端任務和工具協(xié)同類基準上的整體躍升。

此外,模型還針對前端美學、長文本穩(wěn)定性、網(wǎng)頁生成結(jié)構(gòu)等細節(jié)做了優(yōu)化。

二、100個真實任務勝率更高,多模態(tài)技能調(diào)度能力打通開發(fā)閉環(huán)

為了驗證GLM?4.7在實際開發(fā)任務中的表現(xiàn),智譜對比測試了100個真實編程任務,覆蓋前端開發(fā)、后端邏輯以及指令遵循等三個核心方向。結(jié)果顯示,在前端任務中,GLM?4.7相較4.6版本勝率提升至64.6%,在指令遵循場景中也達到58.3%。在最具工程復雜度的后端方向,其勝率也穩(wěn)定在46.7%。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

除了單點生成能力,GLM?4.7還進一步強化了多技能聯(lián)動能力。GLM-4.7已在Z.ai上線了全棧技能環(huán)境,它已接入全新的Skills模塊,支持調(diào)用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進行統(tǒng)一調(diào)度。

在多模態(tài)任務中,它既能規(guī)劃路徑、又能執(zhí)行動作,工具之間的“調(diào)度邏輯”打通了。

三、實測:從3D圣誕樹到Switch小游戲,前端效果直追Gemini 3

本次我們通過Z.ai平臺測試了GLM-4.7的三類互動任務,來看看其在3D控制、UI生成與前端代碼實現(xiàn)上的表現(xiàn)。

場景1:3D圣誕樹炸開成照片墻,用手勢就能控制收放旋轉(zhuǎn)

這是本次測試中最具沉浸感的交互體驗之一。GLM-4.7輸出了一整段可直接運行的HTML代碼,包含完整的3D場景構(gòu)建、粒子交互、手勢識別與UI反饋邏輯。

初始畫面是一棵由5000多個粒子構(gòu)成的立體圣誕樹,頂部懸著一顆帶有輝光效果的星星。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

移動鼠標時,粒子會自然產(chǎn)生斥力波紋,整體呈現(xiàn)出流動的視覺響應。

進入交互環(huán)節(jié)后,系統(tǒng)會調(diào)用攝像頭,識別用戶的手勢動作。當用戶張開手掌,整棵圣誕樹會突然炸開,轉(zhuǎn)變?yōu)橐蝗腋≡诳罩械恼掌瑝?,照片以拍立得的形式環(huán)繞排布。如果繼續(xù)左右移動手掌,照片墻會跟隨旋轉(zhuǎn)。而當再次握拳時,所有元素會收攏歸位,照片墻重新收縮為圣誕樹形態(tài),形成完整的一輪開合動畫。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

此外,GLM-4.7還在代碼中集成了性能優(yōu)化機制,例如使用InstancedMesh來渲染大量粒子,整個頁面在不依賴構(gòu)建工具的前提下依然保持了高幀率與良好流暢度。

場景2:復刻iOS主界面,圖標齊了,界面能點

我們輸入提示詞“1:1復刻iOS系統(tǒng)”,GLM-4.7就做出了一個模仿iOS的主頁面:Safari、Siri、健康、錢包等圖標均可點擊。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

日歷、天氣、計算器等功能頁可以進入交互,計算器還能進行基礎(chǔ)運算輸入。雖然和最新款iOS比起來還有細節(jié)差距,但整體體驗是流暢的、能用的,圖標風格和顏色搭配也有基本審美。

場景3:Switch格斗小游戲,手柄界面+按鍵聯(lián)動

我們還測試了一個雙人格斗游戲任務,GLM-4.7生成了一套完整的雙人對戰(zhàn)界面,整體風格高度還原Switch主機的Joy-Con手柄配色和布局:左側(cè)是藍色手柄,右側(cè)是紅色手柄,中間是游戲主屏幕。

進入游戲后,畫面中出現(xiàn)了兩個火柴人角色,一個為藍色玩家,一個為紅色敵人,頭頂有動態(tài)血條顯示。UI部分在左上角呈現(xiàn)當前波次與敵人數(shù)量等信息。在操作體驗上,左手玩家可以通過鍵盤A/D控制移動,J攻擊,K跳躍,右手玩家則使用U/I/O三鍵分別釋放技能。雖然尚未實現(xiàn)打擊判定與技能特效,但整體界面結(jié)構(gòu)、角色邏輯和按鍵響應已經(jīng)非常完整,具備真實游戲的框架感。

新“前端之父”來了!智譜深夜放出編程炸彈,開源第一、國產(chǎn)第一

整個游戲內(nèi)置了節(jié)奏感很強的格斗BGM??梢姡珿LM-4.7在UI構(gòu)建、鍵盤監(jiān)聽、動畫驅(qū)動等前端關(guān)鍵模塊中還是具備一定的可用性與穩(wěn)定性。

結(jié)語:國產(chǎn)SOTA模型正值猛進階段

從三大基準維度到真實任務測試,GLM-4.7已躋身全球開源模型第一梯隊,成為國產(chǎn)模型在Agent工具線上的關(guān)鍵突破點。

無論是開源代碼在全球社區(qū)中已被下載超6000萬次,還是付費API使用量長期居于OpenRouter全球前十,都說明它已逐步進入開發(fā)者的實際工具列表。

而在GLM-4.7上線的節(jié)點背后,是智譜即將登陸港交所的背景,也是國產(chǎn)大模型企業(yè)從科研模型、開源生態(tài)向“真實使用”與“市場驗證”過渡的一個縮影。在這個新階段,開源國產(chǎn)模型正從“對標國際”邁向“領(lǐng)跑、實用”,而GLM-4.7就是這個進程中的一個關(guān)鍵代表。