免费观看美女视频二区,国产精品国三级国产av,人妻熟女一区精品中文字幕

智東西（公眾號：zhidxcom）
作者 | 江宇
編輯 | 漠影

智東西12月23日報道，今日，智譜正式上線并開源了新版本GLM-4.7，跑分直指開源第一梯隊。

GLM-4.7在SWE-bench、Terminal Bench 2.0、τ2-Bench、HLE等十余項智能體與推理評測中，全面對齊甚至部分超越GPT-5.1與Claude Sonnet 4.5。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

而在訂閱門檻上，GLM-4.7堪比“價格屠夫”：每月最低20元即可使用Claude Pro三倍用量，主打一個“用得起”。

從技術(shù)上線時間點來看，這也是智譜在IPO前夜放出的關(guān)鍵一招。那么究竟效果如何？我們也第一時間在Z.ai上進行了實測。

GitHub：https://github.com/zai-org/GLM-4.5

Hugging Face：huggingface.co/zai-org/GLM-4.7

魔搭社區(qū)：https://modelscope.cn/models/ZhipuAI/GLM-4.7

一、從“寫代碼”到“管任務”，技術(shù)指標全線飄紅

根據(jù)Code Arena面向全球開發(fā)者的專業(yè)編碼盲測榜單，GLM-4.7在Web開發(fā)方向排名第六，成為目前全球排名最高的開源模型，超過GPT-5.2與Claude Sonnet 4.5，位列國產(chǎn)模型第一。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

從更細致的基準測試來看，GLM-4.7最明顯的升級集中在三個方面：代碼、工具調(diào)用和推理能力。

在代碼能力上，它在SWE-bench?Verified拿到73.8%，LiveCodeBench?V6達到84.9%，整體水平已經(jīng)對齊Claude Sonnet 4.5，在開源模型中處于第一梯隊。

在更偏復雜推理的任務中，HLE（“人類最后的考試”）成績提升尤為明顯，工具輔助條件下達到42.8%，相比GLM?4.6提升超過12個百分點，也超過了GPT?5.1 High。

工具調(diào)用能力同樣是這一代的重點方向，在τ2?Bench中，GLM?4.7拿到87.4%的成績，BrowseComp在開啟上下文管理后提升至67.5%，在多輪網(wǎng)頁任務和交互式工具調(diào)用場景中表現(xiàn)穩(wěn)定，基本坐實了其“智能體向”模型的定位。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

與這些分數(shù)變化對應的，是其內(nèi)部思考機制的調(diào)整。

GLM?4.7在此前“交錯思考”的基礎(chǔ)上，引入了保留式思考與輪級思考控制：模型會在每次生成和工具調(diào)用前先進行推理，并在多輪任務中自動保留已有的思考結(jié)果，而不是反復從零開始推導。

同時，開發(fā)者也可以按輪次決定是否啟用推理過程，在簡單請求中降低時延，在復雜任務中換取穩(wěn)定性。

這種設(shè)計更強調(diào)長任務執(zhí)行中的一致性和可控性，也正是這些機制變化，支撐了它在代碼智能體、終端任務和工具協(xié)同類基準上的整體躍升。

此外，模型還針對前端美學、長文本穩(wěn)定性、網(wǎng)頁生成結(jié)構(gòu)等細節(jié)做了優(yōu)化。

二、100個真實任務勝率更高，多模態(tài)技能調(diào)度能力打通開發(fā)閉環(huán)

為了驗證GLM?4.7在實際開發(fā)任務中的表現(xiàn)，智譜對比測試了100個真實編程任務，覆蓋前端開發(fā)、后端邏輯以及指令遵循等三個核心方向。結(jié)果顯示，在前端任務中，GLM?4.7相較4.6版本勝率提升至64.6%，在指令遵循場景中也達到58.3%。在最具工程復雜度的后端方向，其勝率也穩(wěn)定在46.7%。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

除了單點生成能力，GLM?4.7還進一步強化了多技能聯(lián)動能力。GLM-4.7已在Z.ai上線了全棧技能環(huán)境，它已接入全新的Skills模塊，支持調(diào)用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進行統(tǒng)一調(diào)度。

在多模態(tài)任務中，它既能規(guī)劃路徑、又能執(zhí)行動作，工具之間的“調(diào)度邏輯”打通了。

三、實測：從3D圣誕樹到Switch小游戲，前端效果直追Gemini 3

本次我們通過Z.ai平臺測試了GLM-4.7的三類互動任務，來看看其在3D控制、UI生成與前端代碼實現(xiàn)上的表現(xiàn)。

場景1：3D圣誕樹炸開成照片墻，用手勢就能控制收放旋轉(zhuǎn)

這是本次測試中最具沉浸感的交互體驗之一。GLM-4.7輸出了一整段可直接運行的HTML代碼，包含完整的3D場景構(gòu)建、粒子交互、手勢識別與UI反饋邏輯。

初始畫面是一棵由5000多個粒子構(gòu)成的立體圣誕樹，頂部懸著一顆帶有輝光效果的星星。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

移動鼠標時，粒子會自然產(chǎn)生斥力波紋，整體呈現(xiàn)出流動的視覺響應。

進入交互環(huán)節(jié)后，系統(tǒng)會調(diào)用攝像頭，識別用戶的手勢動作。當用戶張開手掌，整棵圣誕樹會突然炸開，轉(zhuǎn)變?yōu)橐蝗腋≡诳罩械恼掌瑝?，照片以拍立得的形式環(huán)繞排布。如果繼續(xù)左右移動手掌，照片墻會跟隨旋轉(zhuǎn)。而當再次握拳時，所有元素會收攏歸位，照片墻重新收縮為圣誕樹形態(tài)，形成完整的一輪開合動畫。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

此外，GLM-4.7還在代碼中集成了性能優(yōu)化機制，例如使用InstancedMesh來渲染大量粒子，整個頁面在不依賴構(gòu)建工具的前提下依然保持了高幀率與良好流暢度。

場景2：復刻iOS主界面，圖標齊了，界面能點

我們輸入提示詞“1:1復刻iOS系統(tǒng)”，GLM-4.7就做出了一個模仿iOS的主頁面：Safari、Siri、健康、錢包等圖標均可點擊。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

日歷、天氣、計算器等功能頁可以進入交互，計算器還能進行基礎(chǔ)運算輸入。雖然和最新款iOS比起來還有細節(jié)差距，但整體體驗是流暢的、能用的，圖標風格和顏色搭配也有基本審美。

場景3：Switch格斗小游戲，手柄界面+按鍵聯(lián)動

我們還測試了一個雙人格斗游戲任務，GLM-4.7生成了一套完整的雙人對戰(zhàn)界面，整體風格高度還原Switch主機的Joy-Con手柄配色和布局：左側(cè)是藍色手柄，右側(cè)是紅色手柄，中間是游戲主屏幕。

進入游戲后，畫面中出現(xiàn)了兩個火柴人角色，一個為藍色玩家，一個為紅色敵人，頭頂有動態(tài)血條顯示。UI部分在左上角呈現(xiàn)當前波次與敵人數(shù)量等信息。在操作體驗上，左手玩家可以通過鍵盤A/D控制移動，J攻擊，K跳躍，右手玩家則使用U/I/O三鍵分別釋放技能。雖然尚未實現(xiàn)打擊判定與技能特效，但整體界面結(jié)構(gòu)、角色邏輯和按鍵響應已經(jīng)非常完整，具備真實游戲的框架感。

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產(chǎn)第一

整個游戲內(nèi)置了節(jié)奏感很強的格斗BGM?？梢姡珿LM-4.7在UI構(gòu)建、鍵盤監(jiān)聽、動畫驅(qū)動等前端關(guān)鍵模塊中還是具備一定的可用性與穩(wěn)定性。

結(jié)語：國產(chǎn)SOTA模型正值猛進階段

從三大基準維度到真實任務測試，GLM-4.7已躋身全球開源模型第一梯隊，成為國產(chǎn)模型在Agent工具線上的關(guān)鍵突破點。

無論是開源代碼在全球社區(qū)中已被下載超6000萬次，還是付費API使用量長期居于OpenRouter全球前十，都說明它已逐步進入開發(fā)者的實際工具列表。

而在GLM-4.7上線的節(jié)點背后，是智譜即將登陸港交所的背景，也是國產(chǎn)大模型企業(yè)從科研模型、開源生態(tài)向“真實使用”與“市場驗證”過渡的一個縮影。在這個新階段，開源國產(chǎn)模型正從“對標國際”邁向“領(lǐng)跑、實用”，而GLM-4.7就是這個進程中的一個關(guān)鍵代表。

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、從“寫代碼”到“管任務”，技術(shù)指標全線飄紅

二、100個真實任務勝率更高，多模態(tài)技能調(diào)度能力打通開發(fā)閉環(huán)

三、實測：從3D圣誕樹到Switch小游戲，前端效果直追Gemini 3

結(jié)語：國產(chǎn)SOTA模型正值猛進階段

相關(guān)推薦

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、從“寫代碼”到“管任務”，技術(shù)指標全線飄紅

二、100個真實任務勝率更高，多模態(tài)技能調(diào)度能力打通開發(fā)閉環(huán)

三、實測：從3D圣誕樹到Switch小游戲，前端效果直追Gemini 3

結(jié)語：國產(chǎn)SOTA模型正值猛進階段

相關(guān)推薦

一、從“寫代碼”到“管任務”，技術(shù)指標全線飄紅

二、100個真實任務勝率更高，多模態(tài)技能調(diào)度能力打通開發(fā)閉環(huán)

三、實測：從3D圣誕樹到Switch小游戲，前端效果直追Gemini 3