智東西(公眾號(hào):zhidxcom)
作者 | 李水青
編輯 | 心緣

智東西3月3日?qǐng)?bào)道,昨日晚間,阿里開(kāi)源4款Qwen3.5小尺寸模型系列:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B,可部署于筆記本電腦等端側(cè)設(shè)備。

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲Qwen3.5社交平臺(tái)X推文部分截圖

模型一發(fā)布,不僅開(kāi)發(fā)者圈討論熱烈,連馬斯克也空降Qwen社交平臺(tái)X推文下的評(píng)論區(qū),他評(píng)價(jià):“令人驚嘆的智能密度?!弊约褿rok4.2發(fā)布在即,馬斯克對(duì)中國(guó)大模型同行的關(guān)注度不減。

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲埃隆·馬斯克在推文下的評(píng)論

在指令跟隨、多語(yǔ)言、視覺(jué)推理等多項(xiàng)基準(zhǔn)評(píng)測(cè)中,Qwen3.5-9B在GPQA Diamond、MMMU-Pro、ERQA、Video-MME等多項(xiàng)評(píng)測(cè)中拔得頭籌,大幅領(lǐng)先GPT-OSS-20B、GPT-5 nano、Gemini 2.5 Flash-Lite以及自家的Qwen3-Next-80B-A3B-Thinking、Qwen3-30B-A3B-2507。

作為小型模型,Qwen3.5-4B的表現(xiàn)已接近Qwen3.5-9B,在多語(yǔ)言知識(shí)、視覺(jué)推理、文檔理解等任務(wù)上媲美更大模型,在純數(shù)學(xué)推理方面仍有差距,這也是小版本模型的普遍問(wèn)題。

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲Qwen3.5-9B和Qwen3.5-4B的測(cè)評(píng)情況

這些小型模型均基于Qwen3.5統(tǒng)一基座,Apache 2.0開(kāi)源可商用,支持LoRA/全量微調(diào),消費(fèi)級(jí)顯卡即可啟動(dòng)任務(wù)適配。具體來(lái)看:

0.8B/2B版本具備小巧、快速的特點(diǎn),是端側(cè)首選。這兩個(gè)模型非常適合移動(dòng)設(shè)備、IoT 邊緣設(shè)備部署,以及低延時(shí)的實(shí)時(shí)交互場(chǎng)景。

4B版本性能更強(qiáng)勁,具備多模態(tài)基座模型。該版本適合作為輕量級(jí)智能體的核心大腦,平衡性能與資源消耗。

9B版本模型結(jié)構(gòu)緊湊,但性能媲美gpt-oss-120B,適合需要較高智力水平但受限顯存資源的服務(wù)器端部署,是性價(jià)比極高的通用模型選擇。

目前所有模型均已在魔搭社區(qū)和Hugging Face開(kāi)源,同時(shí)小尺寸模型的基座模型也已開(kāi)源。

自2月中旬Qwen3.5模型正式推出之后,不少海內(nèi)外開(kāi)發(fā)者一直“催更”小規(guī)模版本Qwen3.5。而隨著今天小版本模型終于面世,開(kāi)發(fā)者們也立即參與討論并體驗(yàn)起來(lái)。

一位開(kāi)發(fā)者稱:“9B在MMMU-Pro測(cè)試中以13分的優(yōu)勢(shì)擊敗GPT-5-Nano才是真正的亮點(diǎn)。一個(gè)可以在筆記本電腦上運(yùn)行的模型,性能卻超越了云端旗艦級(jí)的Nano模型,架構(gòu)優(yōu)勢(shì)遠(yuǎn)勝于參數(shù)數(shù)量?!?/p>

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲社交平臺(tái)X網(wǎng)友評(píng)論

另一位開(kāi)發(fā)者稱:“這比人們想象的要強(qiáng)大得多。一臺(tái)運(yùn)行在Mac mini 上的Qwen 3.5加上24hx7全天候運(yùn)行的OpenClaw,就能打造出一個(gè)成本不到一個(gè)月初級(jí)員工工資的AI員工。”

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

還有開(kāi)發(fā)者分享,他使用AMD Ryzen AI Max+395處理器和 Q4_K_XL量化算法,并開(kāi)啟完整的256k上下文窗口,處理速度達(dá)到了約30個(gè)token/s。而且它只需要不到16GB的顯存。對(duì)此他驚嘆:“我的天!Qwen3.5-9B 的體積雖小,但性能卻非常強(qiáng)勁:多語(yǔ)言處理能力出色,通用知識(shí)儲(chǔ)備豐富,視覺(jué)輸入處理能力也很強(qiáng)?!?/p>

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲社交平臺(tái)X網(wǎng)友評(píng)論

值得一提的是,有網(wǎng)友稱Qwen 3.5不僅可在任何筆記本電腦上運(yùn)行,它還能在手機(jī)上運(yùn)行。此話一出,不少人追問(wèn):“如何在iPhone上運(yùn)行?”

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲社交平臺(tái)X網(wǎng)友評(píng)論

不過(guò)也有開(kāi)發(fā)者直截了當(dāng)?shù)卣f(shuō):“4B模型只是一個(gè)智能自動(dòng)補(bǔ)全工具,而不是一個(gè)思考伙伴。GPQA Diamond(研究生水平推理)的正確率約為45%,HMMT數(shù)學(xué)測(cè)試的正確率約為15%。這意味著它在難題上超過(guò)一半的概率都會(huì)出錯(cuò)?!?/p>

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌

▲社交平臺(tái)X網(wǎng)友評(píng)論

小型模型的能力固然有限,但其在特定能力維度評(píng)測(cè)上已達(dá)到Gemini 3 Flash等云端部署模型的水平,這意味著其已經(jīng)能在很多端邊側(cè)場(chǎng)景發(fā)揮實(shí)際效用。

至此,Qwen3.5家族已開(kāi)源:

1個(gè)大尺寸模型:Qwen3.5-397B-A17B

3個(gè)中型尺寸模型:Qwen3.5-122-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B

4個(gè)小尺寸模型:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B

Hugging Face地址:
https://huggingface.co/collections/Qwen/qwen35
魔搭社區(qū)地址:
https://modelscope.cn/collections/Qwen/Qwen35

附Qwen3.5-9B和Qwen3.5-4B完整測(cè)評(píng)成績(jī):

馬斯克驚呼太強(qiáng)了!國(guó)產(chǎn)0.8B模型開(kāi)源,網(wǎng)友:已在iPhone上摩拳擦掌