智東西(公眾號(hào):zhidxcom)
作者 | 李水青
編輯 | 云鵬

智東西2月25日?qǐng)?bào)道,今日,阿里推出馬年首批新模型——Qwen3.5中型模型系列,包括推出Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B(Dense)三款開源模型,同時(shí)Qwen3.5-Flash(Qwen3.5-35B-A3B生產(chǎn)版本)API已上線阿里云百煉。

Qwen3.5最新三款中型模型在指令遵循、研究生級(jí)推理、哈佛-MIT數(shù)學(xué)競(jìng)賽級(jí)數(shù)學(xué)、多語言知識(shí)、智能體工具使用等
12項(xiàng)能力測(cè)評(píng)中,在通用推理、數(shù)學(xué)、智能體、多模態(tài)等多個(gè)方面,整體表現(xiàn)可與GPT-5 mini、Claude Sonnet 4.5等國(guó)際一流模型相媲美。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5中型模型系列測(cè)評(píng)情況

模型一經(jīng)發(fā)布在開發(fā)者圈引起關(guān)注。多位開發(fā)者稱這些模型尺寸是本地推理的絕佳選擇,贊嘆其“更小模型實(shí)現(xiàn)更強(qiáng)性能”,甚至有人稱Qwen3.5-35B-A3B有望將其每月花費(fèi)從2000歐元(購買Gemini服務(wù))降至50歐元,大大節(jié)省成本。阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

具體來看,其中最受關(guān)注的Qwen3.5-35B-A3B,性能已超越參數(shù)規(guī)模大數(shù)倍的Qwen3-235B-A22B-2507和Qwen3-VL-235B-A22B。正如一位海外網(wǎng)友所說:“架構(gòu)+數(shù)據(jù)質(zhì)量>原始參數(shù)。我一年來一直這么說。”

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

Qwen3.5-122B-A10B和Qwen3.5-27B進(jìn)一步縮小了中型模型與前沿模型之間的差距,尤其是在復(fù)雜智能體場(chǎng)景中表現(xiàn)突出。Qwen3.5-Flash是與35B-A3B版本一致的托管生產(chǎn)版本,主打以較快速度提供強(qiáng)性能,每百萬Token價(jià)格低至0.2元,默認(rèn)支持1M超長(zhǎng)上下文長(zhǎng)度,滿足長(zhǎng)文檔與復(fù)雜任務(wù)處理需求。

目前,Qwen Chat上的模型均已更新為Qwen3.5系列,最新四款中型模型也已上線。智東西第一時(shí)間對(duì)這三款開源模型進(jìn)行了初步體驗(yàn),發(fā)現(xiàn)這三款中型模型已能滿足多種日常的多模態(tài)理解、知識(shí)解答、視覺編程等任務(wù),達(dá)到匹敵Qwen3-235B-A22B-2507的效果,不過在SVG卡通場(chǎng)景繪制等場(chǎng)景仍有提升空間。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲四款新模型已上線Qwen Chat

持續(xù)迭代的產(chǎn)品力有望讓阿里千問占據(jù)更大市場(chǎng)。近期,國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)沙利文報(bào)告顯示,2025年下半年,中國(guó)企業(yè)級(jí)大模型日均調(diào)用量千問(Qwen)占比32.1%位列第一,相較上半年的17.7%幾乎翻倍,相比字節(jié)豆包(21.3%)、DeepSeek(18.4%)領(lǐng)先優(yōu)勢(shì)擴(kuò)大。

Hugging Face地址:
https://huggingface.co/collections/Qwen/qwen35
魔搭社區(qū)地址:
https://modelscope.cn/collections/Qwen/Qwen35
體驗(yàn)地址:
https://chat.qwen.ai/

一、實(shí)測(cè)多模態(tài)與知識(shí)能力出色,小體格編程強(qiáng),SVG生成待提升

在智東西的初步體驗(yàn)中,三款模型在多模態(tài)理解知識(shí)能力上都效果不錯(cuò)。

比如當(dāng)我上傳一張“公雞根雕”的圖片,三款模型都能夠準(zhǔn)確識(shí)別其為根雕藝術(shù)品,能夠根據(jù)顏色和紋理準(zhǔn)確識(shí)別材料為“崖柏”,能結(jié)合中國(guó)傳統(tǒng)文化解讀這一物件的意義,甚至能基于材質(zhì)、工藝水平、尺寸大小等因素進(jìn)行價(jià)格評(píng)估,評(píng)估結(jié)果基本符合這一領(lǐng)域的專業(yè)水平,令人很驚喜。

如下圖所示,Qwen3.5-122B-A10B和Qwen3.5-35B-A3B的輸出答案都基本接近事實(shí),對(duì)“這是什么物件,用的什么原材料,有什么寓意,可能值多少錢?”四個(gè)問題進(jìn)行了準(zhǔn)確的理解作答。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-122B-A10B生成的答案

Qwen3.5-27B的輸出內(nèi)容在形式上更加別出心裁,不僅對(duì)幾個(gè)問題進(jìn)行了準(zhǔn)確回答,還通過圖表、格式變化等方式,讓內(nèi)容呈現(xiàn)更加重點(diǎn)分明,并最終給出了“5000-15000元”較為直接可參考的估價(jià),體現(xiàn)了其“工程實(shí)用度高”的特點(diǎn)。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-27B生成的答案

而后智東西著重考察了Qwen3.5-27B(Dense)的編程能力,讓其生成一個(gè)“虛擬助手個(gè)人智能體OpenQwen的官方主頁”,并提出“該助手可輔助編程、辦公、購物等各類事務(wù)。生成高質(zhì)量圖片作為網(wǎng)站素材,包含智能體頭像及功能使用場(chǎng)景演示”等特征。

如下圖所示,Qwen3.5-27B能夠比較完整地生成這一網(wǎng)站的頁面,邏輯上基本與提示詞描述契合,展現(xiàn)其以較小參數(shù)規(guī)模實(shí)現(xiàn)了較強(qiáng)視覺編程能力的特征。不過相比Qwen3.5-397B-A17B的視覺編程能力,Qwen3.5-27B在視覺元素豐富程度、交互性等方面仍有一些差距。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-27B生成的代碼預(yù)覽情況(部分)

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-397B-A17B生成的代碼預(yù)覽情況

而在SVG卡通場(chǎng)景繪制的場(chǎng)景中,智東西要求三款模型輸出“陽光沙灘”的SVG卡通圖,對(duì)尺寸、主題、元素、風(fēng)格和細(xì)節(jié)要求具體,三款模型在復(fù)雜約束下輸出的SVG基本結(jié)構(gòu)清晰,但太陽、海浪、遮陽傘、椰子樹等物體的貼近程度仍表現(xiàn)不足。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲提示詞

Qwen3.5-122B-A10B生成的SVG相對(duì)更加準(zhǔn)確,椰子樹下的陰影更符合物理規(guī)律,畫面的飽和度更加高。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-122B-A10B生成的SVG

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-35B-A3B生成的SVG

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲Qwen3.5-27B生成的SVG

二、35B模型超235B,開發(fā)者喜迎降本,催更1B小版本

2月16日,阿里正式推出原生視覺語言模型Qwen3.5,Qwen3.5系列的第一款模型Qwen3.5-397B-A17B首次以開源權(quán)重形式亮相,該模型在推理、編程、智能體能力與多模態(tài)理解等全方位基準(zhǔn)評(píng)估中領(lǐng)先,引起產(chǎn)業(yè)關(guān)注。

僅僅一周多之后,阿里發(fā)布了Qwen3.5系列幾款中型模型,進(jìn)一步在海內(nèi)外引起開發(fā)者的高熱討論。

其中最受關(guān)注的當(dāng)屬擁有350億參數(shù)的Qwen3.5-35B-A3B。多位網(wǎng)友稱Qwen3.5-35B-A3B擊敗2350億參數(shù)的Qwen3-235B-A22B-2507是“重點(diǎn)”、“大新聞”。

有網(wǎng)友稱:“更小的模型在更便宜的硬件上運(yùn)行速度更快,同時(shí)還能達(dá)到甚至超越大型模型的性能——這才是AI真正的民主化。”還有網(wǎng)友分享:“我現(xiàn)在在一個(gè)項(xiàng)目上每月要花2000歐元購買Gemini服務(wù),如果這是真的,那費(fèi)用就降到每月50歐元了?!?/p>

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

一位開發(fā)者分享了其部署Qwen3.5-35B-A3B的情況,稱模型可以跑在16GB的顯存機(jī)器上,處理32k上下文時(shí),每秒處理數(shù)能達(dá)到60-70個(gè)任務(wù);但他也提到,模型吞token的速度驚人,一個(gè)短謎題就用了大約6k token,但最終答案是正確的。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

Qwen3.5-27B的模型參數(shù)更小,也做到了“小規(guī)模強(qiáng)性能”。一位網(wǎng)友稱:“Qwen3.5-27B型號(hào)的得分為何如此之高?GGUF版本何時(shí)發(fā)布?”另一位網(wǎng)友也稱:“這次發(fā)布太棒了!我對(duì)27B參數(shù)模型特別感興趣,不過以后你們能不能把GGUF模型也和主版本一起發(fā)布?這樣用戶就能更快地用上這個(gè)模型。”

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

也有網(wǎng)友開啟了催更模式。有網(wǎng)友稱:“有計(jì)劃發(fā)布小型模型嗎?比如1B/3B/7B?”,也有網(wǎng)友喊話:“我希望未來幾周內(nèi)也能推出2-4B參數(shù)的型號(hào),Qwen3-4B-2507或許是迄今為止性能與體積比最高的型號(hào),我希望你們能延續(xù)這一傳統(tǒng)?!?/p>

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

不過也有網(wǎng)友表達(dá)了更高的期待:“我真搞不懂為什么這張圖表(測(cè)評(píng)圖表)里沒有Claude Sonnet 4.6和Opus 4.5這兩款在SWE認(rèn)證評(píng)分中分別高達(dá)79.6分和80.6分的機(jī)型?!?/p>

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

三、基準(zhǔn)測(cè)試:122B大而全,35B強(qiáng)在智能體,27B工程實(shí)用度高

看完實(shí)際體驗(yàn),我們?cè)倩剡^頭來看看具體的測(cè)評(píng)成績(jī)。從這三款模型的定位來看:

Qwen3.5-122B-A10B是一個(gè)相對(duì)大而全的模型,綜合能力最強(qiáng),相對(duì)適合多模態(tài)、視頻、多語言場(chǎng)景;

Qwen3.5-35B-A3B的優(yōu)勢(shì)集中在智能體深度能力,適用于智能體規(guī)劃、深度推理、任務(wù)調(diào)度,空間智能能力強(qiáng);

Qwen3.5-27B(Dense)主打輕量化部署,工程實(shí)用度高,交互、編程、長(zhǎng)文本、數(shù)學(xué)拔尖。

知識(shí)維度,Qwen3.5-122B-A10B在專業(yè)領(lǐng)域知識(shí)與推理(MMLU-Pro)、多語言與多領(lǐng)域知識(shí)(MMLU-Redux)、研究生級(jí)知識(shí)與推理(SuperGPQA)三項(xiàng)取得最高分。在指令跟隨、長(zhǎng)上下文處理和STEM推理三大維度,Qwen3.5全系列都取得領(lǐng)先的成績(jī)。

編程能力上,Qwen3.5-27B在SWE-bench Verified(真實(shí)軟件工程問題解決能力)中取得最高分,Qwen3.5-122B-A10B在Terminal Bench 2(終端環(huán)境下的代碼執(zhí)行與調(diào)試能力)和 FullStackBench en(英文全棧開發(fā)能力)中表現(xiàn)最佳。

通用智能體維度,Qwen3.5系列呈“梯隊(duì)式優(yōu)勢(shì)”,在BFCL-V4(通用智能體工具使用能力)、TAU2-Bench(智能體任務(wù)執(zhí)行與適配能力)、DeepPlanning(智能體深度規(guī)劃與邏輯推演能力)等多項(xiàng)測(cè)評(píng)中取得最佳成績(jī)。在搜索智能體維度,Qwen3.5-122B-A10B主導(dǎo)英文/中文瀏覽檢索,Qwen3.5-27B包攬復(fù)雜推理與綜合搜索最高分。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

多語言能力維度,Qwen3.5-122B-A10B表現(xiàn)尤為突出。在多模態(tài)能力維度,其在通用VQA領(lǐng)域也表現(xiàn)強(qiáng)勢(shì),拿下RealWorldQA(真實(shí)世界場(chǎng)景下的視覺問答能力)、MMStar(多模態(tài)綜合理解與推理能力)等四項(xiàng)最高分;Qwen3.5-27B在HallusionBench(多模態(tài)幻覺抑制與事實(shí)一致性能力)、CharXiv(RQ)(學(xué)術(shù)文檔的理解與檢索能力)等評(píng)測(cè)中表現(xiàn)最佳。

空間智能方面,Qwen3.5系列實(shí)現(xiàn)全維度領(lǐng)跑。在視頻理解方面,Qwen3.5-122B-A10B成為本次測(cè)評(píng)的絕對(duì)領(lǐng)跑者,包攬帶字幕的視頻多模態(tài)理解能力、視頻與語言結(jié)合的跨模態(tài)理解能力等6項(xiàng)單項(xiàng)最高分。

聚焦視覺智能體與專業(yè)視覺能力,Qwen3.5系列壟斷視覺智能體與醫(yī)療視覺核心能力:在8項(xiàng)測(cè)評(píng)中,Qwen3.5系列包攬了6項(xiàng)最高分,僅在桌面系統(tǒng)交互(OSWorld-Verified)上落后于GPT-5-mini,整體視覺智能體與醫(yī)療視覺能力領(lǐng)先。

阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招 阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發(fā)者送省錢絕招

四、對(duì)比Qwen3,解讀Qwen3.5五大技術(shù)升級(jí)

按照千問研發(fā)團(tuán)隊(duì)的思路,智能進(jìn)步的關(guān)鍵,從來不是堆參數(shù),而是更優(yōu)架構(gòu)+更高質(zhì)量數(shù)據(jù)+強(qiáng)化學(xué)習(xí)(RL)的有效協(xié)同。

相比于阿里上一代旗艦?zāi)P蚎wen3,Qwen3.5具有以下增強(qiáng)功能:

統(tǒng)一視覺語言基礎(chǔ):在多模態(tài)標(biāo)記上進(jìn)行早期融合訓(xùn)練,實(shí)現(xiàn)了與Qwen3的跨代對(duì)等,并在推理、編碼、Agent和視覺理解基準(zhǔn)測(cè)試中優(yōu)于Qwen3-VL模型。

高效混合架構(gòu):門控Delta網(wǎng)絡(luò)與稀疏混合專家相結(jié)合,可實(shí)現(xiàn)高吞吐量推理,同時(shí)最大限度地減少延遲和成本開銷。

可擴(kuò)展的強(qiáng)化學(xué)習(xí)泛化:將強(qiáng)化學(xué)習(xí)擴(kuò)展到百萬智能體環(huán)境,并逐步增加任務(wù)分布的復(fù)雜性,以實(shí)現(xiàn)強(qiáng)大的現(xiàn)實(shí)世界適應(yīng)性。

全球語言覆蓋范圍:擴(kuò)展支持201種語言和方言,實(shí)現(xiàn)包容性的全球部署,并具備細(xì)致入微的文化和區(qū)域理解。

下一代訓(xùn)練基礎(chǔ)設(shè)施:與僅文本訓(xùn)練相比,多模態(tài)訓(xùn)練效率接近100%,異步RL框架支持大規(guī)模代理支架和環(huán)境編排。

結(jié)語:企業(yè)級(jí)大模型市場(chǎng)頭部效應(yīng)初顯,產(chǎn)品迭代速度是關(guān)鍵

通過此次發(fā)布Qwen3.5中型模型系列,阿里試圖以“更優(yōu)架構(gòu)+更高質(zhì)量數(shù)據(jù)+強(qiáng)化學(xué)習(xí)”,驗(yàn)證了“規(guī)模法則”之外的另一條進(jìn)化路徑。

三款模型的發(fā)布時(shí)間距離Qwen3.5-397B-A17B僅一周,分別切入多模態(tài)、智能體深度推理與輕量化部署三大場(chǎng)景,在開發(fā)者圈引發(fā)了模型成本熱議,也快速補(bǔ)齊了其產(chǎn)品矩陣。

從市場(chǎng)格局看,Qwen系列在國(guó)內(nèi)企業(yè)級(jí)市場(chǎng)的日均調(diào)用量份額從17.7%躍升至32.1%,進(jìn)一步拉大領(lǐng)先優(yōu)勢(shì)。此次發(fā)布通過分層產(chǎn)品矩陣,有望進(jìn)一步鞏固其在企業(yè)級(jí)市場(chǎng)的頭部地位。