精品伊人久久人妻中文,日韩av中文字幕在线免费,校园激情自拍偷拍欧美

智東西（公眾號(hào)：zhidxcom）
作者 | 李水青
編輯 | 云鵬

智東西2月25日?qǐng)?bào)道，今日，阿里推出馬年首批新模型——Qwen3.5中型模型系列，包括推出Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B（Dense）三款開源模型，同時(shí)Qwen3.5-Flash（Qwen3.5-35B-A3B生產(chǎn)版本）API已上線阿里云百煉。

Qwen3.5最新三款中型模型在指令遵循、研究生級(jí)推理、哈佛-MIT數(shù)學(xué)競(jìng)賽級(jí)數(shù)學(xué)、多語言知識(shí)、智能體工具使用等
12項(xiàng)能力測(cè)評(píng)中，在通用推理、數(shù)學(xué)、智能體、多模態(tài)等多個(gè)方面，整體表現(xiàn)可與GPT-5 mini、Claude Sonnet 4.5等國(guó)際一流模型相媲美。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5中型模型系列測(cè)評(píng)情況

模型一經(jīng)發(fā)布在開發(fā)者圈引起關(guān)注。多位開發(fā)者稱這些模型尺寸是本地推理的絕佳選擇，贊嘆其“更小模型實(shí)現(xiàn)更強(qiáng)性能”，甚至有人稱Qwen3.5-35B-A3B有望將其每月花費(fèi)從2000歐元（購買Gemini服務(wù)）降至50歐元，大大節(jié)省成本。阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

具體來看，其中最受關(guān)注的Qwen3.5-35B-A3B，性能已超越參數(shù)規(guī)模大數(shù)倍的Qwen3-235B-A22B-2507和Qwen3-VL-235B-A22B。正如一位海外網(wǎng)友所說：“架構(gòu)+數(shù)據(jù)質(zhì)量>原始參數(shù)。我一年來一直這么說。”

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

Qwen3.5-122B-A10B和Qwen3.5-27B進(jìn)一步縮小了中型模型與前沿模型之間的差距，尤其是在復(fù)雜智能體場(chǎng)景中表現(xiàn)突出。Qwen3.5-Flash是與35B-A3B版本一致的托管生產(chǎn)版本，主打以較快速度提供強(qiáng)性能，每百萬Token價(jià)格低至0.2元，默認(rèn)支持1M超長(zhǎng)上下文長(zhǎng)度，滿足長(zhǎng)文檔與復(fù)雜任務(wù)處理需求。

目前，Qwen Chat上的模型均已更新為Qwen3.5系列，最新四款中型模型也已上線。智東西第一時(shí)間對(duì)這三款開源模型進(jìn)行了初步體驗(yàn)，發(fā)現(xiàn)這三款中型模型已能滿足多種日常的多模態(tài)理解、知識(shí)解答、視覺編程等任務(wù)，達(dá)到匹敵Qwen3-235B-A22B-2507的效果，不過在SVG卡通場(chǎng)景繪制等場(chǎng)景仍有提升空間。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲四款新模型已上線Qwen Chat

持續(xù)迭代的產(chǎn)品力有望讓阿里千問占據(jù)更大市場(chǎng)。近期，國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)沙利文報(bào)告顯示，2025年下半年，中國(guó)企業(yè)級(jí)大模型日均調(diào)用量千問（Qwen）占比32.1%位列第一，相較上半年的17.7%幾乎翻倍，相比字節(jié)豆包（21.3%）、DeepSeek（18.4%）領(lǐng)先優(yōu)勢(shì)擴(kuò)大。

Hugging Face地址：
https://huggingface.co/collections/Qwen/qwen35
魔搭社區(qū)地址：
https://modelscope.cn/collections/Qwen/Qwen35
體驗(yàn)地址：
https://chat.qwen.ai/

一、實(shí)測(cè)多模態(tài)與知識(shí)能力出色，小體格編程強(qiáng)，SVG生成待提升

在智東西的初步體驗(yàn)中，三款模型在多模態(tài)理解和知識(shí)能力上都效果不錯(cuò)。

比如當(dāng)我上傳一張“公雞根雕”的圖片，三款模型都能夠準(zhǔn)確識(shí)別其為根雕藝術(shù)品，能夠根據(jù)顏色和紋理準(zhǔn)確識(shí)別材料為“崖柏”，能結(jié)合中國(guó)傳統(tǒng)文化解讀這一物件的意義，甚至能基于材質(zhì)、工藝水平、尺寸大小等因素進(jìn)行價(jià)格評(píng)估，評(píng)估結(jié)果基本符合這一領(lǐng)域的專業(yè)水平，令人很驚喜。

如下圖所示，Qwen3.5-122B-A10B和Qwen3.5-35B-A3B的輸出答案都基本接近事實(shí)，對(duì)“這是什么物件，用的什么原材料，有什么寓意，可能值多少錢？”四個(gè)問題進(jìn)行了準(zhǔn)確的理解作答。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-122B-A10B生成的答案

Qwen3.5-27B的輸出內(nèi)容在形式上更加別出心裁，不僅對(duì)幾個(gè)問題進(jìn)行了準(zhǔn)確回答，還通過圖表、格式變化等方式，讓內(nèi)容呈現(xiàn)更加重點(diǎn)分明，并最終給出了“5000-15000元”較為直接可參考的估價(jià)，體現(xiàn)了其“工程實(shí)用度高”的特點(diǎn)。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-27B生成的答案

而后智東西著重考察了Qwen3.5-27B（Dense）的編程能力，讓其生成一個(gè)“虛擬助手個(gè)人智能體OpenQwen的官方主頁”，并提出“該助手可輔助編程、辦公、購物等各類事務(wù)。生成高質(zhì)量圖片作為網(wǎng)站素材，包含智能體頭像及功能使用場(chǎng)景演示”等特征。

如下圖所示，Qwen3.5-27B能夠比較完整地生成這一網(wǎng)站的頁面，邏輯上基本與提示詞描述契合，展現(xiàn)其以較小參數(shù)規(guī)模實(shí)現(xiàn)了較強(qiáng)視覺編程能力的特征。不過相比Qwen3.5-397B-A17B的視覺編程能力，Qwen3.5-27B在視覺元素豐富程度、交互性等方面仍有一些差距。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-27B生成的代碼預(yù)覽情況（部分）

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-397B-A17B生成的代碼預(yù)覽情況

而在SVG卡通場(chǎng)景繪制的場(chǎng)景中，智東西要求三款模型輸出“陽光沙灘”的SVG卡通圖，對(duì)尺寸、主題、元素、風(fēng)格和細(xì)節(jié)要求具體，三款模型在復(fù)雜約束下輸出的SVG基本結(jié)構(gòu)清晰，但太陽、海浪、遮陽傘、椰子樹等物體的貼近程度仍表現(xiàn)不足。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲提示詞

Qwen3.5-122B-A10B生成的SVG相對(duì)更加準(zhǔn)確，椰子樹下的陰影更符合物理規(guī)律，畫面的飽和度更加高。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-122B-A10B生成的SVG

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-35B-A3B生成的SVG

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲Qwen3.5-27B生成的SVG

二、35B模型超235B，開發(fā)者喜迎降本，催更1B小版本

2月16日，阿里正式推出原生視覺語言模型Qwen3.5，Qwen3.5系列的第一款模型Qwen3.5-397B-A17B首次以開源權(quán)重形式亮相，該模型在推理、編程、智能體能力與多模態(tài)理解等全方位基準(zhǔn)評(píng)估中領(lǐng)先，引起產(chǎn)業(yè)關(guān)注。

僅僅一周多之后，阿里發(fā)布了Qwen3.5系列幾款中型模型，進(jìn)一步在海內(nèi)外引起開發(fā)者的高熱討論。

其中最受關(guān)注的當(dāng)屬擁有350億參數(shù)的Qwen3.5-35B-A3B。多位網(wǎng)友稱Qwen3.5-35B-A3B擊敗2350億參數(shù)的Qwen3-235B-A22B-2507是“重點(diǎn)”、“大新聞”。

有網(wǎng)友稱：“更小的模型在更便宜的硬件上運(yùn)行速度更快，同時(shí)還能達(dá)到甚至超越大型模型的性能——這才是AI真正的民主化。”還有網(wǎng)友分享：“我現(xiàn)在在一個(gè)項(xiàng)目上每月要花2000歐元購買Gemini服務(wù)，如果這是真的，那費(fèi)用就降到每月50歐元了?！?/p>

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

一位開發(fā)者分享了其部署Qwen3.5-35B-A3B的情況，稱模型可以跑在16GB的顯存機(jī)器上，處理32k上下文時(shí)，每秒處理數(shù)能達(dá)到60-70個(gè)任務(wù)；但他也提到，模型吞token的速度驚人，一個(gè)短謎題就用了大約6k token，但最終答案是正確的。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

Qwen3.5-27B的模型參數(shù)更小，也做到了“小規(guī)模強(qiáng)性能”。一位網(wǎng)友稱：“Qwen3.5-27B型號(hào)的得分為何如此之高？GGUF版本何時(shí)發(fā)布？”另一位網(wǎng)友也稱：“這次發(fā)布太棒了！我對(duì)27B參數(shù)模型特別感興趣，不過以后你們能不能把GGUF模型也和主版本一起發(fā)布？這樣用戶就能更快地用上這個(gè)模型。”

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

也有網(wǎng)友開啟了催更模式。有網(wǎng)友稱：“有計(jì)劃發(fā)布小型模型嗎？比如1B/3B/7B？”，也有網(wǎng)友喊話：“我希望未來幾周內(nèi)也能推出2-4B參數(shù)的型號(hào)，Qwen3-4B-2507或許是迄今為止性能與體積比最高的型號(hào)，我希望你們能延續(xù)這一傳統(tǒng)?！?/p>

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

不過也有網(wǎng)友表達(dá)了更高的期待：“我真搞不懂為什么這張圖表（測(cè)評(píng)圖表）里沒有Claude Sonnet 4.6和Opus 4.5這兩款在SWE認(rèn)證評(píng)分中分別高達(dá)79.6分和80.6分的機(jī)型?！?/p>

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

▲社交平臺(tái)X上的網(wǎng)友評(píng)論

三、基準(zhǔn)測(cè)試：122B大而全，35B強(qiáng)在智能體，27B工程實(shí)用度高

看完實(shí)際體驗(yàn)，我們?cè)倩剡^頭來看看具體的測(cè)評(píng)成績(jī)。從這三款模型的定位來看：

Qwen3.5-122B-A10B是一個(gè)相對(duì)大而全的模型，綜合能力最強(qiáng)，相對(duì)適合多模態(tài)、視頻、多語言場(chǎng)景；

Qwen3.5-35B-A3B的優(yōu)勢(shì)集中在智能體深度能力，適用于智能體規(guī)劃、深度推理、任務(wù)調(diào)度，空間智能能力強(qiáng)；

Qwen3.5-27B（Dense）主打輕量化部署，工程實(shí)用度高，交互、編程、長(zhǎng)文本、數(shù)學(xué)拔尖。

在知識(shí)維度，Qwen3.5-122B-A10B在專業(yè)領(lǐng)域知識(shí)與推理（MMLU-Pro）、多語言與多領(lǐng)域知識(shí)（MMLU-Redux）、研究生級(jí)知識(shí)與推理（SuperGPQA）三項(xiàng)取得最高分。在指令跟隨、長(zhǎng)上下文處理和STEM推理三大維度，Qwen3.5全系列都取得領(lǐng)先的成績(jī)。

在編程能力上，Qwen3.5-27B在SWE-bench Verified（真實(shí)軟件工程問題解決能力）中取得最高分，Qwen3.5-122B-A10B在Terminal Bench 2（終端環(huán)境下的代碼執(zhí)行與調(diào)試能力）和 FullStackBench en（英文全棧開發(fā)能力）中表現(xiàn)最佳。

在通用智能體維度，Qwen3.5系列呈“梯隊(duì)式優(yōu)勢(shì)”，在BFCL-V4（通用智能體工具使用能力）、TAU2-Bench（智能體任務(wù)執(zhí)行與適配能力）、DeepPlanning（智能體深度規(guī)劃與邏輯推演能力）等多項(xiàng)測(cè)評(píng)中取得最佳成績(jī)。在搜索智能體維度，Qwen3.5-122B-A10B主導(dǎo)英文/中文瀏覽檢索，Qwen3.5-27B包攬復(fù)雜推理與綜合搜索最高分。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

在多語言能力維度，Qwen3.5-122B-A10B表現(xiàn)尤為突出。在多模態(tài)能力維度，其在通用VQA領(lǐng)域也表現(xiàn)強(qiáng)勢(shì)，拿下RealWorldQA（真實(shí)世界場(chǎng)景下的視覺問答能力）、MMStar（多模態(tài)綜合理解與推理能力）等四項(xiàng)最高分；Qwen3.5-27B在HallusionBench（多模態(tài)幻覺抑制與事實(shí)一致性能力）、CharXiv（RQ）（學(xué)術(shù)文檔的理解與檢索能力）等評(píng)測(cè)中表現(xiàn)最佳。

在空間智能方面，Qwen3.5系列實(shí)現(xiàn)全維度領(lǐng)跑。在視頻理解方面，Qwen3.5-122B-A10B成為本次測(cè)評(píng)的絕對(duì)領(lǐng)跑者，包攬帶字幕的視頻多模態(tài)理解能力、視頻與語言結(jié)合的跨模態(tài)理解能力等6項(xiàng)單項(xiàng)最高分。

聚焦視覺智能體與專業(yè)視覺能力，Qwen3.5系列壟斷視覺智能體與醫(yī)療視覺核心能力：在8項(xiàng)測(cè)評(píng)中，Qwen3.5系列包攬了6項(xiàng)最高分，僅在桌面系統(tǒng)交互（OSWorld-Verified）上落后于GPT-5-mini，整體視覺智能體與醫(yī)療視覺能力領(lǐng)先。

阿里Qwen3.5馬年首開源！35B性能逆襲235B，給開發(fā)者送省錢絕招

四、對(duì)比Qwen3，解讀Qwen3.5五大技術(shù)升級(jí)

按照千問研發(fā)團(tuán)隊(duì)的思路，智能進(jìn)步的關(guān)鍵，從來不是堆參數(shù)，而是更優(yōu)架構(gòu)+更高質(zhì)量數(shù)據(jù)+強(qiáng)化學(xué)習(xí)（RL）的有效協(xié)同。

相比于阿里上一代旗艦?zāi)Ｐ蚎wen3，Qwen3.5具有以下增強(qiáng)功能：

統(tǒng)一視覺語言基礎(chǔ)：在多模態(tài)標(biāo)記上進(jìn)行早期融合訓(xùn)練，實(shí)現(xiàn)了與Qwen3的跨代對(duì)等，并在推理、編碼、Agent和視覺理解基準(zhǔn)測(cè)試中優(yōu)于Qwen3-VL模型。

高效混合架構(gòu)：門控Delta網(wǎng)絡(luò)與稀疏混合專家相結(jié)合，可實(shí)現(xiàn)高吞吐量推理，同時(shí)最大限度地減少延遲和成本開銷。

可擴(kuò)展的強(qiáng)化學(xué)習(xí)泛化：將強(qiáng)化學(xué)習(xí)擴(kuò)展到百萬智能體環(huán)境，并逐步增加任務(wù)分布的復(fù)雜性，以實(shí)現(xiàn)強(qiáng)大的現(xiàn)實(shí)世界適應(yīng)性。

全球語言覆蓋范圍：擴(kuò)展支持201種語言和方言，實(shí)現(xiàn)包容性的全球部署，并具備細(xì)致入微的文化和區(qū)域理解。

下一代訓(xùn)練基礎(chǔ)設(shè)施：與僅文本訓(xùn)練相比，多模態(tài)訓(xùn)練效率接近100%，異步RL框架支持大規(guī)模代理支架和環(huán)境編排。

結(jié)語：企業(yè)級(jí)大模型市場(chǎng)頭部效應(yīng)初顯，產(chǎn)品迭代速度是關(guān)鍵

通過此次發(fā)布Qwen3.5中型模型系列，阿里試圖以“更優(yōu)架構(gòu)+更高質(zhì)量數(shù)據(jù)+強(qiáng)化學(xué)習(xí)”，驗(yàn)證了“規(guī)模法則”之外的另一條進(jìn)化路徑。

三款模型的發(fā)布時(shí)間距離Qwen3.5-397B-A17B僅一周，分別切入多模態(tài)、智能體深度推理與輕量化部署三大場(chǎng)景，在開發(fā)者圈引發(fā)了模型成本熱議，也快速補(bǔ)齊了其產(chǎn)品矩陣。

從市場(chǎng)格局看，Qwen系列在國(guó)內(nèi)企業(yè)級(jí)市場(chǎng)的日均調(diào)用量份額從17.7%躍升至32.1%，進(jìn)一步拉大領(lǐng)先優(yōu)勢(shì)。此次發(fā)布通過分層產(chǎn)品矩陣，有望進(jìn)一步鞏固其在企業(yè)級(jí)市場(chǎng)的頭部地位。

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、實(shí)測(cè)多模態(tài)與知識(shí)能力出色，小體格編程強(qiáng)，SVG生成待提升

二、35B模型超235B，開發(fā)者喜迎降本，催更1B小版本

三、基準(zhǔn)測(cè)試：122B大而全，35B強(qiáng)在智能體，27B工程實(shí)用度高

四、對(duì)比Qwen3，解讀Qwen3.5五大技術(shù)升級(jí)

結(jié)語：企業(yè)級(jí)大模型市場(chǎng)頭部效應(yīng)初顯，產(chǎn)品迭代速度是關(guān)鍵

相關(guān)推薦

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、實(shí)測(cè)多模態(tài)與知識(shí)能力出色，小體格編程強(qiáng)，SVG生成待提升

二、35B模型超235B，開發(fā)者喜迎降本，催更1B小版本

三、基準(zhǔn)測(cè)試：122B大而全，35B強(qiáng)在智能體，27B工程實(shí)用度高

四、對(duì)比Qwen3，解讀Qwen3.5五大技術(shù)升級(jí)

結(jié)語：企業(yè)級(jí)大模型市場(chǎng)頭部效應(yīng)初顯，產(chǎn)品迭代速度是關(guān)鍵

相關(guān)推薦

一、實(shí)測(cè)多模態(tài)與知識(shí)能力出色，小體格編程強(qiáng)，SVG生成待提升

二、35B模型超235B，開發(fā)者喜迎降本，催更1B小版本

三、基準(zhǔn)測(cè)試：122B大而全，35B強(qiáng)在智能體，27B工程實(shí)用度高

四、對(duì)比Qwen3，解讀Qwen3.5五大技術(shù)升級(jí)

結(jié)語：企業(yè)級(jí)大模型市場(chǎng)頭部效應(yīng)初顯，產(chǎn)品迭代速度是關(guān)鍵