智東西(公眾號(hào):zhidxcom)
作者 |? 陳駿達(dá)
編輯 |? 漠影

什么,通義App現(xiàn)在長(zhǎng)這樣了?

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

近日,阿里旗下的通義App迎來(lái)升級(jí),UI、交互體驗(yàn)到背后接入的模型都全面重塑,整體外觀大做減法,而內(nèi)置模型、工具的能力則進(jìn)一步升級(jí)。

進(jìn)入新版通義App首頁(yè),主智能體引入“鄰家女孩”這一富有親和力的新形象,能勝任大部分應(yīng)用場(chǎng)景中的需求。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

右滑則是豐富的智能體生態(tài),將原版通義App的工具、角色、頻道等頁(yè)面整合,呈現(xiàn)更為直觀。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

左滑后,用戶(hù)的對(duì)話記錄、創(chuàng)作的圖像、視頻與創(chuàng)建的智能體都一覽無(wú)余。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

值得一提的是,新版通義App還接入阿里最新推理模型千問(wèn)QwQ-32B,這款模型以32B的參數(shù)量,在數(shù)學(xué)推理、編程能力上與671B的DeepSeek-R1 旗鼓相當(dāng)。此外,在多項(xiàng)通用能力測(cè)評(píng)中,QwQ-32B的得分超越DeepSeek-R1。一經(jīng)發(fā)布,便獲得全球開(kāi)發(fā)者的關(guān)注與贊賞。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

已經(jīng)有不少網(wǎng)友體驗(yàn)了升級(jí)后的通義App,其更快的響應(yīng)速度、更豐富的交互體驗(yàn)獲得好評(píng),還有網(wǎng)友感嘆,新版通義讓“最強(qiáng)AI飛入尋常百姓家”。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

通義App迎來(lái)升級(jí)后,智東西第一時(shí)間全面體驗(yàn)了其在交互、模型、工具等方面的新變化,在阿里加碼AI to C的大背景下,新版通義有望成為更實(shí)用、更貼心的個(gè)人AI助手。

一、拍照找bug、解答無(wú)厘頭問(wèn)題,還能給會(huì)議畫(huà)腦圖

新版通義App以超級(jí)智能體作為交互中樞,用戶(hù)在通義首頁(yè)能問(wèn)、能聊,還能讓智能體進(jìn)行圖片理解、圖片生成,翻譯、寫(xiě)作等任務(wù)。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

此外,通義首頁(yè)還會(huì)推薦基于其他模型或者具備其他不同功能的智能體。目前,基于Qwen-QwQ-32B的被放在了首頁(yè)的推薦欄中。用戶(hù)只需點(diǎn)擊,就能與這款新模型進(jìn)行對(duì)話。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

數(shù)學(xué)、代碼類(lèi)問(wèn)題一直是通義模型家族的強(qiáng)項(xiàng),實(shí)測(cè)中,搭載QwQ-32B智能體的通義App回答了從高考?jí)狠S題到AIME真題等不同難度的數(shù)學(xué)問(wèn)題,還編寫(xiě)了一個(gè)簡(jiǎn)單的游戲。同時(shí),為了避免大模型上網(wǎng)找答案,測(cè)試時(shí)聯(lián)網(wǎng)搜索能力均已關(guān)閉。

下方是2024年高考全國(guó)甲卷理科數(shù)學(xué)的壓軸題,在先前的測(cè)試中,智東西曾讓DeepSeek-R1解答,R1用時(shí)80余秒,給出了正確答案,但解題流程不符合評(píng)分標(biāo)準(zhǔn)中的規(guī)范。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

測(cè)試中,QwQ-32B在解答這道題目的用時(shí)略長(zhǎng)于R1,這主要是因?yàn)樗谒伎歼^(guò)程中進(jìn)行了更多的反思、驗(yàn)算等流程,還嘗試了不同的解題思路。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

▲QwQ-32B的部分思考過(guò)程

最終,QwQ-32B兩個(gè)小題的答案都完全正確,解題格式較為規(guī)范,不過(guò),它漏掉了一個(gè)踩分點(diǎn),無(wú)法拿到滿分。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

智東西又讓QwQ-32B嘗試了一道2024年的AIME真題。在面對(duì)英文題目時(shí),Qwen-32B也毫不露怯,會(huì)自動(dòng)用英文思考,不到一分鐘,QwQ-32B便給出了正確答案,這一次它的證明過(guò)程沒(méi)有破綻。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

測(cè)試完新版通義App中QwQ-32B智能體的數(shù)學(xué)能力,我們?cè)賮?lái)看看其編程方面的實(shí)力究竟如何。智東西讓QwQ-32B編寫(xiě)了一個(gè)基于HTML的五子棋小程序,并加入了“三三禁手”、“長(zhǎng)連禁手”等限制黑棋的規(guī)則。

幾分鐘后,QwQ-32B用不到200行代碼完成了這一任務(wù),還解釋了禁手檢測(cè)的實(shí)現(xiàn)邏輯。細(xì)讀它的思考過(guò)程,還能發(fā)現(xiàn)它自我迭代了幾版實(shí)現(xiàn)方法。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

不過(guò),作為一款手機(jī)App,通義在代碼場(chǎng)景中更常見(jiàn)的應(yīng)用或許是拍照解釋代碼。智東西在先前的程序中埋入了一個(gè)bug,導(dǎo)致游戲無(wú)法判斷勝者,無(wú)法結(jié)束。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

由于QwQ-32B智能體目前暫時(shí)不支持圖片上傳,我們將這一挑戰(zhàn)交給了通義App中的主智能體。據(jù)了解,在代碼類(lèi)問(wèn)題上,主智能體會(huì)調(diào)用通義千問(wèn)的Qwen-MAX模型。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

簡(jiǎn)單分析后,通義給出了幾個(gè)可能的原因與修復(fù)的代碼,復(fù)制粘貼后再進(jìn)行微調(diào),游戲程序便能夠正常運(yùn)行。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

如果說(shuō)數(shù)學(xué)、代碼等能力更偏向理科,那接下來(lái)的幾道測(cè)試題則更側(cè)重于文字推理、百科知識(shí)的考查。

目前,有許多大模型都在歷史類(lèi)問(wèn)題上表現(xiàn)不佳,尤其是在涉及資料較少的國(guó)家和民族時(shí)。智東西讓QwQ-32B智能體分析了“南非有沒(méi)有鎖甲”這一問(wèn)題。觀察它的思考過(guò)程,我們可以發(fā)現(xiàn),QwQ-32B從不同年代、不同民族的角度條分縷析地回答了這一問(wèn)題,答案也符合史實(shí)。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

至于下方這類(lèi)無(wú)厘頭的問(wèn)題,通義則采取了“用魔法打敗魔法”的策略。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

通義App中的QwQ-32B智能體引經(jīng)據(jù)典,從經(jīng)濟(jì)學(xué)視角、生物學(xué)視角邏輯學(xué)視角等5個(gè)不同角度給出了理由,讓人無(wú)可辯駁。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

通義App的一大特色是其專(zhuān)業(yè)能力,如實(shí)時(shí)記錄、拍照講題、健康問(wèn)答等領(lǐng)域。新版通義App中,實(shí)時(shí)記錄功能新上線了腦圖功能,錄音后不僅能生成會(huì)議紀(jì)要,還可以將會(huì)議內(nèi)容生成腦圖,可謂是打工人福音了;拍照講題功能現(xiàn)在不光能給出答案解析,還能持續(xù)追問(wèn),允許用戶(hù)“打破砂鍋問(wèn)到底”。

二、高情商有溫度,產(chǎn)品交互全面重塑

接入新模型、功能升級(jí)等調(diào)整進(jìn)一步提升了新版通義App的實(shí)用性,而產(chǎn)品界面、交互體驗(yàn)的變化則是從設(shè)計(jì)層面,讓通義App更加易用,也更具溫度。

過(guò)去的通義App同樣具備不俗的實(shí)力,但在用戶(hù)友好度上仍有優(yōu)化空間,未能向用戶(hù)充分表達(dá)、溝通其實(shí)力。

以原版通義的主頁(yè)面(下圖右2)為例,可以看到界面以文字為主,并集合了不少其他功能。這種設(shè)計(jì)雖然可以幫助用戶(hù)快速跳轉(zhuǎn),但也可能導(dǎo)致用戶(hù)在剛開(kāi)始使用時(shí)摸不著頭腦,需要一定的學(xué)習(xí)成本。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

新版通義App通過(guò)做減法,讓產(chǎn)品設(shè)計(jì)更加簡(jiǎn)潔清爽,突出了核心功能,也擁有了更具親和力的交互體驗(yàn)。

現(xiàn)在,打開(kāi)通義App后,映入眼簾的是更具親和力的人物形象,通義官方將其稱(chēng)之為“鄰家女孩”。這一形象可以視作是整個(gè)通義智能體生態(tài)的代言人,給人以親切、溫暖的感受。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

對(duì)大多數(shù)用戶(hù)而言,首頁(yè)主智能體是他們與App交互的核心入口,這一形象的變化能夠迅速拉近用戶(hù)與產(chǎn)品之間的距離,降低使用時(shí)的陌生感和距離感?!班徏遗ⅰ毕路降奈淖诌€會(huì)不斷變化,詢(xún)問(wèn)用戶(hù)的心情,或是用表情符號(hào)讓文字更為活潑。

在使用通義App的過(guò)程中,我們也能感受到與這一形象相符合的貼心體驗(yàn)。通義App在QwQ-32B智能體中推薦了這樣一個(gè)問(wèn)題:“如果你是人類(lèi),如何過(guò)幸福的一生?”模型給出的回答不僅包括實(shí)操建議,還撰寫(xiě)了鼓勵(lì)的話語(yǔ),既貼心又實(shí)用。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

新版通義App在其他方面的設(shè)計(jì)和調(diào)整,也進(jìn)一步降低了用戶(hù)使用的門(mén)檻。例如,保存用戶(hù)過(guò)去聊天記錄的板塊原本被分為助手、工具和角色,這一頁(yè)面還融合了與通義進(jìn)行語(yǔ)音交互的功能。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

而在新版通義中,左滑后進(jìn)入的對(duì)話記錄、個(gè)人資產(chǎn)頁(yè)面劃分更加易懂,被分為對(duì)話記錄、我創(chuàng)建的、我聊過(guò)的智能體,用戶(hù)能通過(guò)這些名稱(chēng)更直觀地找到自己所需的信息。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

使用頻率很高的拍照講題、實(shí)時(shí)記錄等功能,被調(diào)整到主頁(yè)輸入框上方,用戶(hù)可以一鍵切換。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

右滑后,通義App將代碼、紀(jì)要等生產(chǎn)力工具和視頻生成、繪圖、角色扮演整合到一個(gè)統(tǒng)一的智能體生態(tài)中,在中心位置呈現(xiàn)用戶(hù)最新使用的智能體與其他熱門(mén)應(yīng)用,讓用戶(hù)無(wú)需過(guò)多點(diǎn)擊就能直達(dá)目標(biāo)。

通義App迎重磅升級(jí)!接入阿里最新推理模型,實(shí)測(cè)觀感大不同

一些趣味的AI玩法能讓用戶(hù)使用App的體驗(yàn)更加輕松,不過(guò),并不是所有用戶(hù)都會(huì)高頻使用此類(lèi)應(yīng)用。在新版通義App中,這些智能體的位置被放在實(shí)用工具之后,用戶(hù)可以下滑點(diǎn)擊,或是通過(guò)搜索直接訪問(wèn)。

談及這些升級(jí),通義產(chǎn)品負(fù)責(zé)人認(rèn)為,他們不僅要通過(guò)強(qiáng)大的AI技術(shù)能力幫助用戶(hù)解決實(shí)際問(wèn)題,還要讓用戶(hù)在使用中感到更方便、更懂我。AI應(yīng)用的未來(lái)不僅僅是簡(jiǎn)單的提效工具,更是一個(gè)能夠理解、陪伴并提升用戶(hù)生活質(zhì)量的貼心AI助手。

三、Agent賽道爆火,通義積極布局

新版通義App的發(fā)布,正值A(chǔ)I Agent應(yīng)用的爆發(fā)期。2024年底,Anthropic發(fā)布了MCP(模型上下文協(xié)議),以統(tǒng)一標(biāo)準(zhǔn)規(guī)范了大模型應(yīng)用程序與外部數(shù)據(jù)源和工具的集成。

進(jìn)入2025年,OpenAI發(fā)布了Operator預(yù)覽版本,支持購(gòu)物、訂票等服務(wù);而Deep Research這類(lèi)深度研究工具,也體現(xiàn)了Agentic AI的思想。

在過(guò)去,通義已經(jīng)在基礎(chǔ)模型領(lǐng)域有深厚積累,涵蓋文本、圖像、語(yǔ)音、視頻,開(kāi)源模型廣受全球開(kāi)發(fā)者認(rèn)可。此外,通義App中積累了大量專(zhuān)業(yè)領(lǐng)域智能體,已經(jīng)擁有一定的用戶(hù)認(rèn)可,但尚未完全破圈。

新版通義App主頁(yè)面引入的超級(jí)智能體,有望憑借新的形象,成為加強(qiáng)用戶(hù)與智能體連接的紐帶。

通義App的C端化轉(zhuǎn)向,也符合這段時(shí)間以來(lái)阿里的AI To C戰(zhàn)略。去年年底,通義App團(tuán)隊(duì)從阿里云分拆,并入阿里智能信息事業(yè)群,而原有基礎(chǔ)模型團(tuán)隊(duì)則仍然保留在阿里云體系內(nèi)。

產(chǎn)品與研究的相對(duì)獨(dú)立,讓通義App與一線用戶(hù)離得更近,也能更準(zhǔn)確地把握用戶(hù)的需求,響應(yīng)市場(chǎng)變化。

未來(lái),通義App會(huì)持續(xù)上線更多千問(wèn)大模型新能力,還會(huì)把阿里多個(gè)先進(jìn)模型能力融入到產(chǎn)品應(yīng)用中,為用戶(hù)提供更加豐富的智能體驗(yàn)。

作為潛在的發(fā)展方向,現(xiàn)有的主智能體或許能在未來(lái)成為智能體分發(fā)入口,根據(jù)用戶(hù)需求智能調(diào)用相關(guān)智能體,進(jìn)一步提升用戶(hù)體驗(yàn)。

結(jié)語(yǔ):通義產(chǎn)品理念重塑,阿里AI To C進(jìn)行時(shí)

本次通義App的全新升級(jí),不僅僅是技術(shù)層面的進(jìn)化,更是產(chǎn)品理念和用戶(hù)體驗(yàn)的全面煥新。

要真正做好一款To C產(chǎn)品,技術(shù)硬實(shí)力僅僅是基礎(chǔ)。如何挖掘、創(chuàng)造用戶(hù)的需求,找到用戶(hù)的高頻使用場(chǎng)景,創(chuàng)造與用戶(hù)的情感連接,是任何一款想要獲得To C成功的產(chǎn)品的必答題。在“Agent元年”推出的新版通義,正探索這些挑戰(zhàn)的最新解題思路。