智東西(公眾號:zhidxcom)
作者 |? 陳駿達(dá)
編輯 |? 漠影

當(dāng)大模型在數(shù)字世界掀起生產(chǎn)力革命后,它的下一個主戰(zhàn)場在哪里?阿里給出的答案是物理世界

今天,阿里AI助手千問“上車”,首站接入紅旗汽車智能座艙。這是繼AI眼鏡之后,千問進(jìn)一步拓展至更高復(fù)雜度的車載場景,邁向全場景AI助手的關(guān)鍵節(jié)點。

不同于其它車載助手的一問一答,千問讓用戶動動嘴就能完成多途經(jīng)點的路徑規(guī)劃、機酒預(yù)定等復(fù)雜任務(wù),不止能導(dǎo)航,還能真正“辦事”。

這一進(jìn)展的意義在于,通用AI助手首次以“完整形態(tài)”進(jìn)入車載場景,而非只是簡單的對話、控制等單點能力輸出。憑借對復(fù)雜意圖的理解與執(zhí)行,車載AI助手正從“屏幕內(nèi)服務(wù)”,走向“物理世界執(zhí)行”。

一、大模型上車后成“座艙花瓶”,千問如何打破僵局?

汽車,其實是“場景智能+AI助理”最理想的物理載體之一。駕駛時雙手受限、注意力高度集中的特點,使得智能語音交互成為剛需。而出行本身又是一場涉及動態(tài)路況規(guī)劃與服務(wù)預(yù)訂的復(fù)雜決策過程,對AI的邏輯推理與即時執(zhí)行能力提出了極高的要求。

然而,當(dāng)前許多車企雖然紛紛引入大模型,實際體驗中仍存在明顯短板。大部分車載大模型并未真正融入真實的出行場景。它們可以幫你開關(guān)車窗、播放音樂,卻無法真正規(guī)劃復(fù)雜路線或完成辦事需求,導(dǎo)致AI在車內(nèi)更像一個功能受限的“花瓶”,而非真正的出行助手。

特斯拉接入Grok的案例,為通用AI助手在車載場景中的實際價值提供了參考。它打破了死板的預(yù)設(shè)指令庫,能夠處理諸如“規(guī)劃一條路況好、沿途帶充電樁的滑雪路線”等復(fù)雜意圖,真正體驗過的用戶,普遍感受到了更強的“交付感”。

千問上車:統(tǒng)一智能中樞隱現(xiàn)

▲接入特斯拉的Grok

千問上車后,有望將這種體驗帶給更多中國用戶。例如,有一個非常典型的用車場景:“Hi千問,我們要去亮馬河,找個離上船碼頭最近的咖啡廳坐一會兒,然后要去三里屯太古里,但我不想排隊進(jìn)地庫,你幫我導(dǎo)航到附近的停車場,最后導(dǎo)航到北京機場三號航站樓。

千問上車:統(tǒng)一智能中樞隱現(xiàn)

這樣的路徑規(guī)劃,即便交給駕駛員自己處理,也需要花費不少時間。它實際上涵蓋了多點路徑導(dǎo)航、特定場景服務(wù)與個性化偏好約束三個維度。AI 不僅要精準(zhǔn)識別自然語言中的多個模糊意圖,還必須完成復(fù)雜的任務(wù)拆解與編排。

千問能成功解析復(fù)雜需求,依托云端多智能體協(xié)同完成決策,快速搜索出合適的停車場、咖啡廳等,最終規(guī)劃出完整的路徑。

千問上車:統(tǒng)一智能中樞隱現(xiàn)

其執(zhí)行效果不僅滿足了用戶需求,效率也足夠高,充分契合了用車場景對時效性的嚴(yán)苛要求。

千問上車:統(tǒng)一智能中樞隱現(xiàn)

除了導(dǎo)航之外,千問AI助手上車后,還將進(jìn)一步釋放“AI辦事”的能力,真正讓車載智能不僅局限于聽懂指令,還要辦成事情。

千問最近已在不斷擴展票務(wù)預(yù)訂、酒店預(yù)約、即時零售等生活服務(wù)能力。未來,用戶或許可以在自駕游的路上,動動嘴完成酒店、景點的預(yù)約,讓千問串聯(lián)起信息檢索、決策推薦和交易閉環(huán)的全流程操作。

據(jù)悉,千問的辦事能力目前仍在快速擴展中,未來將與更多本地生活、出行服務(wù)打通,讓汽車真正成為可對話、可執(zhí)行的智能出行伴侶。

二、AI跳出數(shù)字世界,從眼鏡到座艙到全面接管

“AI最大的想象力不在手機屏幕,而在于接管數(shù)字世界,改變物理世界。”此前,阿里CEO吳泳銘曾在公開場合做出如上判斷。千問上車,正是這一理念的生動實踐。

在更廣泛的智能硬件領(lǐng)域,千問也正以更加多元的形態(tài)走進(jìn)用戶的日常生活。在這些實踐中,千問AI眼鏡作為阿里對下一代交互終端的重要探索,正展現(xiàn)出強大的場景穿透力。

在核心功能上,千問AI眼鏡融合了多模態(tài)理解與實時交互能力高清拍攝讓用戶能夠即時記錄生活瞬間;AI翻譯可支持多語種實時轉(zhuǎn)譯,打破跨語言溝通障礙;會議記錄功能能夠自動生成摘要,大幅提升辦公效率;識圖識物則讓信息獲取更加自然無感。

千問AI眼鏡還將上線“AI辦事”等功能,進(jìn)一步拓展AI在生活服務(wù)中的應(yīng)用場景,真正實現(xiàn)“所見即所得,所說即所辦”。

千問上車:統(tǒng)一智能中樞隱現(xiàn)

▲千問AI眼鏡

今年內(nèi),千問還將陸續(xù)推出AI指環(huán)、AI耳機等一系列智能硬件產(chǎn)品,進(jìn)一步拓展AI融入物理世界的觸點。

雖然阿里尚未披露這些產(chǎn)品的更多細(xì)節(jié),但可以想見,AI指環(huán)極簡的佩戴形態(tài)和手勢控制等新型的快捷交互能力,有望讓用戶在無屏狀態(tài)下也能高效調(diào)用千問的服務(wù)。

sAI耳機則有望與實時翻譯、智能錄音與智能播報等功能集成,成為通勤、運動、辦公場景下的隨身助手。

這些智能硬件產(chǎn)品雖形態(tài)各異,但共享千問這一智能中樞,為其交互體驗提供了保障。

三、一手抓“AI辦事”一手抓“硬件入口”,一個全場景閉環(huán)正在形成

上述案例,只是千問進(jìn)化的一個縮影。縱觀其近期布局,我們看到了兩條清晰的主線,正在并行推進(jìn)。

一是構(gòu)建“AI辦事”服務(wù)網(wǎng)絡(luò),打通訂票、預(yù)約、支付等生活服務(wù)閉環(huán),讓AI真正具備需求理解到交易交付的完整能力。當(dāng)這些能力補齊后,AI就成為了能夠直接調(diào)動真實世界服務(wù)資源的“執(zhí)行者”。

二是嵌入多元的硬件形態(tài),汽車座艙、AI眼鏡、AI指環(huán)、AI耳機等多種硬件,讓智能助理突破屏幕限制,形成從穿戴到車載、從固定到移動的全場景覆蓋,嵌入用戶全天候的真實場景。

千問上車:統(tǒng)一智能中樞隱現(xiàn)

這意味著AI不再被鎖在手機應(yīng)用里,而是以最自然的形態(tài)融入汽車、眼鏡等終端,讓用戶隨時隨地都能獲得即時、連貫、無感的智能服務(wù)。

支撐這一布局的,是阿里在模型能力與服務(wù)生態(tài)上的積累。

在模型層面,千問系列大模型持續(xù)迭代,在多模態(tài)理解、復(fù)雜推理與任務(wù)編排上保持在行業(yè)第一梯隊,為“聽懂”與“辦成”提供了底層技術(shù)保障。

在服務(wù)生態(tài)層面,阿里生態(tài)中擁有覆蓋支付、出行、購物、本地生活等領(lǐng)域的完整服務(wù)網(wǎng)絡(luò)——支付寶的支付閉環(huán)、高德的地圖與出行能力、飛豬的旅行服務(wù)、淘寶閃購的本地生活供給。

這些生態(tài)資源為千問“AI辦事”提供了天然的執(zhí)行接口,讓智能助理不僅能夠理解用戶意圖,更能調(diào)動真實世界中的服務(wù)資源,完成由“想法”到“交付”的最后一公里。

歸根結(jié)底,千問的進(jìn)化始終圍繞一個核心——人。底層大模型的能力沉淀、手機APP與PC端的日常入口、服務(wù)體系的全面打通、汽車座艙與各類AI硬件的形態(tài)拓展,千問正在編織一張以人為中心、覆蓋全場景的服務(wù)網(wǎng)絡(luò)。

在這張網(wǎng)絡(luò)中,用戶不再需要關(guān)心服務(wù)藏在哪個應(yīng)用里、功能嵌在哪個設(shè)備上,只需表達(dá)需求,千問便會調(diào)動所有資源,在合適的時間、合適的設(shè)備上,交付合適的結(jié)果。

從數(shù)字世界到物理世界,從單一場景到全時全域,一個以AI為中樞、以人為中心的服務(wù)閉環(huán),已經(jīng)拉開大幕。

結(jié)語:千問,數(shù)字與物理世界的新樞紐?

展望未來,當(dāng)千問以統(tǒng)一的智能中樞貫穿手機、汽車、眼鏡、指環(huán)、耳機等多元終端后,一個真正的超級AI助手將浮出水面。用戶在車上規(guī)劃好的行程,下車后可由眼鏡接力導(dǎo)航,抵達(dá)目的地前指環(huán)已悄然完成支付——跨終端、跨場景的服務(wù)流轉(zhuǎn),有望成為千問的常態(tài)能力。

當(dāng)千問不再依附于某個設(shè)備或場景,它便不再是單一功能的智能助手,而是集下一代超級AI應(yīng)用、超級入口與超級助手于一體的產(chǎn)品,構(gòu)筑起連接數(shù)字與物理世界的樞紐。