智東西(公眾號:zhidxcom)?
作者 | 李水青
編輯 | 漠影

2025年的大模型產(chǎn)業(yè)正在經(jīng)歷一場靜默的分化。一邊,少數(shù)明星模型的參數(shù)競賽依然激烈;另一邊,一個更根本的轉(zhuǎn)變已在基礎(chǔ)設施層悄然發(fā)生:

AI的價值實現(xiàn)路徑,正從“模型能力展示”轉(zhuǎn)向“Agent實際部署”。

亞馬遜云科技CEO馬特·加曼(Matt Garman)在今日凌晨舉辦的2025 re:Invent主題演講中直言:“Agent的出現(xiàn)使我們在AI軌跡上發(fā)生了變化——從一個技術(shù)奇跡的時代,轉(zhuǎn)向真正獲得價值的時代?!?/p>

他的判斷基于一組反差強烈的數(shù)據(jù):一方面,生成式AI引發(fā)全球狂歡,Amazon Bedrock已服務超過10萬家企業(yè),其中50多家客戶處理了超1萬億tokens;另一方面,許多企業(yè)仍未看到AI投資帶來相匹配的業(yè)務回報。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲Garman在講解Amazon Bedrock落地情況

Agent是企業(yè)從AI投資中獲得實質(zhì)性商業(yè)回報的地方?!盙arman揭示了一個關(guān)鍵轉(zhuǎn)折點,“我相信,在未來每個公司內(nèi)部和每個可以想象的領(lǐng)域都會有數(shù)十億的Agent。”

一場重新定義AI價值實現(xiàn)的競賽已經(jīng)打響。在亞馬遜云科技2025 re:Invent的舞臺上,AI芯片性能飆漲600%,構(gòu)建AI Agent的四大技術(shù)支柱同步升級,Agent部署的全棧戰(zhàn)爭已經(jīng)升級……到底什么才是企業(yè)抓住這場變革紅利的抓手?

云計算一哥的一招一式,都給了我們解答Agent變革時代之問的絕佳參考。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲Garman在講解Agent部署的所需要素

一、重新定義AI Infra:自研芯片與「AI工廠」的雙重革命

算力競爭已進入云巨頭自主可控、性能狂飆的階段。亞馬遜云科技在2025 re:Invent上亮出了其最尖端的武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服務器正式全面推出,而下一代Trainium 4芯片的性能參數(shù)更令人震撼。

“如果看看今天在Amazon Bedrock上運行的所有推理,大多數(shù)實際上已經(jīng)由Trainium驅(qū)動了?!盙arman透露。更令人印象深刻的是,亞馬遜云科技已部署超過100萬顆自研Trainium芯片,而上一代Trainium 2的量產(chǎn)速度是其此前芯片的4倍

最新性能數(shù)據(jù)揭示了這場算力革命的緊迫程度:基于首款云端3nm AI芯片Trainium 3,亞馬遜云科技最新推出的Amazon EC2 Trainium 3 UltraServers服務器,最極致的配置將144顆Trainium 3芯片互連,提供362PFLOPS(FP8)算力和超過700TB/秒的總帶寬。

該服務器提供相比前代Trainium 2的4.4倍的計算性能、3.9倍的內(nèi)存帶寬提升,而能效比指標——每兆瓦電力處理的AI token數(shù)量——提升了5倍。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲Amazon EC2 Trainium 3 UltraServers服務器性能情況

更值得一提的是,對于下一代Trainium 4,亞馬遜云科技承諾了更大幅度的飛躍:預計提供6倍的FP4性能,4倍的內(nèi)存帶寬,2倍的內(nèi)存容量,并支持通過NVLink Fusion和UALink進行擴展,專為全球最大的模型訓練需求而生。

但芯片性能只是故事的一半。亞馬遜云科技同時推出了更具戰(zhàn)略意義的Amazon AI Factories(AI工廠)服務——允許企業(yè)在自己的數(shù)據(jù)中心部署專用AI基礎(chǔ)設施,同時享受亞馬遜云科技的全套服務和管理。

這一舉措直擊企業(yè)生成式AI出海全球化部署中的核心痛點:數(shù)據(jù)主權(quán)、合規(guī)要求與性能需求的平衡。企業(yè)可以在本地維護數(shù)據(jù)控制權(quán),充分利用既有空間與電力資源;同時獲得與公有云相同的先進AI能力,無縫接入從Trainium、英偉達GPU到SageMaker和Bedrock的全棧AI服務。

二、模型生態(tài)的多元主義:自研模型超GPT-5.1,中國模型占1/4席位

與追逐“萬能模型”的潮流相反,亞馬遜云科技選擇了多元化的模型戰(zhàn)略。“我們從不相信會有一個模型統(tǒng)治一切?!盙arman明確表示,“相反,會出現(xiàn)很多偉大的模型?!?/p>

這一理念在Amazon Bedrock平臺上得到充分體現(xiàn)。過去一年,Amazon Bedrock平臺提供的模型數(shù)量翻倍,2025 re:Invent上新增的18款全托管開源模型也包含4款中國頂尖模型,中國模型占1/4席位,包括千問、DeepSeek、Kimi及MiniMax多家模型已上線Amazon Bedrock平臺。

對中國企業(yè)而言,這意味著在出海和全球化過程中,可以獲得更貼近本土技術(shù)特點的生成式AI支持。對全球用戶而言,這代表了更廣泛的技術(shù)選擇。

亞馬遜云科技最新推出的自研的Amazon Nova 2系列模型則展示了另一種可能。四款新型號覆蓋了從輕量推理到復雜多模態(tài)的全場景需求:

Amazon Nova 2 Lite:是一款快速且經(jīng)濟高效的推理模型,擁有不錯的指令遵循、工具調(diào)用、信息提取、代碼生成等能力,在上述四大領(lǐng)域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等輕量級模型,僅在編程能力上略遜于GPT-5 mini。

Amazon Nova 2 Pro:是Nova系列中最智能的推理模型,支持文字、圖像、視頻、語音四種模態(tài)輸入和文本模態(tài)輸出,適用于高度復雜的工作負載,尤其是Agent場景。在兩項Agent基準測試中,其表現(xiàn)已經(jīng)超過了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Amazon Nova 2 Sonic:下一代語音轉(zhuǎn)語音模型,能為AI應用提供實時、類人的對話式AI體驗。在語音理解和推理任務上,其性能已經(jīng)超過了GPT Realtime、Gemini 2.5 Flash等。

Amazon Nova 2 Omni:是業(yè)界首個支持文本、圖像、視頻和音頻輸入,并支持文本和圖像生成輸出的推理模型。不過,亞馬遜云科技尚未公布其基準測試成績。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲Amazon Nova 2 Omni發(fā)布現(xiàn)場

可以看到,特別是在Agent關(guān)鍵能力的基準測試中,Amazon Nova 2 Pro展現(xiàn)了令人印象深刻的性能,這直接回應了企業(yè)對于生成式AI在實際業(yè)務場景中可靠性的關(guān)切。

尤其是在企業(yè)出海的場景中,選擇至關(guān)重要(Choice Matters)。AI的未來不會僅由1個模型統(tǒng)治,過去一年Amazon Bedrock上提供的模型數(shù)量已經(jīng)翻倍,DeepSeek、Qwen等中國模型也在支持范圍之內(nèi),這位中國企業(yè)的出海業(yè)務部署Agent提供了豐富選擇。

三、數(shù)據(jù)與模型深度融合:開放訓練模型打破“RAG局限”

“你的數(shù)據(jù)是獨一無二的,這就是你與競爭對手的區(qū)別?!?/strong>Garman反復強調(diào)這一觀點。然而,傳統(tǒng)的數(shù)據(jù)與模型結(jié)合技術(shù)如RAG(檢索增強生成)只能幫助模型更有效地導航數(shù)據(jù),無法讓模型真正“理解”企業(yè)的深層次領(lǐng)域知識,這也成為Agent價值釋放的“攔路虎”。

亞馬遜云科技的革命性的解決方案是:Amazon Nova Forge服務,該服務引入了“開放式訓練模型(Open Training Model)”的概念。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲亞馬遜云科技推出Amazon Nova Forge服務

通過這項服務,企業(yè)可以在模型訓練的任意階段,將自己的專有數(shù)據(jù)與亞馬遜的訓練數(shù)據(jù)集混合,創(chuàng)建名為“Novellas”的定制模型。這一方法解決了傳統(tǒng)微調(diào)中的核心矛盾——在教授模型新領(lǐng)域知識的同時,避免其“遺忘”已掌握的核心推理能力。

Amazon Nova Forge還提供了使用遠程獎勵函數(shù)和強化學習微調(diào)的能力,以進一步改進模型,讓企業(yè)可以將真實環(huán)境集成到訓練循環(huán)中。由于基礎(chǔ)模型已經(jīng)理解業(yè)務,這些后訓練技術(shù)實際上會變得更加有效。

索尼是這一服務的早期采用者。通過對Amazon Nova 2 Lite模型進行微調(diào),索尼創(chuàng)建了深度理解自身業(yè)務和運營的定制模型,在引用一致性和文檔依據(jù)等任務上表現(xiàn)優(yōu)于基準模型,目標是將合規(guī)審查和評估流程的效率提升100倍。

可以看到,對于尋求通過生成式AI實現(xiàn)差異化競爭優(yōu)勢的企業(yè)而言,這一能力至關(guān)重要。它意味著企業(yè)可以構(gòu)建真正理解自身業(yè)務邏輯、流程和知識的Agent,而非僅僅使用通用的AI工具。

四、回歸一件事:沒有魔法,只有可部署的Agent

2025 re:Invent上最引人注目的發(fā)布,或許是三類“前沿Agent”的推出。這些Agent代表了AI能力的一次階躍式提升:自主、大規(guī)??蓴U展且能長期運行,也給廣大開發(fā)者打了個樣。

三類前沿Agent展示了AI重塑軟件開發(fā)和運營的潛力:

Kiro autonomous agent徹底改變了開發(fā)范式。它與市面上常見的代碼補全助手不同,而是能夠自主處理復雜任務,如升級關(guān)鍵庫時,自動識別所有受影響服務,分析使用模式,按規(guī)范更新代碼,運行完整測試,并一次性創(chuàng)建所有合并就緒的拉取請求。亞馬遜內(nèi)部的一個案例顯示,原本需要30名開發(fā)者18個月完成的重架構(gòu)項目,使用Kiro后僅需6人76天完成。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲亞馬遜云科技推出Kiro autonomous agent

Amazon Security Agent是一個持續(xù)、主動、內(nèi)置的AI安全專家。將安全實踐從“事后檢查”變?yōu)椤俺掷m(xù)嵌入”。它能在設計階段審查文檔,編碼過程中掃描漏洞,并將滲透測試從昂貴的一次性活動轉(zhuǎn)變?yōu)榘葱璧某掷m(xù)驗證過程,從而確保安全性。

Amazon DevOps Agent重新定義了運維響應機制。當警報觸發(fā)時,它能立即診斷根本原因,提供修復方案,使工程師能夠?qū)W⒂跊Q策而非排查。這一能力對于保障全球化業(yè)務的連續(xù)性至關(guān)重要。

Agent開發(fā)的基礎(chǔ)設施同樣得到加強。Amazon Bedrock AgentCore自SDK預覽版發(fā)布以來,5個月內(nèi)下載量超過200萬次。新增的兩項功能直接應對企業(yè)部署Agent的核心關(guān)切點:

Amazon AgentCore Policy(預覽版):為Agent與企業(yè)工具及數(shù)據(jù)的交互提供實時確定性控制。

它允許開發(fā)者在Amazon AgentCore Gateway工具調(diào)用運行前攔截,使用帶有細粒度權(quán)限的策略,為Agent行為定義明確的界限,如使用哪些工具、如何使用工具,開發(fā)者也可以通過自然語言創(chuàng)建標準,如“報銷金額大于1000美元時,就阻止退款”等。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲亞馬遜云科技推出Amazon AgentCore Policy

Amazon AgentCore Evaluations(預覽版):根據(jù)實際行為持續(xù)檢查Agent質(zhì)量。

這是一項全托管服務,開發(fā)者可以使用內(nèi)置評估器來衡量常見的質(zhì)量維度,如正確性、幫助性、工具選擇準確性、安全性、目標成功率和上下文相關(guān)性,還可以創(chuàng)建基于模型的定制評分系統(tǒng),根據(jù)自己選擇的提示和模型進行業(yè)務定制評分。

數(shù)十億AI員工上崗倒計時!云計算一哥“沒有魔法,只有真能解決問題的Agent”
▲亞馬遜云科技推出Amazon AgentCore Evaluations

除了上述更新,Garman還在最后10分鐘公布了25個新發(fā)布,包括搭載第五代AMD EPYC處理器的X8i Instances、搭載英特爾至強6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆蓋計算、存儲、數(shù)據(jù)庫、大數(shù)據(jù)、安全等多個領(lǐng)域的新品,這些都為企業(yè)Agent部署提供了穩(wěn)定堅實的支撐。

結(jié)語:AI進入Agent時間,價值落地之戰(zhàn)打響

當AI進入Agent時間,2025 re:Invent的舞臺展示了亞馬遜云科技對Agent時代的全面布局,這不再是一場單點技術(shù)的競賽,而是全棧能力的比拼,其正在構(gòu)建一個支持Agent從實驗到落地生產(chǎn)的完整平臺。

當下,每個產(chǎn)業(yè)人士都在見證生成式AI從技術(shù)演示走向商業(yè)價值,價值落地之戰(zhàn)已打響。云巨頭的這種“全家桶”式的全棧能力,或許正是企業(yè)將AI投資轉(zhuǎn)化為實際業(yè)務回報所需要的基礎(chǔ)設施。