智東西(公眾號:zhidxcom)
作者 | 駿達 程茜
編輯 | 心緣

全球最大云計算巨頭的AI武器庫,又迎來重磅更新!

智東西拉斯維加斯12月2日報道,今日,在年度云計算產(chǎn)業(yè)盛會AWS re:Invent上,亞馬遜云科技(AWS)連甩一系列重磅AI新品,包括最新AI芯片Trainium4、基于其首款3nm AI芯片的Amazon EC2 Trainium3 UltraServers、第二代自研大模型Amazon Nova 2系列,以及大量Agent開發(fā)利器。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

從AI基礎設施、AI推理平臺、企業(yè)數(shù)據(jù)管理到智能體開發(fā)工具、前沿智能體,通通迎來一大波升級。智東西作為受邀現(xiàn)場參會的媒體,從大會前排帶來超全干貨報道。

Amazon Nova 2系列首發(fā)4款模型:經(jīng)濟高效推理模型Lite,高智能推理模型Pro,語音轉語音的實時擬人對話式AI模型Sonic,以及面向多模態(tài)推理和圖像生成的統(tǒng)一模型Omni。

其中,Nova 2.0 Pro Preview在指令跟隨、智能體工具使用榜單中,性能超過了GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview等前沿模型。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

值得一提的是,Amazon Bedrock新增18款全托管開源模型,其中包括4款國內頂尖模型:阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

其他新增的前沿模型還有谷歌Gemma 3、英偉達Nemotron、OpenAI gpt-oss-safeguard、Mistral AI的Mistral Large 3和Ministral 3等。

總體來看,今日十大重要發(fā)布包括:

1、P6e新實例:采用英偉達GB300 NVL72系統(tǒng)。

2、AWS AI Factories服務:專用客戶定制AI基礎設施,由AWS快速構建和管理。

3、AWS Trainium4自研AI芯片:第四代自研AI芯片,相比上一代帶來6倍的計算性能(FP4)、3倍的FP8性能、4倍的內存帶寬、2倍的內存容量,并可通過NVLink Fusion和UALink實現(xiàn)縱向擴展。

4、Amazon EC2 Trainium3 UltraServers:由AWS首款3nm AI芯片Trainium3提供支持,提供大規(guī)模AI訓練和推理的高性價比,單集群可連接144張Trainium3芯片,算力達362PFLOPS(FP8),帶寬為706TB/s,相較上一代帶來4.4倍計算性能、3.9倍高內存帶寬、5倍的每百萬瓦token數(shù)。

5、Amazon Bedrock平臺:新增18款開源模型,模型數(shù)量過去一年翻倍增長,已擁有超過10萬客戶,其中50多家客戶均使用了超過1萬億個token。

6、Amazon Nova 2系列自研模型:包括Lite、Pro、Sonic、Omni。

7、Amazon Nova Forge服務:支持企業(yè)訪問Nova模型在不同階段的訓練檢查點,并將自有數(shù)據(jù)與亞馬遜的訓練數(shù)據(jù)集混合,構建定制前沿模型。

8、AgentCore開發(fā)工具:Policy in AgentCore(預覽版),使用細粒度權限策略,給agent行動設置明確邊界;AgentCore Evaluations(預覽版),使用評估器,根據(jù)現(xiàn)實世界行為來持續(xù)檢查agent質量。

9、4款前沿智能體:AWS Transform Custom(專為企業(yè)開發(fā)工作流程設計),Kiro autonomous agent(自主開發(fā)復雜編程任務)、AWS Security Agent(預覽版,保護全開發(fā)生命周期安全)、AWS DevOps Agent(預覽版,加快事件響應速度并提高系統(tǒng)可靠性)。

10、7款新實例、6項Amazon S3存儲升級、5項Amazon RDS數(shù)據(jù)庫更新、3項計算與加速優(yōu)化新功能、4項管理與治理新功能。

一、新基建:全新AI芯片Trainium4性能飆6倍,幫企業(yè)定制專屬AI基礎設施

加曼稱,亞馬遜云科技是第一家在云中提供英偉達GPU的公司,其與英偉達合作已超過15年,也是迄今為止運行GPU集群最多的公司。

1、基于英偉達GB300 NVL72打造P6e-GB300

今天,亞馬遜云科技新發(fā)布采用英偉達最新的GB300 NVL72系統(tǒng)的P6e-GB300,相比P6e-GB200,新實例GPU內存容量提升至1.5倍,F(xiàn)P4計算性能(無稀疏)提升至1.5倍。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

英偉達在亞馬遜云科技上運行其生成式AI集群。OpenAI也在亞馬遜云科技上基于EC2 Ultra Servers集群支撐ChatGPT運行及訓練下一個模型,部署了數(shù)十萬張GB200。加曼透露這些處理器很快將會變?yōu)镚B300。

本月初,亞馬遜云科技還與沙特阿拉伯AI創(chuàng)企Humain建立了合作伙伴關系,計劃在沙特的數(shù)據(jù)中心設施中提供、部署和管理至多15萬個AI加速器。

2、AWS AI Factories滿足企業(yè)私有化部署需求

為滿足企業(yè)的私有化部署需求,今天亞馬遜云科技宣布推出AWS AI Factories?;谶@一平臺,客戶能在自己的數(shù)據(jù)中心部署專用AI基礎設施,然后使用亞馬遜云科技的基礎設施和服務。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

3、Amazon EC2 Trainium3 UltraServers

目前,Amazon Bedrock上運行的所有推理工具都由Trainium提供支持,亞馬遜云科技已經(jīng)部署了100萬顆Trainium芯片,Trainium2的量產(chǎn)速度是其曾經(jīng)芯片量產(chǎn)速度的4倍。

加曼稱,亞馬遜云科技的Trainium系列芯片雖然以“訓練”命名,但這些芯片其實也適用于推理用途。目前,亞馬遜云科技上的許多AI推理服務都是在Trainium芯片上運行的,包括Claude的前沿模型。

亞馬遜云科技還圍繞Trainium打造了一個超大規(guī)模系統(tǒng),名為Project Rainier,用于Anthropic下一代Claude模型的訓練。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

這一項目的規(guī)模十分龐大,加曼稱,如果過去大家常說單個數(shù)據(jù)中心已經(jīng)成了新的計算機,Project Rainier則更進一步,讓由多個數(shù)據(jù)中心組成的園區(qū),構成了一個計算機。

Project Rainier將會不斷擴大規(guī)模,最終支持高達30個單體數(shù)據(jù)中心,用掉1.1GW的電力,托管超過50萬個Trainium2芯片。相關計算設備會使用超過100萬個的高速連接器件,通過AWS EFA網(wǎng)絡實現(xiàn)安全、可靠的連接。

亞馬遜云科技于去年發(fā)布了Trainium3芯片,今天,加曼宣布Amazon EC2 Trn3 UltraServers服務器已經(jīng)廣泛可用。與上一代產(chǎn)品相比,該服務器可提供4.4倍的算力和3.9倍的內存帶寬。

值得注意的是,Amazon EC2 Trn3 UltraSevers在能效比上也有提升,每兆瓦所處理的token數(shù)量達前代產(chǎn)品的5倍。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

4、下一代AI芯片Trainium 4

加曼還透露,亞馬遜云科技的下一代AI芯片Trainium 4已深入設計階段。Trainium4預計能提供6倍的FP4性能,4倍的內存帶寬,2倍的內存容量,并支持通過NVLink Fusion和UALink進行擴展。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

二、新模型:阿里、Kimi、MiniMax模型上架,第二代自研模型Nova 2四彈齊發(fā)

亞馬遜云科技Amazon Bedrock推理平臺已經(jīng)擁有超過10萬客戶,使用其處理超1萬億個token的企業(yè)客戶已超過50家。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

亞馬遜云科技一直以來的信條就是“選擇至關重要(Choice Matters)”,這也適用于模型的選擇。加曼稱,亞馬遜云科技認為AI的未來不會僅由1個模型統(tǒng)治,過去1年,Amazon Bedrock上提供的模型數(shù)量已經(jīng)翻倍,DeepSeek、Qwen等中國模型也在支持范圍之內。

Amazon Bedrock還在今天新增了18款全托管開源模型,包括Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2等中國模型。此外,谷歌Gemma、英偉達Nemotron以及全新的Mistral Large 3和Ministral 3(3B、8B和14B版本)等模型也登陸Amazon Bedrock平臺。

亞馬遜云科技還發(fā)布第二代自研模型家族Nova 2系列,推出了4款新模型:Lite、Pro、Sonic和Omni。

Nova 2 Lite是一款快速且經(jīng)濟高效的推理模型,適用于各種類型的工作負載,擁有不錯的指令遵循、工具調用、信息提取、代碼生成等能力。Nova 2 Lite在上述四大領域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等輕量級模型,僅在編程能力上略遜于GPT-5 mini。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

Nova 2 Pro是Nova系列中最智能的推理模型,支持文字、圖像、視頻、語音四種模態(tài)輸入和文本模態(tài)輸出,適用于高度復雜的工作負載,尤其是Agent場景。在兩項Agent基準測試中,其表現(xiàn)已經(jīng)超過了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Nova 2 Sonic則是亞馬遜云科技的下一代語音轉語音模型,支持文本和語音兩個模態(tài)的輸入輸出,能為AI應用提供實時、類人的對話式AI體驗。在語音理解和推理任務上,其性能已經(jīng)超過了GPT Realtime、Gemini 2.5 Flash等。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

Nova 2 Omni是Nova系列的新物種,也是業(yè)界首個支持文本、圖像、視頻和音頻輸入,并支持文本和圖像生成輸出的推理模型。不過,亞馬遜云科技尚未公布其基準測試成績。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

三、新服務:開放Nova模型訓練檢查點,幫企業(yè)訓出專屬前沿模型

加曼談道,AI需要擁有理解公司數(shù)據(jù)的能力,才能真正為公司和客戶帶來巨大價值。

由于數(shù)據(jù)具有獨特性,企業(yè)往往不希望自己的專有數(shù)據(jù)被嵌入到第三方模型中,供他人使用。過去,業(yè)內讓企業(yè)數(shù)據(jù)和模型結合最常用的技術是RAG或向量數(shù)據(jù)庫,但這無法讓模型真正理解數(shù)據(jù)。想要教會模型理解行業(yè)知識,還是需要定制模型。

然而,如果從零開始定制模型是極為昂貴的,企業(yè)沒有足夠數(shù)據(jù)、足夠算力打造出強大的通用智能。

如果在開源模型的基礎上,通過微調、強化學習等方式打造行業(yè)模型,則有可能出現(xiàn)其他領域性能下降的風險。

亞馬遜云科技的解決方案,是Amazon Nova Forge。Nova Forge引入了“開放式訓練模型(Open Training Model)”的概念。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

通過Nova Forge,企業(yè)可以獨家訪問各種Nova模型的訓練檢查點,并在模型訓練的任意階段,將自己的專有數(shù)據(jù)與亞馬遜創(chuàng)建的訓練數(shù)據(jù)集混合。這使得企業(yè)能夠產(chǎn)出一個深度理解企業(yè)信息的模型,同時不會遺忘模型已訓練的核心信息。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

Nova Forge還提供了使用遠程獎勵函數(shù)和強化學習微調的能力,以進一步改進模型,讓企業(yè)可以將真實環(huán)境集成到訓練循環(huán)中。由于基礎模型已經(jīng)理解業(yè)務,這些后訓練技術實際上會變得更加有效。

亞馬遜云科技已經(jīng)和不少企業(yè)試點了Nova Forge服務。索尼便通過Nova Forge,對Nova 2 Lite模型進行了微調,使其適用于索尼自身的業(yè)務和運營。模型在引用一致性和文檔依據(jù)等任務上表現(xiàn)優(yōu)于基準模型,索尼的目標是借此將索尼合規(guī)審查和評估流程的效率提升100倍。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

四、新工具:給Agent開發(fā)設限和打分

今天,亞馬遜云科技宣布Amazon Bedrock AgentCore新增兩項新功能,幫助開發(fā)者快速構建Agent。自AgentCore SDK預覽版發(fā)布以來,其在5個月內下載量已超過200萬次。

此前,亞馬遜推出了為Agent設計的核心工具集AgentCore,包含部署、代碼解釋器、托管環(huán)境等諸多能力。在此基礎上,亞馬遜推出Policy in AgentCore預覽版和AgentCore Evaluation預覽版。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

Policy in AgentCore允許開發(fā)者在AgentCore Gateway工具調用運行前攔截,使用帶有細粒度權限的策略,為Agent行為定義明確的界限,如使用哪些工具、如何使用工具,開發(fā)者也可以通過自然語言創(chuàng)建標準,如“報銷金額大于1000美元時,就阻止退款”等。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

AgentCore Evaluation是一項全托管服務,幫助開發(fā)者持續(xù)監(jiān)控和分析基于真實行為的Agent表現(xiàn)。開發(fā)者可以使用內置評估器來衡量常見的質量維度,如正確性、幫助性、工具選擇準確性、安全性、目標成功率和上下文相關性,還可以創(chuàng)建基于模型的定制評分系統(tǒng),根據(jù)自己選擇的提示和模型進行業(yè)務定制評分。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

所有AgentCore的評估結果都會在亞馬遜統(tǒng)一監(jiān)控平臺CloudWatch被呈現(xiàn)。開發(fā)者還可以設置評估分數(shù)的警報和警報,主動監(jiān)控Agent質量,并在指標超出可接受閾值時作出響應。

亞馬遜此前構建了Amazon QuickAmazon Connect兩個Agent方案。

首先是Amazon Quick,可以幫助員工在幾分鐘內將觀點轉換成行動,指導深度研究和獲得詳盡分析,其會從獲取信息整理出詳細的研究報告;員工還可以創(chuàng)建小型Agent,幫助自己處理日常重復性工作。幾周前,亞馬遜在公司內部發(fā)布了Amazon Quick,目前其已擁有數(shù)十萬用戶。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

其次是Amazon Connect,加曼談到在亞馬遜內部稅務團隊中的一個案例,該團隊創(chuàng)建了一個Agent,幫助其匯聚所有稅務數(shù)據(jù)來源、深入研究稅法政策變化。該Agent的另一個應用場景是客戶服務,可以將AI引入企業(yè)的聯(lián)絡中心。Amazon Connect業(yè)務的年度經(jīng)常性收入已經(jīng)超過10億美元。

五、新Agent:加速開發(fā)、優(yōu)化編程、保護安全、增強可靠

加曼認為,對于試圖快速現(xiàn)代化其應用程序的開發(fā)團隊來說,目前最大的痛點之一就是處理技術債。在美國,技術債務每年給企業(yè)造成總計2.4萬億美元的損失,如今70%的IT預算都被用于維護遺留系統(tǒng)。

此前,亞馬遜云科技已經(jīng)推出了AWS Transform,通過AI實現(xiàn)轉換流程的降本增效。在此基礎上,AWS今日推出了AWS Transform Custom,這一智能體幫助用戶創(chuàng)建自定義代碼轉換智能體,以實現(xiàn)任何代碼、API、框架、運行時或編程語言的翻譯和現(xiàn)代化。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

例如,全球知名ERP軟件公司QAD便是用AWS Transform,將原本需要至少需要兩周才能完成轉換的項目,壓縮至3天。

今年早些時候,亞馬遜云科技發(fā)布了面向專業(yè)開發(fā)者的AI IDE “Kiro”。加曼稱,已經(jīng)有數(shù)十萬開發(fā)者在使用Kiro,有開發(fā)者感嘆,用了Kiro之后,自己在過去5個月內交付的代碼,比過去10年還要多。上周,亞馬遜已經(jīng)把Kiro定為該公司的官方AI開發(fā)環(huán)境。

為了進一步加強開發(fā)流程的自動化程度,亞馬遜云科技發(fā)布了全新的三個前沿智能體,讓Kiro在自主性、大規(guī)??蓴U展和長期運行等領域的表現(xiàn)進一步增強。

Kiro Autonomous Agent是一個與開發(fā)工作流并行運行的自主開發(fā)智能體。它就像團隊的一名額外成員,能獨立處理復雜任務,讓工程師專注于核心創(chuàng)意。開發(fā)者只需指派一個復雜的、目標導向的任務,它能自行規(guī)劃、分解并執(zhí)行所有必要步驟,直到交付可用代碼。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

這一Agent還會越用越聰明,能長期、深度地理解代碼庫、團隊規(guī)范和過往決策,從每一次互動中學習,形成“集體記憶”,并應用所學知識到后續(xù)任務中。

AWS Security Agent則是一個持續(xù)、主動、內置的AI安全專家。它能在設計階段主動審查文檔,確保安全性;在編程過程中掃描代碼漏洞,并直接集成到GitHub PR中,為開發(fā)者提供即時、可操作的修復建議。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

這一Agent還可以將滲透測試自動化,將傳統(tǒng)的、昂貴且周期長的滲透測試,轉變?yōu)榭砂葱鑶印⒖焖偻瓿傻淖詣踊?、持續(xù)驗證過程。

AWS DevOps Agent則將運維工作自動化,能自動診斷并修復問題。當警報觸發(fā)時,DevOps Agent會立即自動響應,診斷問題的根本原因,提供修改意見和修改方案,并交由工程師審查和批準。

六、新實例、新存儲、新數(shù)據(jù)庫、新加速、管理與治理

加曼最后用10分鐘公布了25個新發(fā)布。

亞馬遜殺瘋了!連甩十大重磅發(fā)布,揭Agent大招、自研芯進展

7款新實例:搭載第五代AMD EPYC處理器的X8i Instances,內存增加超50%;搭載第五代AMD EPYC處理器的X8aedz?Instances,計算性能是前一代X2iezn實例的兩倍;搭載第五代AMD EPYC處理器的C8a?Instances,性能提升30%,性價比提升19%;搭載英特爾至強6的C8ine?Instances,實例配置每個vCPU的數(shù)據(jù)包性能可比上一代C6in實例提升2.5倍;搭載第五代AMD EPYC處理器的M8azn?Instances,計算性能是上一代M5zn實例的2倍。

還有兩款采用最新蘋果硬件的新實例:EC2 M3 Ultra?Mac?InstancesEC2 M4 Max?Mac?Instances。

面向開發(fā)者,亞馬遜云科技推出Lambda durable functions(持久函數(shù)),開發(fā)者可以利用內置的自動恢復功能構建長期運行的工作負載。

存儲方面,包括將S3最大對象大小從5TB提高到50TB,增加10倍;亞馬遜S3的數(shù)據(jù)管理功能S3 Batch Operations更新,在200億個對象的規(guī)模下,完成作業(yè)的速度提升10倍;為S3 Tables提供智能分層,節(jié)省80%存儲成本;S3 Tables支持AWS區(qū)域和賬戶間自動復制;擴展Amazon S3接入點,支持Amazon FSx for NetApp ONTAP;用于存儲和查詢向量的對象存儲S3 Vectors全面上市;利用GPU提升向量索引構建效率,速度提升10倍,僅需1/4成本。

計算與加速優(yōu)化新功能,Amazon EMR Serverless提供Amazon EMR on EKS,允許用戶在不預先配置或管理存儲的情況下運行大數(shù)據(jù)工作負載。

Amazon RDS數(shù)據(jù)庫的更新包括:RDS for Oracle和RDS for SQL Server擴展存儲容量RDS for SQL Server的CPU優(yōu)化選項、對SQL Server開發(fā)者版本的支持,以及數(shù)據(jù)庫節(jié)省計劃。

管理與治理相關的新發(fā)布包括:為ECS和EC2新增GuardDuty擴展威脅檢測功能、提供近乎實時分析及風險優(yōu)先級排序功能的Security Hub安全中心CloudWatch統(tǒng)一數(shù)據(jù)管理和分析功能。

結語:Agent開發(fā)已成加速創(chuàng)新的大勢所趨

在主題演講中,加曼多次強調了Agent的重要性:Agent是企業(yè)從AI投資中看到實質性商業(yè)回報的地方。而為Agent系統(tǒng)、應用開發(fā)構建新的模塊,需要性能更強的AI基礎設施、推理平臺、企業(yè)數(shù)據(jù)、構建和部署Agent的工具。

Agent可自主感知業(yè)務需求并依據(jù)需求智能適配業(yè)務流程、動態(tài)調整執(zhí)行策略,高效匹配業(yè)務場景的核心訴求,其已經(jīng)成為釋放AI價值的重要載體。亞馬遜云科技在擴展加速計算產(chǎn)品線的同時,亦在不斷優(yōu)化Agent開發(fā)和部署工具,推出滿足開發(fā)者多元化工作負載需求的新平臺、新工具。

據(jù)加曼回顧,今年第三財季,亞馬遜云科技的年化收入已經(jīng)達到1320億美元,同比增長超20%。

過去一年,亞馬遜云科技增加了3.8GW數(shù)據(jù)中心容量。如今,亞馬遜云科技擁有全球規(guī)模最大、部署最廣泛的AI云基礎設施,全球數(shù)據(jù)中心網(wǎng)絡覆蓋38個地區(qū)、120個可用性區(qū)域,還宣布再增加3個地區(qū)。

亞馬遜云科技已經(jīng)與全球頂尖的大模型公司建立合作,在其平臺陸續(xù)上架全球主流開源模型,下一步的重點,顯然已經(jīng)是如何幫助更多客戶將Agent落地到真實業(yè)務中,產(chǎn)生更廣泛的商業(yè)價值。