在线观看综合欧美一区二区,超碰91在线资源站,在线观看黄色片免费网站

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

綁定手機號

確認綁定

李水青

智東西副主編，長期聚焦人工智能、云計算、智慧城市、產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型領(lǐng)域報道。重點是選題策劃和專訪~微信：lbq806467906 備注來意。

標簽

iPhone 谷歌 IDx 百度智東西 360 華為騰訊小米三星高通大眾通用 5G 微軟蘋果英特爾

數(shù)十億AI員工上崗倒計時！云計算一哥“沒有魔法，只有真能解決問題的Agent”

智東西（公眾號：zhidxcom）?
作者 | 李水青
編輯 | 漠影

2025年的大模型產(chǎn)業(yè)正在經(jīng)歷一場靜默的分化。一邊，少數(shù)明星模型的參數(shù)競賽依然激烈；另一邊，一個更根本的轉(zhuǎn)變已在基礎(chǔ)設施層悄然發(fā)生：

AI的價值實現(xiàn)路徑，正從“模型能力展示”轉(zhuǎn)向“Agent實際部署”。

亞馬遜云科技CEO馬特·加曼（Matt Garman）在今日凌晨舉辦的2025 re:Invent主題演講中直言：“Agent的出現(xiàn)使我們在AI軌跡上發(fā)生了變化——從一個技術(shù)奇跡的時代，轉(zhuǎn)向真正獲得價值的時代?！?/p>

他的判斷基于一組反差強烈的數(shù)據(jù)：一方面，生成式AI引發(fā)全球狂歡，Amazon Bedrock已服務超過10萬家企業(yè)，其中50多家客戶處理了超1萬億tokens；另一方面，許多企業(yè)仍未看到AI投資帶來相匹配的業(yè)務回報。

數(shù)十億AI員工上崗倒計時！云計算一哥“沒有魔法，只有真能解決問題的Agent”
▲Garman在講解Amazon Bedrock落地情況

“Agent是企業(yè)從AI投資中獲得實質(zhì)性商業(yè)回報的地方?！盙arman揭示了一個關(guān)鍵轉(zhuǎn)折點，“我相信，在未來每個公司內(nèi)部和每個可以想象的領(lǐng)域都會有數(shù)十億的Agent。”

一場重新定義AI價值實現(xiàn)的競賽已經(jīng)打響。在亞馬遜云科技2025 re:Invent的舞臺上，AI芯片性能飆漲600%，構(gòu)建AI Agent的四大技術(shù)支柱同步升級，Agent部署的全棧戰(zhàn)爭已經(jīng)升級……到底什么才是企業(yè)抓住這場變革紅利的抓手？

云計算一哥的一招一式，都給了我們解答Agent變革時代之問的絕佳參考。

數(shù)十億AI員工上崗倒計時！云計算一哥“沒有魔法，只有真能解決問題的Agent”
▲Garman在講解Agent部署的所需要素

一、重新定義AI Infra：自研芯片與「AI工廠」的雙重革命

算力競爭已進入云巨頭自主可控、性能狂飆的階段。亞馬遜云科技在2025 re:Invent上亮出了其最尖端的武器：基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服務器正式全面推出，而下一代Trainium 4芯片的性能參數(shù)更令人震撼。

“如果看看今天在Amazon Bedrock上運行的所有推理，大多數(shù)實際上已經(jīng)由Trainium驅(qū)動了?！盙arman透露。更令人印象深刻的是，亞馬遜云科技已部署超過100萬顆自研Trainium芯片，而上一代Trainium 2的量產(chǎn)速度是其此前芯片的4倍。

最新性能數(shù)據(jù)揭示了這場算力革命的緊迫程度：基于首款云端3nm AI芯片Trainium 3，亞馬遜云科技最新推出的Amazon EC2 Trainium 3 UltraServers服務器，最極致的配置將144顆Trainium 3芯片互連，提供362PFLOPS（FP8）算力和超過700TB/秒的總帶寬。

該服務器提供相比前代Trainium 2的4.4倍的計算性能、3.9倍的內(nèi)存帶寬提升，而能效比指標——每兆瓦電力處理的AI token數(shù)量——提升了5倍。

數(shù)十億AI員工上崗倒計時！云計算一哥“沒有魔法，只有真能解決問題的Agent”
▲Amazon EC2 Trainium 3 UltraServers服務器性能情況

更值得一提的是，對于下一代Trainium 4，亞馬遜云科技承諾了更大幅度的飛躍：預計提供6倍的FP4性能，4倍的內(nèi)存帶寬，2倍的內(nèi)存容量，并支持通過NVLink Fusion和UALink進行擴展，專為全球最大的模型訓練需求而生。

但芯片性能只是故事的一半。亞馬遜云科技同時推出了更具戰(zhàn)略意義的Amazon AI Factories（AI工廠）服務——允許企業(yè)在自己的數(shù)據(jù)中心部署專用AI基礎(chǔ)設施，同時享受亞馬遜云科技的全套服務和管理。

這一舉措直擊企業(yè)生成式AI出海和全球化部署中的核心痛點：數(shù)據(jù)主權(quán)、合規(guī)要求與性能需求的平衡。企業(yè)可以在本地維護數(shù)據(jù)控制權(quán)，充分利用既有空間與電力資源；同時獲得與公有云相同的先進AI能力，無縫接入從Trainium、英偉達GPU到SageMaker和Bedrock的全棧AI服務。

二、模型生態(tài)的多元主義：自研模型超GPT-5.1，中國模型占1/4席位

與追逐“萬能模型”的潮流相反，亞馬遜云科技選擇了多元化的模型戰(zhàn)略。“我們從不相信會有一個模型統(tǒng)治一切?！盙arman明確表示，“相反，會出現(xiàn)很多偉大的模型?！?/p>

這一理念在Amazon Bedrock平臺上得到充分體現(xiàn)。過去一年，Amazon Bedrock平臺提供的模型數(shù)量翻倍，2025 re:Invent上新增的18款全托管開源模型也包含4款中國頂尖模型，中國模型占1/4席位，包括千問、DeepSeek、Kimi及MiniMax多家模型已上線Amazon Bedrock平臺。

對中國企業(yè)而言，這意味著在出海和全球化過程中，可以獲得更貼近本土技術(shù)特點的生成式AI支持。對全球用戶而言，這代表了更廣泛的技術(shù)選擇。

亞馬遜云科技最新推出的自研的Amazon Nova 2系列模型則展示了另一種可能。四款新型號覆蓋了從輕量推理到復雜多模態(tài)的全場景需求：

Amazon Nova 2 Lite：是一款快速且經(jīng)濟高效的推理模型，擁有不錯的指令遵循、工具調(diào)用、信息提取、代碼生成等能力，在上述四大領(lǐng)域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等輕量級模型，僅在編程能力上略遜于GPT-5 mini。

Amazon Nova 2 Pro：是Nova系列中最智能的推理模型，支持文字、圖像、視頻、語音四種模態(tài)輸入和文本模態(tài)輸出，適用于高度復雜的工作負載，尤其是Agent場景。在兩項Agent基準測試中，其表現(xiàn)已經(jīng)超過了GPT-5.1（high）、Gemini 3 Pro Preview（high）等前沿模型。

Amazon Nova 2 Sonic：下一代語音轉(zhuǎn)語音模型，能為AI應用提供實時、類人的對話式AI體驗。在語音理解和推理任務上，其性能已經(jīng)超過了GPT Realtime、Gemini 2.5 Flash等。

Amazon Nova 2 Omni：是業(yè)界首個支持文本、圖像、視頻和音頻輸入，并支持文本和圖像生成輸出的推理模型。不過，亞馬遜云科技尚未公布其基準測試成績。

數(shù)十億AI員工上崗倒計時！云計算一哥“沒有魔法，只有真能解決問題的Agent”
▲Amazon Nova 2 Omni發(fā)布現(xiàn)場

可以看到，特別是在Agent關(guān)鍵能力的基準測試中，Amazon Nova 2 Pro展現(xiàn)了令人印象深刻的性能，這直接回應了企業(yè)對于生成式AI在實際業(yè)務場景中可靠性的關(guān)切。

尤其是在企業(yè)出海的場景中，選擇至關(guān)重要（Choice Matters）。AI的未來不會僅由1個模型統(tǒng)治，過去一年Amazon Bedrock上提供的模型數(shù)量已經(jīng)翻倍，DeepSeek、Qwen等中國模型也在支持范圍之內(nèi)，這位中國企業(yè)的出海業(yè)務部署Agent提供了豐富選擇。

三、數(shù)據(jù)與模型深度融合：開放訓練模型打破“RAG局限”

“你的數(shù)據(jù)是獨一無二的，這就是你與競爭對手的區(qū)別?！?/strong>Garman反復強調(diào)這一觀點。然而，傳統(tǒng)的數(shù)據(jù)與模型結(jié)合技術(shù)如RAG（檢索增強生成）只能幫助模型更有效地導航數(shù)據(jù)，無法讓模型真正“理解”企業(yè)的深層次領(lǐng)域知識，這也成為Agent價值釋放的“攔路虎”。

亞馬遜云科技的革命性的解決方案是：Amazon Nova Forge服務，該服務引入了“開放式訓練模型（Open Training Model）”的概念。

▲亞馬遜云科技推出Amazon Nova Forge服務

通過這項服務，企業(yè)可以在模型訓練的任意階段，將自己的專有數(shù)據(jù)與亞馬遜的訓練數(shù)據(jù)集混合，創(chuàng)建名為“Novellas”的定制模型。這一方法解決了傳統(tǒng)微調(diào)中的核心矛盾——在教授模型新領(lǐng)域知識的同時，避免其“遺忘”已掌握的核心推理能力。

Amazon Nova Forge還提供了使用遠程獎勵函數(shù)和強化學習微調(diào)的能力，以進一步改進模型，讓企業(yè)可以將真實環(huán)境集成到訓練循環(huán)中。由于基礎(chǔ)模型已經(jīng)理解業(yè)務，這些后訓練技術(shù)實際上會變得更加有效。

索尼是這一服務的早期采用者。通過對Amazon Nova 2 Lite模型進行微調(diào)，索尼創(chuàng)建了深度理解自身業(yè)務和運營的定制模型，在引用一致性和文檔依據(jù)等任務上表現(xiàn)優(yōu)于基準模型，目標是將合規(guī)審查和評估流程的效率提升100倍。

可以看到，對于尋求通過生成式AI實現(xiàn)差異化競爭優(yōu)勢的企業(yè)而言，這一能力至關(guān)重要。它意味著企業(yè)可以構(gòu)建真正理解自身業(yè)務邏輯、流程和知識的Agent，而非僅僅使用通用的AI工具。

四、回歸一件事：沒有魔法，只有可部署的Agent

2025 re:Invent上最引人注目的發(fā)布，或許是三類“前沿Agent”的推出。這些Agent代表了AI能力的一次階躍式提升：自主、大規(guī)?？蓴U展且能長期運行，也給廣大開發(fā)者打了個樣。

三類前沿Agent展示了AI重塑軟件開發(fā)和運營的潛力：

Kiro autonomous agent徹底改變了開發(fā)范式。它與市面上常見的代碼補全助手不同，而是能夠自主處理復雜任務，如升級關(guān)鍵庫時，自動識別所有受影響服務，分析使用模式，按規(guī)范更新代碼，運行完整測試，并一次性創(chuàng)建所有合并就緒的拉取請求。亞馬遜內(nèi)部的一個案例顯示，原本需要30名開發(fā)者18個月完成的重架構(gòu)項目，使用Kiro后僅需6人76天完成。

▲亞馬遜云科技推出Kiro autonomous agent

Amazon Security Agent是一個持續(xù)、主動、內(nèi)置的AI安全專家。將安全實踐從“事后檢查”變?yōu)椤俺掷m(xù)嵌入”。它能在設計階段審查文檔，編碼過程中掃描漏洞，并將滲透測試從昂貴的一次性活動轉(zhuǎn)變?yōu)榘葱璧某掷m(xù)驗證過程，從而確保安全性。

Amazon DevOps Agent重新定義了運維響應機制。當警報觸發(fā)時，它能立即診斷根本原因，提供修復方案，使工程師能夠?qū)Ｗ⒂跊Q策而非排查。這一能力對于保障全球化業(yè)務的連續(xù)性至關(guān)重要。

Agent開發(fā)的基礎(chǔ)設施同樣得到加強。Amazon Bedrock AgentCore自SDK預覽版發(fā)布以來，5個月內(nèi)下載量超過200萬次。新增的兩項功能直接應對企業(yè)部署Agent的核心關(guān)切點：

Amazon AgentCore Policy（預覽版）：為Agent與企業(yè)工具及數(shù)據(jù)的交互提供實時確定性控制。

它允許開發(fā)者在Amazon AgentCore Gateway工具調(diào)用運行前攔截，使用帶有細粒度權(quán)限的策略，為Agent行為定義明確的界限，如使用哪些工具、如何使用工具，開發(fā)者也可以通過自然語言創(chuàng)建標準，如“報銷金額大于1000美元時，就阻止退款”等。

▲亞馬遜云科技推出Amazon AgentCore Policy

Amazon AgentCore Evaluations（預覽版）：根據(jù)實際行為持續(xù)檢查Agent質(zhì)量。

這是一項全托管服務，開發(fā)者可以使用內(nèi)置評估器來衡量常見的質(zhì)量維度，如正確性、幫助性、工具選擇準確性、安全性、目標成功率和上下文相關(guān)性，還可以創(chuàng)建基于模型的定制評分系統(tǒng)，根據(jù)自己選擇的提示和模型進行業(yè)務定制評分。

▲亞馬遜云科技推出Amazon AgentCore Evaluations

除了上述更新，Garman還在最后10分鐘公布了25個新發(fā)布，包括搭載第五代AMD EPYC處理器的X8i Instances、搭載英特爾至強6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆蓋計算、存儲、數(shù)據(jù)庫、大數(shù)據(jù)、安全等多個領(lǐng)域的新品，這些都為企業(yè)Agent部署提供了穩(wěn)定堅實的支撐。

結(jié)語：AI進入Agent時間，價值落地之戰(zhàn)打響

當AI進入Agent時間，2025 re:Invent的舞臺展示了亞馬遜云科技對Agent時代的全面布局，這不再是一場單點技術(shù)的競賽，而是全棧能力的比拼，其正在構(gòu)建一個支持Agent從實驗到落地生產(chǎn)的完整平臺。

當下，每個產(chǎn)業(yè)人士都在見證生成式AI從技術(shù)演示走向商業(yè)價值，價值落地之戰(zhàn)已打響。云巨頭的這種“全家桶”式的全棧能力，或許正是企業(yè)將AI投資轉(zhuǎn)化為實際業(yè)務回報所需要的基礎(chǔ)設施。