智東西(公眾號:zhidxcom)
作者 | ZeR0 程茜
編輯 | 漠影

就在剛剛,全球最大規(guī)模的AI盛會——英偉達(dá)GTC 2026盛大開幕!

智東西3月16日圣何塞現(xiàn)場報道,美西時間11點(diǎn)18分,英偉達(dá)創(chuàng)始人兼CEO黃仁勛身穿標(biāo)志性皮衣登場,發(fā)表了一場激情澎湃的主題演講。

200億美元買下的Groq技術(shù)、掀起“全民養(yǎng)蝦”盛世的OpenClaw、一大波全新開放模型、L4自動駕駛最新進(jìn)展,全部濃縮在這場信息密度極高的演講之中。

先上重點(diǎn),英偉達(dá)發(fā)布其旗艦AI計算平臺Vera Rubin的5大機(jī)架級系統(tǒng),推出全新AI推理芯片Groq LPU 3,宣布7款芯片全面生產(chǎn),并帶來太空計算設(shè)備Space-1 Vera Rubin Module,將AI計算版圖擴(kuò)展到地球之外。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

7款芯片分別是Rubin GPU、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU、NVLink 6 Switch、Spectrum-X 102.4T CPO,以及新集成的Groq 3 LPU。

英偉達(dá)還公布了最新產(chǎn)品路線圖:

  • 對于Rubin架構(gòu),Oberon系統(tǒng)采用銅纜縱向擴(kuò)展,還可以使用光學(xué)擴(kuò)展,將NVLink擴(kuò)展到576。黃仁勛說,銅纜縱向擴(kuò)展和光學(xué)縱向擴(kuò)展,英偉達(dá)都會采用。
  • Rubin Ultra芯片正在流片,即將到來;還有全新的LP35芯片——將首次融入英偉達(dá)的NVFP4計算結(jié)構(gòu),帶來又一個幾倍的速度提升。
  • Oberon之后,Kyber系統(tǒng)采用銅纜縱向擴(kuò)展,還將有Kyber CPO縱向擴(kuò)展——首次同時支持銅纜和共封裝光學(xué)的縱向擴(kuò)展。
  • 計劃在2028年發(fā)布的英偉達(dá)AI數(shù)據(jù)中心扛鼎之作們,也被一次性曝光:Feynman GPU(定制HBM)、LP40 NVLink、Rosa CPU、Bluefield-5 DPU、NVLink 8 CPO、Spectrum7 204T CPO、ConnectX-10 SuperNIC。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

在2小時10分鐘的演講中,英偉達(dá)密集甩出超過20項重磅發(fā)布,涉及AI基礎(chǔ)設(shè)施、智能體、推理、開放模型、機(jī)器人、自動駕駛、企業(yè)級AI等,這些也是今年GTC大會的核心話題。

今年恰逢CUDA誕生20周年,黃仁勛想說的話很多,最言簡意賅的當(dāng)屬下面這張圖,基本概括了英偉達(dá)100%的戰(zhàn)略布局

CUDA龐大的裝機(jī)基數(shù)吸引開發(fā)者,開發(fā)者創(chuàng)造新算法,算法突破催生新技術(shù),新技術(shù)開辟全新市場,全新市場構(gòu)建新生態(tài),更多企業(yè)加入生態(tài),進(jìn)而擴(kuò)大裝機(jī)基數(shù)——這個飛輪,正在加速轉(zhuǎn)動。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

20年前,英偉達(dá)發(fā)明了CUDA,這是其有史以來最重大的投資之一,消耗了公司絕大部分利潤,導(dǎo)致當(dāng)時的英偉達(dá)幾乎負(fù)擔(dān)不起。但歷經(jīng)初期的重重困難,歷經(jīng)13代產(chǎn)品、整整20年的堅持,如今,CUDA已無處不在。

黃仁勛宣布,英偉達(dá)與IBM達(dá)成深度合作,并曬出與谷歌云、AWS、微軟Azure等云巨頭的合作案例?!敖衲晡姨貏e興奮的一件事是,我們將把OpenAI帶到AWS?!?/p>

他提到過去兩年,ChatGPT、生成式AI、Claude Code三件事持續(xù)推動AI浪潮,英偉達(dá)的計算需求已經(jīng)爆表,現(xiàn)貨價格飛漲,推理的拐點(diǎn)已經(jīng)到來。

回顧整場演講,幾個掌聲雷動時刻,堪稱“人氣王”:

1、黃仁勛預(yù)言:到2027年將坐擁1萬億美元訂單

黃仁勛估計英偉達(dá)2025年訂單額約為5000億美元,并大膽預(yù)測,到2027年,這一數(shù)字將翻番,至少會達(dá)到1萬億美元

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

2、龍蝦一出,全場歡呼

萌版紅色龍蝦出現(xiàn)在大屏幕的剎那,觀眾席瞬間沸騰!果然論起炸場,還得看今年AI領(lǐng)域的“頭號頂流”——開源AI智能體框架OpenClaw。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

為開發(fā)者掏心掏肺的英偉達(dá),這次直接端出“養(yǎng)龍蝦全家桶”:軟件包括英偉達(dá)版龍蝦NemoClaw、智能體基礎(chǔ)模型Nemotron 3 Ultra、智能體工具包,硬件有個人AI電腦DGX Spark和桌面級AI超算DGX Station。

大會期間,英偉達(dá)每天都在GTC Park舉辦build-a-claw部署活動,幫參會者免費(fèi)裝“龍蝦”。參會者帶上自己的NVIDIA DGX Spark或GeForce RTX筆記本電腦,就能在英偉達(dá)專家的幫助下本地部署智能體,打造自己的專屬AI助手。英偉達(dá)還誠意拉滿,給OpenClaw爆紅之路做了個精致的回顧視頻。

OpenClaw創(chuàng)始人Peter Steinberger特意發(fā)推文安利:“用OpenShell和 NemoClaw烹飪真的太有趣了!??”

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

3、英偉達(dá)機(jī)器人全家福亮相

黃仁勛放出一張最新機(jī)器人大合照,有30多臺機(jī)器人,包括比亞迪、庫卡、智元、小鵬、吉利的機(jī)器人。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

黃仁勛談道,機(jī)器人是一個50萬億美元的制造業(yè)市場,英偉達(dá)已在此深耕十年,本屆大會現(xiàn)場將展示110臺機(jī)器人,全球幾乎每一家機(jī)器人公司都在與英偉達(dá)合作。

4、“雪寶”機(jī)器人壓軸登場,跟黃仁勛熱聊

“這里有很多人形機(jī)器人,但我最喜歡的之一……是一款迪士尼機(jī)器人?!秉S仁勛夸獎一響,《冰雪奇緣》電影同款的“雪寶”機(jī)器人閃亮登場!

“雪寶”機(jī)器人先是出現(xiàn)在一段展示“全球首次大規(guī)模物理AI部署已經(jīng)到來”的影片里,當(dāng)?shù)鲜磕酦ewton Snow Solver物理引擎將“雪寶”所在的冰雪場景和彩色糖果場景絲滑切換,現(xiàn)場響起熱烈的掌聲。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

影片一結(jié)束,真正的“雪寶”機(jī)器人就走了出來,與黃仁勛熱聊互動,逗樂觀眾。

5、魔性收尾:Q版黃仁勛、龍蝦和機(jī)器人組樂隊

大會收尾別出心裁,黃仁勛數(shù)字人與一群機(jī)器人、一只萌版龍蝦,一起拍了一支魔性音樂MV,歌詞把本屆GTC的核心干貨唱了個遍,曲調(diào)也很上頭。(文末附上了歌詞全文)

今年GTC大會人氣相當(dāng)火爆,超過30000名參會者齊聚圣何塞,有1000多場技術(shù)分論壇、2000多位演講嘉賓。英偉達(dá)將在本屆GTC大會上發(fā)布大約100個庫、70個模型及40個模型。

一、5大機(jī)架組出Vera Rubin巨型AI超算,Groq 3 LPU芯片絲滑融入英偉達(dá)全家桶

“我們每Token的成本是全球最低的,無法被超越?!秉S仁勛說,“我之前說過,如果你選擇了錯誤的架構(gòu),即便它是免費(fèi)的,也還是不夠便宜?!?/p>

在他看來,只有在AI工廠安置了最好的計算系統(tǒng),才能獲得最低的token成本,而英偉達(dá)的token成本基本無可匹敵,原因在于極致的協(xié)同設(shè)計

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

全新Vera Rubin平臺是當(dāng)前英偉達(dá)瞄準(zhǔn)AI推理計算市場的王牌產(chǎn)品:7款芯片、5種機(jī)架級計算機(jī)、1臺革命性AI超算,專為智能體打造——僅用10年,就將算力提升了4000萬倍。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)在GTC主題演講中,黃仁勛一口氣介紹了Vera Rubin平臺的5款全新機(jī)架級系統(tǒng):

  • NVIDIA Vera Rubin NVL72 GPU機(jī)架
  • NVIDIA Groq 3 LPX推理加速器機(jī)架
  • NVIDIA Vera CPU機(jī)架
  • NVIDIA BlueField-4 STX存儲機(jī)架
  • NVIDIA Spectrum-6 SPX以太網(wǎng)機(jī)架

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

它們以統(tǒng)一的MGX模塊化架構(gòu)進(jìn)行深度協(xié)同設(shè)計,可自由組合,按負(fù)載密度和價格梯度靈活部署,加快產(chǎn)品上市速度,服務(wù)于整個AI工廠。

當(dāng)這些匯聚在一起,意味著Vera Rubin平臺將擴(kuò)展整個AI工廠的收入機(jī)會。

目前,7款全新芯片已全面量產(chǎn),可在超大型AI工廠中規(guī)?;渴?。

基于Vera Rubin的產(chǎn)品將從下半年開始由英偉達(dá)的合作伙伴提供。

1、Vera Rubin NVL72 GPU機(jī)架

Vera Rubin NVL72系統(tǒng)集成了由NVLink 6連接的72顆GPU與36顆Vera CPU,以及ConnectX-9 SuperNIC和BlueField-4 DPU。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

相較前代Blackwell平臺,在Vera Rubin平臺上訓(xùn)練大型混合專家模型時,所需GPU數(shù)量僅為1/4,并在AI推理方面,實(shí)現(xiàn)推理吞吐量提升10倍,token單位成本降至原來的1/10。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

黃仁勛認(rèn)為,token是新的大宗商品,一旦達(dá)到拐點(diǎn)、走向成熟,它將會分層細(xì)分,不同模型尺寸、智能、速度、上下文長度對應(yīng)不同的價格。英偉達(dá)在每一層都提升吞吐量。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

注:圖中免費(fèi)層(千問3 235B 32K),中級(Kimi K2.5 1T 128K),高級(GPT MoE 2T 128K),旗艦(GPT MoE 2T 400K)

吞吐量需要大量算力,延遲和交互性需要巨大的帶寬。由于芯片面積有限,因此追求高吞吐量和追求低延遲,實(shí)際上是互相沖突的目標(biāo)。

英偉達(dá)通過引入Groq技術(shù)來解決這一沖突,在最貴的旗艦層將性能提升35倍。

如果將圖表里的曲線向右延伸,想要每秒1000個token的服務(wù),NVLink 72就會力不從心,因為沒有足夠的帶寬。

而這,恰恰是Groq發(fā)揮作用的地方。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

2、Groq 3 LPX推理加速器機(jī)架

去年12月,英偉達(dá)買下AI芯片創(chuàng)企Groq非獨(dú)家協(xié)議和核心成員的交易轟動科技圈。業(yè)界密切關(guān)注Groq的LPU芯片是否會與英偉達(dá)GPU形成競爭。

現(xiàn)在,答案揭曉,LPU并不是來取代GPU的,而是來加入GPU這個家的。

在英偉達(dá)的布局里,Rubin性能強(qiáng),LPU帶寬高、延遲低,兩者優(yōu)勢恰好互補(bǔ)。

因此,英偉達(dá)推出全新NVIDIA Groq 3 LPU,實(shí)現(xiàn)GPU超強(qiáng)算力與LPU超高帶寬的融合。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

來看一組對比:

一張Rubin GPU擁有3360億顆晶體管、288GB HBM4內(nèi)存、22TB/s帶寬、50PFLOPs算力(NVFP4)、 2.5T(HBM4)。

而一張Groq 3 LPU只有980億顆晶體管、500MB SRAM,內(nèi)存容量僅為Rubin HBM4的1/500,算力達(dá)1.2PFLOPS。但其SRAM帶寬高達(dá)150TB/s,是Rubin帶寬的約7倍。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

在此基礎(chǔ)上,英偉達(dá)發(fā)布Groq 3 LPX機(jī)架。

這款新機(jī)架可支持256張Groq 3 LPU,共有128GB片上SRAM、315PFLOPS算力、640TB/s擴(kuò)展帶寬,可擴(kuò)展至超過1000張LPU。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

黃仁勛說,Groq如此吸引人的原因在于:其計算系統(tǒng)是一種確定性數(shù)據(jù)流處理器,靜態(tài)編譯,由編譯器調(diào)度——編譯器預(yù)先確定何時執(zhí)行計算,數(shù)據(jù)同步到達(dá),所有這些都在軟件中靜態(tài)預(yù)排,沒有動態(tài)調(diào)度。

該架構(gòu)設(shè)計配備了大量SRAM,專為推理這一個單一工作負(fù)載而設(shè)計。

需要大量的Groq芯片,才能存儲Vera Rubin的參數(shù)規(guī)模以及必須與之配套的KV Cache,這使得Groq受到一定限制。

對此,英偉達(dá)用Dynamo軟件重新構(gòu)建推理的管線,使適合的工作放在Vera Rubin上運(yùn)行,然后將解碼生成部分,也就是低延遲、帶寬受限的挑戰(zhàn)性工作負(fù)載部分,卸載到Groq上。這就將兩款各具極端優(yōu)勢的處理器統(tǒng)一起來。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)
協(xié)同設(shè)計的LPX架構(gòu)與Rubin GPU緊密耦合,LPX作為token加速器,疊加在擁有高吞吐量的Vera Rubin之上,兩者合計可將運(yùn)行萬億參數(shù)模型時提供每兆瓦推理吞吐量提升35倍Groq 3 LPU由三星代工,已進(jìn)入量產(chǎn),預(yù)計下半年出貨,大約在第三季度。

3、NVIDIA Vera CPU機(jī)架

智能體模型的訓(xùn)練和部署推理都離不開CPU。GPU需要調(diào)用CPU來執(zhí)行工具調(diào)用、SQL查詢和代碼編譯等任務(wù),CPU的速度至關(guān)重要。

英偉達(dá)將Vera CPU稱作“專為智能體AI工作負(fù)載打造的最佳CPU”。

Vera搭載全新Olympus核心,是全球唯一使用LPDDR5的數(shù)據(jù)中心CPU,結(jié)合高性能與高能效的核心設(shè)計、高帶寬內(nèi)存子系統(tǒng)以及第二代英偉達(dá)可擴(kuò)展計算Fabric,能在各類智能體應(yīng)用場景和強(qiáng)化學(xué)習(xí)極端條件下提供更快的響應(yīng)速度。

相比傳統(tǒng)x86 CPU,Vera單線程性能提升50%,每核心內(nèi)存帶寬提升至3倍,能效翻倍

今日,英偉達(dá)發(fā)布全新NVIDIA Vera CPU機(jī)架。

該機(jī)架搭載256臺液冷Vera CPU,提供400TB內(nèi)存、300TB/s內(nèi)存帶寬,集成64顆BlueField-4 DPU,全面兼容Vera Rubin與MGX生態(tài)系統(tǒng)。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

英偉達(dá)已完成初步芯片測試,Vera在各類工作負(fù)載上的性能提升從2倍到超過5倍不等。

4、BlueField-4 STX存儲機(jī)架

隨著智能體應(yīng)用規(guī)模擴(kuò)大,數(shù)據(jù)需求也在膨脹。

傳統(tǒng)數(shù)據(jù)中心提供大容量的通用存儲,但缺乏AI智能體所需的即時響應(yīng)能力。隨著上下文窗口增長、AI能力提升,傳統(tǒng)存儲路徑和數(shù)據(jù)通路會拖慢AI推理速度、降低GPU利用率。

為此,英偉達(dá)推出全新的BlueField-4 STX存儲機(jī)架。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

這是一個原生存儲基礎(chǔ)設(shè)施,基于BlueField-4 DPU,結(jié)合Vera CPU和ConnectX-9 SuperNIC,可將GPU內(nèi)存無縫擴(kuò)展至POD計算集群中。

STX提供了一種高帶寬共享層,用于存儲和檢索大語言模型及智能體AI工作流所產(chǎn)生的海量KV Cache數(shù)據(jù)。

該機(jī)架可實(shí)現(xiàn)能效比提升至4倍,企業(yè)數(shù)據(jù)翻頁速率提升至2倍,同時讓AI工廠的上下文記憶每秒token處理速率快5倍。

5、Spectrum-6 SPX以太網(wǎng)機(jī)架

Spectrum-6 SPX以太網(wǎng)用于全數(shù)據(jù)中心橫向擴(kuò)展的互連網(wǎng)絡(luò),讓以上所有系統(tǒng)連成整體。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

與傳統(tǒng)可插拔收發(fā)器相比,帶有共封裝光學(xué)器件(CPO)的Spectrum-X以太網(wǎng)光子技術(shù)實(shí)現(xiàn)了多達(dá)5倍的光學(xué)功率效率和10倍的彈性。

6、發(fā)布Vera Rubin DSX AI工廠參考設(shè)計和Omniverse DSX數(shù)字孿生藍(lán)圖

要在數(shù)據(jù)中心部署上述全新計算集群和架構(gòu),必須考慮如何運(yùn)營,并幫助整個數(shù)據(jù)中心生態(tài)系統(tǒng)實(shí)現(xiàn)效能提升。

因此,英偉達(dá)發(fā)布Vera Rubin DSX AI工廠參考設(shè)計,這是一個AI基礎(chǔ)設(shè)施藍(lán)圖,概述了如何設(shè)計、構(gòu)建、操作整個AI工廠基礎(chǔ)設(shè)施堆棧,可最大限度提高每瓦token和整體實(shí)際吞吐量,提高系統(tǒng)彈性并加快首次生產(chǎn)的時間。

基于Rubin平臺部署DSX架構(gòu)后,AI工廠能在固定功耗下,實(shí)現(xiàn)能效比提升30%,同時增加30%的AI算力部署規(guī)模。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

NVIDIA Omniverse DSX藍(lán)圖現(xiàn)在提供NVIDIA Vera Rubin DSX AI工廠參考設(shè)計,為大型AI工廠設(shè)計和模擬提供數(shù)字孿生。

開發(fā)者通過以下幾個API接入:

  • DSX Sim,用于物理、電氣、熱力和網(wǎng)絡(luò)仿真;
  • DSX Exchange,用于AI工廠運(yùn)營數(shù)據(jù)交換;
  • DSX Flex,用于電網(wǎng)與數(shù)據(jù)中心之間安全的動態(tài)功率管理;
  • DSX Max-Q,用于動態(tài)最大化Token吞吐量。

7、NVIDIA RTX PRO 4500 Blackwell服務(wù)器版

在GTC期間,英偉達(dá)還發(fā)布了NVIDIA RTX PRO 4500 Blackwell服務(wù)器版,為全球應(yīng)用廣泛的企業(yè)數(shù)據(jù)中心和邊緣計算平臺(包括本地部署和云端)帶來多工作負(fù)載GPU加速功能。

8、Vera Rubin AI太空計算模塊

“我們已經(jīng)進(jìn)入太空了,”黃仁勛說,“我們有抗輻射的GPU,我們在衛(wèi)星上進(jìn)行成像。未來,我們還將在太空中建造數(shù)據(jù)中心。

這很復(fù)雜,所以,英偉達(dá)正與合作伙伴研發(fā)一款新型計算機(jī),稱作NVIDIA Space-1 Vera Rubin Module將發(fā)射入軌并在太空中建立數(shù)據(jù)中心。

這是一款面向太空優(yōu)化的AI計算模塊,支持實(shí)時感知、決策和自主運(yùn)作,將數(shù)據(jù)中心級AI計算性能帶到軌道數(shù)據(jù)中心、地理空間智能和自主空間與運(yùn)營。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

在太空中沒有傳導(dǎo)、沒有對流,只有輻射散熱,所以必須想辦法冷卻這些系統(tǒng),英偉達(dá)有很多優(yōu)秀的工程師正在研究。

二、發(fā)智能體工具包、桌面級AI超算,全方位助攻安全“養(yǎng)龍蝦”

隨著OpenClaw爆火,智能體的“ChatGPT時刻”已經(jīng)來臨。

黃仁勛評價說,OpenClaw是人類歷史上最受歡迎的開源項目,僅僅幾周內(nèi)就做到,超越了Linux用30年取得的成就。

在他看來,OpenClaw開源了,本質(zhì)上就是一個“智能體計算機(jī)的操作系統(tǒng)”,與Windows使得PC得以實(shí)現(xiàn)沒區(qū)別,如今,OpenClaw使個人智能體的創(chuàng)建得以實(shí)現(xiàn)。

因為OpenClaw的吉祥物是一只紅色龍蝦,中國開發(fā)者更喜歡用“龍蝦”來稱呼這個智能體,并將部署OpenClaw稱作“養(yǎng)龍蝦”。

“全民養(yǎng)蝦”熱潮正推動算力需求呈數(shù)量級增長,但也存在可能自主訪問敏感數(shù)據(jù)、濫用已連接的工具或自行提升權(quán)限等風(fēng)險。

對此,英偉達(dá)發(fā)布了多款智能體工具及硬件設(shè)備,來幫助開發(fā)者更高效、更安全地“養(yǎng)龍蝦”。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

1、為OpenClaw設(shè)計的NemoClaw

英偉達(dá)正與OpenClaw創(chuàng)始人Peter Steinberger合作,匯聚世界上最優(yōu)秀的安全和計算專家,將OpenClaw改造為OpenClaw企業(yè)版,使其具備企業(yè)安全性和企業(yè)隱私能力。

這被稱為英偉達(dá)OpenClaw參考設(shè)計——Open?NeMoClaw

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

只需一條命令(command),NemoClaw就能用英偉達(dá)智能體工具包軟件來優(yōu)化OpenClaw,將NVIDIA Nemotron模型、NVIDIA OpenShell運(yùn)行時一并安裝,通過OpenShell提供開放模型和一個增強(qiáng)智能體隱私安全性的獨(dú)立沙盒環(huán)境。

這為智能體提供了按照預(yù)定隱私和安全護(hù)欄開發(fā)新Skills、完成任務(wù)的基礎(chǔ),使用戶能在企業(yè)內(nèi)部安全地保護(hù)和約束“龍蝦”的執(zhí)行。

NemoClaw可運(yùn)行于各類專用平臺,包括云端、本地部署、RTX PC和筆記本電腦、DGX Station和DGX Spark超算等,確保智能體擁有持續(xù)構(gòu)建軟件工具、完成任務(wù)所需的專屬算力。

2、英偉達(dá)智能體工具包

英偉達(dá)智能體工具包(NVIDIA Agent Toolkit)是一套開放模型、運(yùn)行時和藍(lán)圖的集合,用于構(gòu)建、評估和優(yōu)化更安全的長期運(yùn)行自治智能體。

該工具包以覆蓋推理、編碼、文檔智能、語音和視覺領(lǐng)域的高效開放模型Nemotron為起點(diǎn),配備NeMo用于智能體的性能分析、定制與優(yōu)化,NIM提供模型推理服務(wù),Dynamo負(fù)責(zé)規(guī)?;瘮U(kuò)展。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

智能體需要各種Skills。其中NVIDIA OpenShell是一款面向智能體的新型開源安全與防護(hù)運(yùn)行時,提供了“龍蝦”缺失的基礎(chǔ)設(shè)施層,通過基于策略的安全、網(wǎng)絡(luò)和隱私護(hù)欄進(jìn)行管控。AI-Q是一個開源藍(lán)圖,融合前沿模型與開放模型的智能,打造全球領(lǐng)先的面向長期工作流的研究型智能體,且運(yùn)行高效。

軟件的世界已經(jīng)改變。英偉達(dá)認(rèn)為,每一家SaaS(軟件即服務(wù))公司,都將被重塑為AaaS(智能體即服務(wù),Agent as a Service)。企業(yè)不再銷售工具,而是出租使用其工具的智能體。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

英偉達(dá)正在幫助全球軟件企業(yè)完成這一轉(zhuǎn)型,支持他們基于英偉達(dá)智能體工具包構(gòu)建智能體。LangChain是開發(fā)者構(gòu)建智能體的首選框架,下載量超過10億次,今日宣布推出與英偉達(dá)合作構(gòu)建的企業(yè)級智能體AI平臺。

3、兩款“養(yǎng)龍蝦”設(shè)備:DGX Spark與DGX Station

構(gòu)建好智能體之后,下一個問題就很簡單了:在哪兒運(yùn)行?

它們可以在云端或AI工廠中運(yùn)行,但很多開發(fā)者更傾向于在完全可控的本地環(huán)境中開發(fā)。

因此,英偉達(dá)推出兩款適合運(yùn)行NemoClaw的云端開發(fā)者平臺:個人AI電腦DGX Spark和全球最快桌面級AI超算DGX Station。

DGX Spark旨在讓云端開發(fā)更具普惠性,可以運(yùn)行安全、常駐的自治智能體。多項DGX Spark更新發(fā)布,支持將最多4個系統(tǒng)集群到統(tǒng)一配置中,并支持GTC大會上發(fā)布的最新AI模型。

基于GB10的DGX Spark及OEM合作伙伴系統(tǒng)今日起在全球正式開售。

DGX Station是終極云端開發(fā)平臺,讓開發(fā)者能直接在辦公桌上本地構(gòu)建、微調(diào)和運(yùn)行具備前沿智能水平的模型。這意味著開發(fā)者可在自己的機(jī)器上構(gòu)建并運(yùn)行“龍蝦”,無需連接云端,全程保持本地化,實(shí)現(xiàn)開發(fā)過程中的完整掌控與安全保障。

DGX Station將于今日起向OEM合作伙伴開放訂購。

三、一大波開放模型上新,涉及智能體、物理AI和醫(yī)療健康

開放模型對AI生態(tài)發(fā)展至關(guān)重要。

作為全球最大的開源AI貢獻(xiàn)者之一,英偉達(dá)構(gòu)建并發(fā)布六大系列的開放前沿模型及訓(xùn)練數(shù)據(jù)配方和框架,幫開發(fā)者定制和采用。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

Nemotron 3 Ultra是最強(qiáng)開放基礎(chǔ)模型,在英偉達(dá)自有基礎(chǔ)設(shè)施上完成預(yù)訓(xùn)練,吞吐量是此前最佳開放模型的2倍。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

Nemotron 3 Omni具備音頻、視覺和語言理解能力,可支持智能體從視頻和文檔中高效提取信息。Nemotron 3 VoiceChat支持實(shí)時對話,把自動語音識別、大語言模型處理和文本轉(zhuǎn)語音功能結(jié)合在一個系統(tǒng)中。

上周先一步發(fā)布的Nemotron 3 Super模型是英偉達(dá)迄今最強(qiáng)推理模型,在其同量級中智能水平最高、效率最優(yōu),在BFCL(伯克利函數(shù)調(diào)用排行榜,專門評估大模型作為智能體大腦的能力)中登頂開源模型第一,綜合排名全球第四。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

面向物理AI和醫(yī)療健康A(chǔ)I的全新開放模型包括:
  • NVIDIA Cosmos 3,第一個統(tǒng)一合成世界生成、物理AI推理和動作模擬的世界基礎(chǔ)模型。
  • NVIDIA GR00T N1.7,一個專為人形機(jī)器人構(gòu)建的開放推理視覺語言動作(VLA)模型,在現(xiàn)實(shí)世界中部署具有商業(yè)可行性。
  • NVIDIA Alpamayo 1.5,一個面向自動駕駛汽車的一種推理VLA模型。
  • NVIDIA BioNeMo Proteina-Complexa,一個用于蛋白質(zhì)結(jié)合體設(shè)計的生成模型,可加速基于結(jié)構(gòu)的藥物發(fā)現(xiàn)和治療。
以上模型均已在Hugging Face上發(fā)布。

黃仁勛還預(yù)告了GR00T N2,這是一個基于DreamZero研究的下一代基礎(chǔ)模型,預(yù)計將于今年年底發(fā)布。

該模型構(gòu)建于新的世界動作模型架構(gòu)上,幫助機(jī)器人在新環(huán)境中成功完成新任務(wù)的頻率是領(lǐng)先VLA模型的2倍多。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

此外,英偉達(dá)宣布成立Nemotron聯(lián)盟,聯(lián)手Black Forest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam、Thinking Machines Lab等頂尖AI實(shí)驗室,匯聚專業(yè)知識、數(shù)據(jù)、評估體系和模型開發(fā)能力。

到明年賺它1萬億美元!黃仁勛撂狠話,英偉達(dá)龍蝦轟動全場,Groq新芯片首發(fā)

英偉達(dá)將使用內(nèi)部DGX Cloud算力統(tǒng)一承擔(dān)訓(xùn)練工作,避免每家機(jī)構(gòu)在相同基礎(chǔ)模型上重復(fù)投入,共同構(gòu)建開放的共享基礎(chǔ)。

開發(fā)者和企業(yè)隨后可在此基礎(chǔ)上,針對各自的行業(yè)、地區(qū)和應(yīng)用場景進(jìn)行專項定制。

聯(lián)盟的第一個項目是一款全新的基礎(chǔ)模型,正在英偉達(dá)DGX Cloud上訓(xùn)練,將成為即將發(fā)布的Nemotron 4系列的基礎(chǔ)。

四、物理AI:工業(yè)軟件、機(jī)器人龍頭都在用,公布L4自動駕駛、太空計算新進(jìn)展

整個IT行業(yè)只有2萬億美元,而世界上其他所有行業(yè),都需要能與真實(shí)世界交互的AI,需要能夠理解、建模并與真實(shí)世界交互的AI物理模型。

從桌面到機(jī)器人、自動駕駛汽車,從AI工廠到電信網(wǎng)絡(luò),英偉達(dá)的AI基礎(chǔ)設(shè)施已無處不在。

1、物理AI數(shù)據(jù)工廠藍(lán)圖

在機(jī)器人領(lǐng)域,算力即數(shù)據(jù)。當(dāng)前的數(shù)據(jù)生成工作流極為碎片化,數(shù)據(jù)處理、生成、仿真、評估和部署分散在不同管道中。

對此,英偉達(dá)推出物理AI數(shù)據(jù)工廠藍(lán)圖,一個基于英偉達(dá)Cosmos世界模型和OSMO機(jī)器人算力編排系統(tǒng)的開放參考架構(gòu),讓“用仿真數(shù)據(jù)大規(guī)模訓(xùn)練機(jī)器人”這件事有了標(biāo)準(zhǔn)化管線。

英偉達(dá)正是用這套管線構(gòu)建了Alpamayo、Cosmos和GR00T等前沿開放模型。

微軟Azure和Nebius是首批采用該架構(gòu)的云服務(wù)商,首批客戶包括Field AI、Hexagon Robotics、Milestone Systems、Skilled AI和Teradyne Robotics。

2、機(jī)器人企業(yè)們都在用英偉達(dá)計算平臺

英偉達(dá)為機(jī)器人制造商提供三類計算平臺,以及開放模型、庫和框架,可按需組合使用。

英偉達(dá)宣布,全球眾多頂級機(jī)器人企業(yè)都在這三類計算平臺上進(jìn)行構(gòu)建ABB、FANUC和庫卡合計占全球工業(yè)機(jī)器人裝機(jī)量近半,均已將Omniverse庫集成至其機(jī)器人仿真工具中。

Figure、智元機(jī)器人、1X等人形機(jī)器人企業(yè)采用Isaac Lab、Newton和Cosmos等機(jī)器人仿真庫進(jìn)行構(gòu)建,并采用Jetson和Thor進(jìn)行邊緣推理。

AI原生企業(yè)如Skilled AIField AI均在英偉達(dá)Isaac和Cosmos技術(shù)棧上構(gòu)建其通用機(jī)器人大腦。

英偉達(dá)是目前唯一一個每家機(jī)器人公司都在構(gòu)建于其上的計算平臺。

3、L4自動駕駛出租車試點(diǎn),擴(kuò)展軟件安全

自動駕駛汽車是物理AI大規(guī)模落地的第一個場景,也是全球首次大規(guī)模部署機(jī)器人。

英偉達(dá)構(gòu)建了全球唯一的全棧自動駕駛平臺NVIDIA DRIVE,覆蓋自動駕駛訓(xùn)練與驗證所需的架構(gòu)、安全系統(tǒng)和AI基礎(chǔ)設(shè)施。

其核心是NVIDIA DRIVE Hyperion,一款支持L4級自動駕駛的整車參考架構(gòu),集成計算、傳感器和軟件,可供整個自動駕駛生態(tài)系統(tǒng)構(gòu)建。

自動駕駛的使命是安全,英偉達(dá)宣布推出L4自動駕駛汽車的統(tǒng)一軟件安全基礎(chǔ)NVIDIA Halos OS、開放推理VLA自動駕駛模型的全新版本NVIDIA Alpamayo 1.5,用于自動駕駛仿真的Omniverse NuRec也普遍可用了。

英偉達(dá)DRIVE生態(tài)系統(tǒng)正在持續(xù)擴(kuò)大。比亞迪、吉利、日產(chǎn)等多家全球車企新近加入,采用DRIVE Hyperion,開發(fā)下一代L4自動駕駛程序。

Uber全球L4無人駕駛出租車將采用DRIVE Hyperion,基于英偉達(dá)全棧DRIVE AV軟件運(yùn)行無人駕駛網(wǎng)絡(luò),計劃于2027年在洛杉磯和舊金山啟動試點(diǎn),2028年底前擴(kuò)展至四大洲28座城市。

4、全球工業(yè)軟件巨頭都在用英偉達(dá)AI

英偉達(dá)宣布Cadence、Dassault Systèmes、西門子、新思科技等主要工業(yè)軟件廠商將英偉達(dá)AI、開放模型、CUDA-X、Omniverse和GPU加速工業(yè)軟件及工具帶到現(xiàn)代、本田、奔馳、聯(lián)發(fā)科、百事可樂、三星、SK海力士、臺積電等公司,以加速設(shè)計、工程和制造。

這些軟件領(lǐng)導(dǎo)者們還推出了由英偉達(dá)驅(qū)動的智能體解決方案,用于復(fù)雜的芯片和系統(tǒng)工具流。

例如,本田正使用新思科技的Ansys Fluent在英偉達(dá)Grace Blackwell上運(yùn)行空氣動力學(xué)模擬,速度比使用CPU快了34倍。

5、英偉達(dá)、T-Mobile等將物理AI應(yīng)用部署到AI-RAN基礎(chǔ)設(shè)施

英偉達(dá)和T-Mobile宣布正與諾基亞合作,將物理AI應(yīng)用部署到AI RAN基礎(chǔ)設(shè)施。

電信網(wǎng)絡(luò)正在演變成AI基礎(chǔ)設(shè)施。T-Mobile試點(diǎn)NVIDIA RTX PRO 6000 Blackwell服務(wù)器版AI基礎(chǔ)設(shè)施,補(bǔ)充AI-RAN創(chuàng)新中心的分布式網(wǎng)絡(luò),以充分發(fā)揮物理AI的潛力。

基于英偉達(dá)加速計算的AI-RAN過渡解決了物理AI擴(kuò)展的關(guān)鍵瓶頸:缺乏低延遲、安全和無處不在的連接。

雖然Wi-Fi受到覆蓋范圍和安全性的限制,但T-Mobile的5G獨(dú)立網(wǎng)絡(luò)為復(fù)雜AI智能體提供了廣泛的覆蓋和保證服務(wù)質(zhì)量。

結(jié)語

5套機(jī)架級系統(tǒng)、7款量產(chǎn)芯片、1套完整智能體開發(fā)軟硬件、覆蓋自動駕駛/機(jī)器人/工業(yè)/邊緣/太空的物理AI布局……黃仁勛用2小時信息量爆棚的演講,繪制出一張通往未來的AI基建施工圖。

在這張圖里,英偉達(dá)的目標(biāo)始終如一:垂直整合,橫向開放,確保每一個AI系統(tǒng),無論運(yùn)行在哪里、做什么、規(guī)模有多大,都跑在英偉達(dá)的平臺上。

未來已來,智能體大爆發(fā)正推動難以置信的計算需求。在這個AI新世界里,算力即金錢。從桌面、機(jī)器人、汽車、工廠到數(shù)據(jù)中心甚至到近地軌道,每一層都有英偉達(dá)的算力在運(yùn)轉(zhuǎn),每一個token的生成都在為它的收入計數(shù)。

通過收購Groq LPU技術(shù)增強(qiáng)推理優(yōu)勢,用開源頂尖模型激勵更廣泛的算力需求,以全棧布局和提高工具易用性來壘高用戶的遷移成本,英偉達(dá)走得每一步棋,都堪稱教科書級。

英偉達(dá)是克制的,它堅持做基建商,不碰下游客戶的分毫蛋糕。英偉達(dá)又是貪婪的,這種貪婪驅(qū)動它以極強(qiáng)的戰(zhàn)斗力向前狂奔,為自己創(chuàng)造更龐大的未來市場,又以一種高明的長期主義,把各行各業(yè)的頭部企業(yè)引入自己的生態(tài)軌道,把客戶的成功變成自己的護(hù)城河。

最后,附上GTC 2026黃仁勛主題演講片尾曲的歌詞,來總結(jié)下本屆GTC的重點(diǎn):

The keynotes over, all was said Jensen mapped the road ahead.

主題演講落幕,該說的都已講完,黃仁勛為我們鋪好了前路。

AI factories coming alive, agents learning how to drive.

AI工廠全面蘇醒,智能體學(xué)會自主行動。

From open models to robots too now we break it all down for you.

從開源模型到機(jī)器人世界,現(xiàn)在我們?yōu)槟悴鸾膺@一切。

Compute exploded, what we saw from CNN’s to OpenClaw.

從卷積網(wǎng)絡(luò)到OpenClaw,我們親眼見證算力大爆發(fā)。

Agents working cross the land but they need the power to meet demand.

智能體遍布各地但它們需要強(qiáng)大算力才能滿足需求。

So we solved the problem, It was brilliant.

于是我們解決了難題,方案堪稱絕妙。

We multiplied compute by forty million.

我們把算力提升了4000萬倍。

Once upon an AI time training was the paradigm.

曾經(jīng)的AI時代訓(xùn)練是核心范式。

Sure it taught the models how, but inference runs the whole world now.

它教會模型如何學(xué)習(xí),但如今推理才是驅(qū)動世界的引擎。

Vere shows us who’s the boss at thirty-five times less the cost.

Vere告訴世界才是真正王者,成本降到1/35。

Blackwell makes the tokens sing NVIDIA, the inference King.

Blackwell讓Token放聲歌唱:英偉達(dá),推理之王。

AI Factories once took year vendors pulling racks and gears.

AI工廠曾經(jīng)耗時經(jīng)年,廠商們堆砌機(jī)架與配件。

Built up slowly, piece by piece no clear way to scale the beast.

一點(diǎn)點(diǎn)緩慢搭建,卻找不到規(guī)?;穆窂?。

DSX and Dynamo know what to do turning power into revenue.

DSX與Dynamo指明方向把算力直接變成營收。

Agents used to wait and see now act autonomously.

智能體過去只會觀望等待。

But if they ever try to stray safe Claws block and say ‘No Way!’

如今可以完全自主行動,可一旦它們試圖越界,安全Claw會阻攔:“絕對不行!”

NemoClaw’s there to guard the course and yes, my friends…

NemoClaw守護(hù)全程航向,而且,朋友們……

It’s open source.

它還是開源的!

Cars that think and droids that run this ain’t the movies, it’s all begun.

會思考的汽車,能奔跑的機(jī)器人,這不是電影,一切已經(jīng)開始。

Alpamayo calls the shots it’s a GPT moment for the bots.

Alpamayo掌控全局,這是機(jī)器人的GPT時刻。

From sim to streets, now watch them drive throw your hands up for Physical AI.

從仿真到街頭,看它們馳騁,為物理AI振臂高呼。

The Industrial Age built what came before now we build for AI even more.

工業(yè)時代鑄就了過往,如今我們?yōu)锳I再造新章。

Vera Rubin plus groq make the inference splash put them together,now it’s raining cash.

Vera 加上Groq掀起推理狂潮,兩者強(qiáng)強(qiáng)聯(lián)手財富如雨降臨。

We build new architecture every year because Claws keep yelling, ‘More tokens here!’

我們每年都打造全新架構(gòu),因為“龍蝦”不停吶喊:“這里需要更多token!”

The AI stack’s for all to make so let us all eat five layer cake.

AI技術(shù)棧由所有人共同創(chuàng)造,讓我們共享這五層蛋糕。

The moment’s bright, the path is clear because open models led us here.

此刻光芒萬丈,前路清晰坦蕩,是開源模型帶領(lǐng)我們抵達(dá)遠(yuǎn)方。

When data’s missing, there’s no dispute we just generate more with compute.

當(dāng)數(shù)據(jù)缺失時毋庸置疑,我們用算力生成更多數(shù)據(jù)。

Robots learning without a flaw fueling the four scaling laws.

機(jī)器人完美學(xué)習(xí)無差錯,驅(qū)動四大增長定律。

The future’s here, won’t you come and see?

未來已來,你難道不想親眼見證?

Welcome all to GTC.

歡迎所有人來到GTC大會。