芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西6月3日報道,昨夜,英偉達披露未來三代數(shù)據(jù)中心半導體技術路線圖,新GPU架構每年一更:

  • 2025年推出Blackwell Ultra GPU(8S HBM3e 12H);
  • 2026年推出Rubin GPU(8S HBM4);
  • 2027年推出Rubin Ultra GPU(12S HBM4),新一代基于Arm的Vera CPU,以及NVLink 6 Switch(3600GB/s)。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

Rubin和Vera的命名均源自美國天文學家Vera Rubin。她對宇宙暗物質研究做出重大貢獻。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來▲Vera Rubin

“我在這里向你們展示的所有這些芯片都在完全開發(fā)中,百分之百?!庇ミ_創(chuàng)始人兼CEO黃仁勛說,英偉達的更新節(jié)奏以年為單位,所有架構都是兼容的,“以一年為周期,我們把所有東西推向技術極限”。

作為本周臺北國際電腦展COMPUTEX 2024開幕前的重磅演講嘉賓,黃仁勛甩出未來三代GPU架構這一重磅披露,顯得誠意十足。

身為芯片圈“頂流”,黃仁勛這次到臺灣省再度引起轟動。他前幾天相當繁忙,又是跟臺積電創(chuàng)始人張忠謀、聯(lián)發(fā)科董事長蔡明介、廣達董事長林百里等大佬聚餐,又是拉著92歲高齡的張忠謀去體驗逛夜市,所到之處都受到巨星級歡迎,從具體行程到宴請菜品都被臺媒扒個底朝天。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

連續(xù)數(shù)日霸屏臺灣科技頭條,只是“皮衣老黃”黃仁勛來臺的開胃菜。

周日晚上19點09分,正餐來了——

最近英偉達市值穩(wěn)定在2.7萬億美元,黃仁勛儼然人逢喜事精神爽,穿著標志性的黑色皮衣一路小跑登臺,滿面笑容地向臺灣大學綜合體育館內的6500名參會者用中文問候:“大家好!”

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

臺下也是大佬云集,有美超微CEO梁見后、華碩董事長施崇棠、鴻海董事長劉揚偉、聯(lián)發(fā)科總經理陳冠州等。

黃仁勛在演講中忍不住提起到臺灣夜市,說自己很喜歡逛夜市,因為很喜歡看人,自己臉上有道疤就是小時候去夜市時被不慎割傷的,所以對夜市印象很深。他還特別夸贊了一位賣了43年水果的老板娘。

在介紹基于英偉達Earth-2數(shù)字孿生地球和英偉達CorrDiff生成式AI模型生成的12倍高解析度天氣預測模型時,他更是全程中文,流利不卡頓。

老黃中文進步這么大?隨后黃仁勛自揭謎底:都是AI生成的!

他還在現(xiàn)場展示了Blackwell芯片主板,稱這是“世界上最復雜、性能最高的計算機”。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛說,自己這場演講主要談三件事:一是其工作的意義;二是什么是生成式AI以及它對各行業(yè)的影響;三是英偉達的藍圖和下一步。

他堅信下一波AI浪潮是物理AI,看好人形機器人,還站在大屏幕顯示的9款人形機器人之間張開雙臂展示。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

一、8年AI算力漲1000倍,能耗降到1/350

黃仁勛說,英偉達立足于計算機圖形學、仿真和AI的交叉領域,這是英偉達的靈魂。加速計算和AI技術將會重塑計算機行業(yè)。

他強調加速計算能夠實現(xiàn)可持續(xù)增長,稱CPU的性能擴展已經大大放緩,頂不住持續(xù)暴增的計算需求、數(shù)據(jù)處理需求、數(shù)據(jù)中心電量、計算機成本了,而更好的辦法就是加速計算。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

一如既往,黃仁勛現(xiàn)場算賬,說明“買得越多,省得越多”。

英偉達通過GPU+CPU組合,實現(xiàn)了高達100倍的加速,同時功耗僅增加到3倍,成本僅增加到1.5倍。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

“100倍的速度意味著97%、98%的節(jié)省。所以當我們從100倍的速度到200倍的速度再到1000倍的速度,節(jié)省、計算的邊際成本繼續(xù)下降?!秉S仁勛說。

英偉達的軟件組合也在不斷壯大。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛再度強調CUDA的前瞻性和主導地位。通過CUDA+GPU的組合拳,英偉達實現(xiàn)安裝量一路上漲、開發(fā)者和應用越來越多、研發(fā)規(guī)模擴大、性能越來越好的良性循環(huán)。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

英偉達在1000美元的PC上添加了一張500美元的GPU,性能大幅提升;一個10億美元的數(shù)據(jù)中心加上5億美元的GPU,就能變成一個AI工廠。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛說,很多公司花費了數(shù)億美元在云端處理數(shù)據(jù),通過加速計算,可以節(jié)省數(shù)億美元。

8年內英偉達AI算力增加了1000倍,能以更低成本去訓練大模型。比如訓練1.8萬億參數(shù)、8萬億token的GPT-4,所需能耗從8年前Pascal架構的1000GWh減少到Blackwell的3GWh。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

也就是說將能耗足足降至8年前的1/350。

黃仁勛還分享說,Blackwell將生成token的能耗降至8年前的1/45000。

以前用Pascal產生1 token的能耗相當于2個200W燈泡運行2天,讓GPT-4生成一個單詞大約需要3個token。現(xiàn)在1 token只用0.4J能耗。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

有Blackwell還不夠,必須制造更大的機器,英偉達構建它的方式是風冷DGX和液冷MGX。黃仁勛活像現(xiàn)場帶貨,對這些大機器挨個安利。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

其中DGX的AI算力提升到上一代的45倍,達到1440PFLOPS,而能耗僅為上一代的10倍。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛還拿了張GeForce顯卡跟機柜對比大小。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

新一代DGX能搭載72個GPU,背后由NVLink 5000根電纜組成的主干支持,能為一個機架節(jié)省20kW電能。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

二、英偉達計劃每年推出Spectrum-X新品,數(shù)據(jù)中心將進入數(shù)百萬GPU時代

“數(shù)百萬GPU數(shù)據(jù)中心的時代即將到來!”黃仁勛宣布每年推出新的Spectrum-X產品。

NVIDIA Spectrum-X是全球首款專為AI打造的以太網網絡平臺,可將網絡性能較傳統(tǒng)以太網網絡平臺提升1.6倍,能加快AI工作負載的處理、分析和執(zhí)行速度。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

Spectrum-X800為數(shù)萬個GPU而設計,X800 Ultra為數(shù)十萬個GPU而設計,X1600則可擴展至數(shù)百萬個GPU。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

CoreWeave、Lambda等AI云服務提供商率先采用Spectrum-X。

英偉達計劃每年推出Spectrum-X新品,提供更高的帶寬、更多的端口、更加強大的軟件功能集與可編程能力,不斷提高AI以太網網絡性能。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

三、AI工廠將掀起新產業(yè)革命,AMD和英特爾均支持MGX架構

黃仁勛極力描繪生成式AI時代的巨大市場機會:“有史以來第一次,IT行業(yè),這是3萬億美元,3萬億美元的IT產業(yè)即將創(chuàng)造出能夠直接服務于100萬億美元產業(yè)的東西?!?/p>

他展示了英偉達如何從Blackwell芯片等一系列先進技術和產品的組合,壘起層層疊疊的機架、集群,最終形成由32000張GPU組成的AI工廠。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

永擎電子、華碩、技嘉、鴻佰科技、英業(yè)達、和碩、QCT、超微、緯創(chuàng)、緯穎等企業(yè)正在打造基于英偉達技術的云、專用系統(tǒng)和邊緣AI系統(tǒng)。

NVIDIA MGX模塊化參考設計平臺為計算機制造商提供了一個參考架構,以便其能夠以快速且低成本的方式構建超過100種的系統(tǒng)設計配置。

MGX加入了對Blackwell產品的支持,包括專為大語言模型推理、檢索增強生成和數(shù)據(jù)處理而打造的全新GB200 NVL2平臺。

已有超過25家合作伙伴的90多套已發(fā)布或正在開發(fā)中的系統(tǒng)使用了MGX參考架構,較去年來自6家合作伙伴的14套系統(tǒng)有顯著增加。

通過采用MGX,開發(fā)成本大幅降低,較之前最多降低了3/4;開發(fā)時間縮短到僅6個月,較之前減少了2/3。

AMD和英特爾都支持MGX架構,并首次計劃打造基于他們自己CPU主機處理器的模塊設計,包括下一代AMD Turin平臺和基于P核心的第六代英特爾至強處理器(原Granite Rapids)。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

四、從幾天縮至幾分鐘,NIM服務改變生成式AI模型部署方式

NVIDIA NIM推理微服務能將企業(yè)部署生成式AI應用的時間從幾天壓縮到幾分鐘。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

該服務提供了一種簡單、標準化的方式,通過經優(yōu)化的容器形式提供AI模型,可部署在云、數(shù)據(jù)中心或工作站上。

現(xiàn)在,全球2800萬開發(fā)者可下載NIM,從而輕松構建Copilot、聊天機器人等生成式AI應用。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

與未使用NIM相比,在NIM中運行Meta Llama 3-8B可產生高達3倍的生成式AI token。這有助于企業(yè)在相同計算基礎設施上大幅提高效率。

企業(yè)可使用NIM來運行用于生成文本、圖像和視頻、語音以及交互式數(shù)字人的應用。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

200家技術合作伙伴正在將NIM集成到他們的平臺中以加快生成式AI部署。

開發(fā)者可從Hugging Face上輕松訪問和運行Meta Llama 3模型的NIM服務。

“今天我們在Hugging Face上發(fā)布了全面優(yōu)化的Llama 3,”黃仁勛說,“你可以在任何云中運行它。下載該容器,并將其存入數(shù)據(jù)中心,然后就可以托管,并提供給客戶使用?!?/p>

ai.nvidia.com網站有超過40個英偉達及社區(qū)模型可作為NIM端點進行體驗,包括Databricks DBRX、谷歌開放模型Gemma、Meta Llama 3、微軟 Phi-3、Mistral Large、Mixtral 8x22B、Snowflake Arctic等。

黃仁勛相信未來每家公司都會有NIM agent,分別負責弄清任務、拆解子任務、執(zhí)行,通過分工協(xié)作完成任務。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

五、未來數(shù)字人會像人一樣交互,PC將是重要AI平臺

未來數(shù)字人會是什么樣?

黃仁勛展示了一段視頻,計算機可以像人一樣互動,比如用手機攝像頭掃過四周的環(huán)境,數(shù)字人就會做出判斷:“你似乎正在進行某種錄制或制作布景中?”

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

數(shù)字人將徹底改變客服、廣告、游戲行業(yè)。例如,你用手機掃描廚房后,數(shù)字人可以成為AI室內設計師,生成幾種設計選項并采購家具;數(shù)字人還可以成為AI客服代理、數(shù)字醫(yī)療工作者,或者成為AI品牌大使,引領營銷廣告新潮流。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

黃仁勛說,PC將成為非常重要的AI平臺,并發(fā)布4款新款RTX AI PC。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

英偉達在全球有1億臺GeForce RTX AI PC的用戶基礎,將通過200多款RTX AI筆記本電腦和500多款采用AI技術的應用和游戲來改變消費者的體驗。

RTX套件和為NVIDIA ACE數(shù)字人平臺新推出的基于PC的NIM推理微服務,將進一步提高AI的可訪問性。

英偉達還發(fā)布了搭載RTX的AI助手技術演示G-Assist項目,展示了針對PC游戲和應用的上下文感知輔助功能,相當于為玩家添加了一個能隨時咨詢攻略的游戲AI助手外掛。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

微軟和英偉達正在一起幫助開發(fā)者將新的生成式AI功能加入到Windows原生和Web應用程序中,使開發(fā)者能通過API工具來輕松訪問由RTX加速的SLM(小型語言模型)。

黃仁勛相信,未來PC將成為一個AI,會一直在后臺協(xié)助你,還將運行由AI增強的應用程序,并且能承載帶有數(shù)字人類的應用程序。

六、下一波AI浪潮是物理AI,人形機器人將被機器人工廠量產

接下來要做什么呢?

在黃仁勛看來,下一波AI浪潮是物理AI,即理解物理定律的AI。

物理AI是指能理解指令,并在現(xiàn)實世界中自主執(zhí)行復雜任務的模型。

今天大多數(shù)AI并不理解物理定律,不以物質世界為基礎。而生成圖像、視頻、3D圖形和許多物理現(xiàn)象,需要基于物理并理解物理定律的AI。

為我們工作的AI,必須理解世界模型,才能理解如何解釋世界、如何感知世界。多模態(tài)大語言模型的突破,它使機器人能夠學習、感知和理解周圍的世界,并計劃它們將如何行動。

從視頻中學習是一種途徑,另一種方法是合成、模擬數(shù)據(jù),還有利用計算機相互學習。如果AI數(shù)據(jù)是通過強化學習算法合成的,那么數(shù)據(jù)生成的速度將會持續(xù)變快,需要更大的GPU。

英偉達正在努力通過推進英偉達機器人軟件棧來加速生成物理AI,包括用于模擬應用的NVIDIA Omniverse平臺、Project GR00T人形機器人通用基礎模型和Jetson Thor機器人計算機。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

“機器人時代已經到來。”黃仁勛說,“AI的下一波浪潮已經到來。由實體AI驅動的機器人技術將徹底改變行業(yè)。這不是未來。這正在發(fā)生?!?/p>

他預言,總有一天,所有移動的東西都將是自主的,世界各地研究人員和公司都在開發(fā)由物理AI驅動的機器人,“機器人將遍布所有工廠。工廠將實現(xiàn)對機器人的統(tǒng)籌,這些機器人將制造新的機器人產品。”

黃仁勛相信,下一個將由機器人工廠生產的大批量機器人產品很可能是人形機器人

他現(xiàn)場展示了全球最大電子制造商鴻海集團(富士康如何利用NVIDIA Omniverse、Isaac和Metropolis創(chuàng)建其用于訓練機器人的復雜工廠數(shù)字孿生,以更高精度優(yōu)化工作流并降低成本。

Omniverse是機器人可以學習如何成為機器人的一個虛擬世界模擬開發(fā)平臺,結合了實時、基于物理的渲染、物理模擬和生成AI技術,能夠在虛擬環(huán)境中集成來自領先行業(yè)工具3D數(shù)據(jù)的平臺,幫助鴻海團隊優(yōu)化操作流程的設備布局,AI攝像頭通過NVIDIA? Metropolis監(jiān)控工人安全。

然后,鴻??梢允褂霉S數(shù)字孿生作為虛擬培訓環(huán)境來模擬、測試和驗證其基于NVIDIA Isaac Perceptor加速庫構建的自主移動機器人(AMR),以及由NVIDIA Isaac Manipulator AI模型提供支持的AI機器人機械臂。

黃仁勛自曝英偉達最強Rubin架構!數(shù)百萬GPU集群將至,人形機器人是未來

Isaac平臺采用模塊化設計,擁有一整套NVIDIA加速庫、AI基礎模型和仿真技術,今日起可供機器人制造商集成到其技術堆棧中,助力其提高工廠、倉庫和配送中心的工作效率。

比亞迪電子、西門子、泰瑞達、Alphabet旗下公司Intrinsic等全球十多家領先的機器人企業(yè)正在采用NVIDIA Isaac機器人平臺。

100多家公司正在采用Isaac Sim來仿真、測試和驗證機器人應用。Agility、波士頓動力公司、Figure AI、傅利葉智能、Sanctuary AI正在使用Isaac Lab。

黃仁勛說,英偉達將為每種類型的機器人系統(tǒng)創(chuàng)建平臺,包括機器人工廠和倉庫、用于操縱物體的機器人、移動機器人,以及人形機器人。

構建具有生成物理AI的機器人需要3臺計算機:NVIDIA AI超級計算機來訓練模型,NVIDIA Jetson-Orin和下一代Jetson-Thor機器人超級計算機來運行這些模型,機器人還需用Omniverse來在模擬世界中學習和完善技能。

結語:新一輪工業(yè)革命開始,英偉達力推新型數(shù)據(jù)中心

“新一輪工業(yè)革命已經開始。眾多企業(yè)和地區(qū)正在與英偉達合作推動價值萬億美元的傳統(tǒng)數(shù)據(jù)中心向加速計算轉型,并建造一種新型數(shù)據(jù)中心「AI工廠」來生產新的商品——AI。”黃仁勛說。

他回顧道:“過去12年,我們意識到計算的未來將發(fā)生根本性的變化,直到今天,這真的和我之前說的完全一樣,2012年前的GeForce和今天的英偉達,公司已經發(fā)生了巨大的變化。”

英偉達的路線圖將每年更新,其基本理念是“打造數(shù)據(jù)中心規(guī)模,以每年的節(jié)奏分步驟實現(xiàn)、并向客戶交付產品,在各領域實現(xiàn)技術突破”。

黃仁勛承諾不會止步于此,希望英偉達繼續(xù)提高性能、降低訓練和推理成本、擴展AI功能,讓每家公司都能接受。

本周,全球科技產業(yè)的目光將持續(xù)聚焦在中國臺北。AMD董事長兼CEO蘇姿豐、英特爾CEO基辛格、高通總裁兼CEO安蒙、恩智浦CTO Lars Reger、聯(lián)發(fā)科CEO蔡力行等芯片巨頭的高層都將在COMPUTEX發(fā)表演講,對這場科技盛會及其臺系合作伙伴表現(xiàn)出絕對的重視。