日韩免费中文字幕一区二区 ,亚洲中文字幕高清在线,蜜臀av一区在线观看

智東西（公眾號(hào)：zhidxcom）
作者 | 陳駿達(dá)
編輯 | 漠影

在剛剛過去的7月份，國產(chǎn)模型迎來一波重磅開源。與以往不同的是，本次國內(nèi)大模型玩家們開源模型的參數(shù)量成倍增長，達(dá)到數(shù)千億乃至萬億級(jí)別。這不僅顯著提升了國產(chǎn)模型的能力上限，也為各行業(yè)智能化轉(zhuǎn)型提供了新一代強(qiáng)大的智能基座。

然而，隨著模型體量不斷攀升，對(duì)應(yīng)的基礎(chǔ)設(shè)施正面臨前所未有的挑戰(zhàn)。傳統(tǒng)集群架構(gòu)在通信效率、I/O性能和系統(tǒng)擴(kuò)展性等方面逐漸暴露出瓶頸，已難以滿足當(dāng)前開源模型的部署需求。

在這樣的背景下，各類“超節(jié)點(diǎn)”方案應(yīng)運(yùn)而生。作為面向大模型的新一代基礎(chǔ)設(shè)施架構(gòu)，超節(jié)點(diǎn)通過在單系統(tǒng)內(nèi)部集成更多GPU資源，并顯著優(yōu)化節(jié)點(diǎn)間的通信性能，有效突破了傳統(tǒng)架構(gòu)在大規(guī)模分布式計(jì)算中的性能瓶頸。

昨日，浪潮信息正式發(fā)布了其面向萬億參數(shù)大模型的超節(jié)點(diǎn)AI服務(wù)器——“元腦SD200”。得益于浪潮信息自研的多主機(jī)低延遲內(nèi)存語義通信架構(gòu)，SD200在單機(jī)內(nèi)集成64路加速計(jì)算芯片，單機(jī)支持DeepSeek、Qwen、Kimi、GLM四大國產(chǎn)頂級(jí)開源模型同時(shí)運(yùn)行，以及多智能體實(shí)時(shí)協(xié)作與按需調(diào)用。

單機(jī)支持超萬億參數(shù)模型！浪潮信息發(fā)布超節(jié)點(diǎn)，給開源AI打造開放底座

浪潮信息一直是開放計(jì)算生態(tài)的積極推動(dòng)者，本次其此次推出的超節(jié)點(diǎn)方案采用了OCM+OAM的開放架構(gòu)設(shè)計(jì)，兼容多款本土GPU芯片與大部分主流AI框架，目前已率先實(shí)現(xiàn)商用。

在國產(chǎn)開源模型奮力追趕智能上限之際，浪潮信息的開放超節(jié)點(diǎn)，有望成為承載萬億參數(shù)模型的重要底座之一。

一、廠商競相追逐超節(jié)點(diǎn)，開放架構(gòu)需求凸顯

在探討“超節(jié)點(diǎn)”對(duì)行業(yè)所帶來的深遠(yuǎn)影響之前，我們有必要先厘清這一技術(shù)誕生的背景。

首先，模型規(guī)模的持續(xù)膨脹正在逼近現(xiàn)有硬件的承載極限。大模型加速邁向萬億參數(shù)規(guī)模，同時(shí)上下文長度不斷擴(kuò)展，直接推高了推理過程中的鍵值緩存（KV Cache）需求。顯存與帶寬，正成為壓在AI基礎(chǔ)設(shè)施之上的兩座大山。

與此同時(shí)，隨著大模型加速進(jìn)入千行百業(yè)，推理型負(fù)載成為主流計(jì)算模式，而推理是一種高度通信敏感的計(jì)算過程。以Qwen3-235B模型為例，若要實(shí)現(xiàn)100 tokens/s的解碼速度，單個(gè)token需完成多達(dá)188次的All-to-All通信，且每次通信的延遲必須控制在53微秒以內(nèi)。

更不容忽視的是，Agentic AI的興起正在進(jìn)一步拉高對(duì)計(jì)算系統(tǒng)的需求。具備自主規(guī)劃、多模態(tài)感知與連續(xù)執(zhí)行能力的智能體，在執(zhí)行任務(wù)時(shí)生成的token數(shù)量往往是傳統(tǒng)模型的數(shù)十倍甚至上百倍，動(dòng)輒需要處理數(shù)十萬乃至數(shù)百萬token。

算力基礎(chǔ)設(shè)施面臨的上述三大關(guān)鍵挑戰(zhàn)，使其走到升級(jí)重構(gòu)的臨界點(diǎn)。為了支撐萬億參數(shù)級(jí)模型的高效運(yùn)行，構(gòu)建高度集成、低延遲、高帶寬的Scale-Up（縱向擴(kuò)展）系統(tǒng)，即通過構(gòu)建一個(gè)更大的高速互連域、形成“超節(jié)點(diǎn)”，成為現(xiàn)實(shí)的技術(shù)選擇。

單機(jī)支持超萬億參數(shù)模型！浪潮信息發(fā)布超節(jié)點(diǎn)，給開源AI打造開放底座

通過構(gòu)建超低延遲的統(tǒng)一顯存空間，Scale-Up系統(tǒng)能將萬億級(jí)模型參數(shù)及激增的KV Cache整體容納于單一高速互連域內(nèi)，保障了多芯片間高效協(xié)同執(zhí)行，顯著減少跨節(jié)點(diǎn)通信開銷，從而大幅提升吞吐速度并降低通信延遲，實(shí)現(xiàn)降本增效。

AI算力需求側(cè)的變化，正驅(qū)動(dòng)供給側(cè)的廠商們爭相布局前沿的Scale Up方案。2024年，英偉達(dá)在GTC大會(huì)上提出SuperPod的概念；今年，國內(nèi)廠商的方案更是將超節(jié)點(diǎn)引入大眾視野。

當(dāng)前，業(yè)界在超節(jié)點(diǎn)技術(shù)方案的選擇上，存在多種路徑。在浪潮信息看來，超節(jié)點(diǎn)要根據(jù)客戶應(yīng)用需求來選擇技術(shù)路線，要給客戶提供更多算力方案的選擇，核心策略是“開放架構(gòu)”。

基于開放架構(gòu)設(shè)計(jì)的超節(jié)點(diǎn)，能夠支持多樣化芯片、開放AI框架及主流開發(fā)工具，在保障高性能、低延遲的同時(shí)，實(shí)現(xiàn)跨平臺(tái)的良好兼容與靈活擴(kuò)展，推動(dòng)AI基礎(chǔ)設(shè)施真正走向開放、可持續(xù)的發(fā)展路徑。

二、單機(jī)運(yùn)行四大開源模型，全面支持主流框架

昨日，浪潮信息在2025開放計(jì)算技術(shù)大會(huì)上正式發(fā)布元腦SD200超節(jié)點(diǎn)AI服務(wù)器。作為開放計(jì)算領(lǐng)域的重要風(fēng)向標(biāo)，該大會(huì)一向聚焦推動(dòng)算力基礎(chǔ)設(shè)施的開放與協(xié)同，而SD200正是這一理念的典型體現(xiàn)。

SD200基于OCM（開放算力模組）與OAM（開放加速模塊）兩大架構(gòu)打造。OCM標(biāo)準(zhǔn)由中國電子技術(shù)標(biāo)準(zhǔn)化研究院發(fā)起，浪潮信息、百度等18家算力產(chǎn)業(yè)上下游企業(yè)共同參與編制。

該架構(gòu)圍繞CPU和內(nèi)存進(jìn)行解耦設(shè)計(jì)，具備高度模塊化與標(biāo)準(zhǔn)化優(yōu)勢，支持系統(tǒng)供電、管理、風(fēng)扇等組件的獨(dú)立升級(jí)與更換，大幅提升了服務(wù)器的靈活性與可維護(hù)性。同時(shí)，OCM支持“一機(jī)多芯”，可快速適配Intel、AMD、ARM等多種計(jì)算平臺(tái)。

OAM則由開放計(jì)算項(xiàng)目（OCP）社區(qū)推動(dòng)，是專為高性能計(jì)算與AI加速場景設(shè)計(jì)的開放模塊標(biāo)準(zhǔn)。

該架構(gòu)統(tǒng)一了加速卡的尺寸、電氣接口和散熱設(shè)計(jì)，使來自不同廠商的GPU、NPU等AI加速器可在同一系統(tǒng)中協(xié)同運(yùn)行，并通過高速互聯(lián)技術(shù)實(shí)現(xiàn)加速卡之間的低延遲直連，有效滿足大模型訓(xùn)練與推理對(duì)帶寬的極致要求。

浪潮信息將OCM與OAM架構(gòu)有機(jī)融合，為業(yè)界提供了一種開放的超節(jié)點(diǎn)技術(shù)架構(gòu)。

不過，光有“開放”的特性，仍不足以讓一款開放超節(jié)點(diǎn)方案獲得廣泛采用，性能同樣至關(guān)重要。

在開放計(jì)算技術(shù)大會(huì)現(xiàn)場，浪潮信息副總經(jīng)理趙帥曬出了SD200超節(jié)點(diǎn)在真實(shí)部署環(huán)境下實(shí)現(xiàn)的性能。在經(jīng)過軟硬件的系統(tǒng)協(xié)同優(yōu)化后，SD200超節(jié)點(diǎn)滿機(jī)運(yùn)行DeepSeek R1全參模型推理性能提升比為370%，滿機(jī)運(yùn)行Kimi K2全參模型推理性能提升比為170%。

單機(jī)支持超萬億參數(shù)模型！浪潮信息發(fā)布超節(jié)點(diǎn)，給開源AI打造開放底座

SD200超節(jié)點(diǎn)配備高達(dá)4TB的顯存，能夠同時(shí)容納DeepSeek、Qwen、Kimi、GLM等多個(gè)旗艦級(jí)開源模型。趙帥稱，這樣的顯存配置具備前瞻性，不僅可滿足當(dāng)前萬億級(jí)模型的部署需求，甚至為未來可能出現(xiàn)的2萬億、3萬億參數(shù)模型預(yù)留了充足空間。

然而，在打造這一方案時(shí)，浪潮信息并未一味追求技術(shù)堆疊，而是更注重實(shí)際落地的可行性。正如浪潮信息趙帥在發(fā)布會(huì)后與智東西等媒體交流時(shí)所提到的——客戶的核心訴求是“能否快速部署、快速上業(yè)務(wù)、上應(yīng)用”。

基于這一判斷，SD200在使用便利性上進(jìn)行了優(yōu)化設(shè)計(jì)。例如，采用風(fēng)冷散熱，企業(yè)無需改造機(jī)房，即可靈活部署；在互連方案上，則選擇了更為成熟穩(wěn)健的全銅電互連，提升了系統(tǒng)穩(wěn)定性，同時(shí)降低了終端用戶的運(yùn)維復(fù)雜度和成本。

此外，SD200超節(jié)點(diǎn)還全面兼容當(dāng)前主流的開源大模型計(jì)算框架（如PyTorch，已支持2200+算子），可實(shí)現(xiàn)新模型的無縫遷移與“Day 0”上線，為企業(yè)構(gòu)建AI應(yīng)用提供了即開即用的基礎(chǔ)平臺(tái)。

三、軟硬協(xié)同優(yōu)化實(shí)現(xiàn)性能突破，揭秘開放超節(jié)點(diǎn)背后創(chuàng)新

這樣一套開放超節(jié)點(diǎn)方案背后，是浪潮信息在融合架構(gòu)和軟硬件協(xié)同方面長達(dá)十余年的深厚積累。

趙帥分享道，自2010年起，浪潮信息持續(xù)推進(jìn)融合架構(gòu)演進(jìn)，從最初的供電、散熱等非IT資源的整合，到存儲(chǔ)、網(wǎng)絡(luò)等資源池化，再到最新融合架構(gòu)3.0系統(tǒng)實(shí)現(xiàn)了計(jì)算、存儲(chǔ)、內(nèi)存、異構(gòu)加速等核心IT資源徹底解耦和池化。

這沉淀下來的芯片共享內(nèi)存數(shù)據(jù)、統(tǒng)一編址技術(shù)、池化、資源動(dòng)態(tài)調(diào)度等技術(shù)，在今天的超節(jié)點(diǎn)系統(tǒng)中得以延續(xù)和應(yīng)用，顯著提升了系統(tǒng)的適配速度與商用效率。

此外，浪潮信息并非單純的硬件廠商，其在大模型領(lǐng)域同樣具備深度布局——早在2021年即發(fā)布首個(gè)中文巨量模型“源1.0”，其參數(shù)規(guī)模達(dá)2457億，并持續(xù)在模型訓(xùn)練、推理優(yōu)化和軟硬件協(xié)同方面積累經(jīng)驗(yàn)。這些能力也為SD200這樣的超節(jié)點(diǎn)方案提供了堅(jiān)實(shí)基礎(chǔ)。

為突破萬億大模型的帶來的顯存壓力，SD200超節(jié)點(diǎn)基于浪潮信息自主研發(fā)的開放總線交換（Open Fabric Switch）技術(shù)，首創(chuàng)多主機(jī)三維網(wǎng)格系統(tǒng)架構(gòu)（3D Mesh）。在這一架構(gòu)下，64顆本土GPU能夠以高速、低延遲的方式實(shí)現(xiàn)互連。

更進(jìn)一步，SD200通過GPU虛擬映射等底層創(chuàng)新，解決了多主機(jī)環(huán)境下統(tǒng)一編址的難題，將顯存統(tǒng)一地址空間擴(kuò)增8倍，顯存容量達(dá)4TB，配合64TB系統(tǒng)內(nèi)存，為超大模型提供了充足的KV緩存資源。

這意味著，不論是在模型訓(xùn)練還是推理過程中，開發(fā)者都能像調(diào)用單機(jī)GPU一樣，靈活調(diào)度整個(gè)系統(tǒng)中的算力與顯存資源，極大簡化了工程復(fù)雜度。實(shí)測結(jié)果表明，在推理過程常見的小數(shù)據(jù)包通信場景中，全規(guī)約（All Reduce）性能表現(xiàn)優(yōu)異，顯著提升計(jì)算與通信效率。

在系統(tǒng)層面，浪潮信息圍繞萬億參數(shù)大模型計(jì)算密集、通信敏感的特性，構(gòu)建起一整套軟硬協(xié)同優(yōu)化的系統(tǒng)方案，將64卡超節(jié)點(diǎn)的算力潛能釋放到極致。

單機(jī)支持超萬億參數(shù)模型！浪潮信息發(fā)布超節(jié)點(diǎn)，給開源AI打造開放底座

一方面，浪潮信息開發(fā)了智能總線管理系統(tǒng)，可實(shí)現(xiàn)超節(jié)點(diǎn)64卡全局最優(yōu)路由的自動(dòng)創(chuàng)建與管理。該系統(tǒng)不僅支持靈活拓?fù)淝袚Q，還能根據(jù)業(yè)務(wù)負(fù)載動(dòng)態(tài)進(jìn)行資源切分與調(diào)度，為不同類型的大模型任務(wù)提供定制化的算力編排能力。

針對(duì)All Reduce、All Gather等典型通信算子的不同數(shù)據(jù)包規(guī)模，系統(tǒng)設(shè)計(jì)了細(xì)粒度、多層級(jí)的通信策略，進(jìn)一步壓縮通信路徑的延遲。

此外，SD200還引入了開放的PD分離框架，將預(yù)填充-解碼（Prefill-Decoder）環(huán)節(jié)解耦，支持異步KV Cache高效傳輸，并允許針對(duì)不同模型并行需求制定差異化策略，兼顧性能與兼容性。這一設(shè)計(jì)不僅提升了系統(tǒng)性能，也保障了對(duì)多元算力架構(gòu)的適配能力，加強(qiáng)了計(jì)算與通信之間的協(xié)同優(yōu)化。

通過軟硬協(xié)同系統(tǒng)創(chuàng)新，SD200成功實(shí)現(xiàn)了縱向擴(kuò)展，幫助本土AI芯片突破了性能邊界，在大模型場景中展示出優(yōu)異的性能表現(xiàn)。

結(jié)語：開放超節(jié)點(diǎn)，帶動(dòng)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新

在趙帥的分享中，智東西感受到了浪潮信息對(duì)“以應(yīng)用為導(dǎo)向”的堅(jiān)持。作為系統(tǒng)廠商，他們與終端客戶的距離更近，也更能體會(huì)到實(shí)際應(yīng)用場景的痛點(diǎn)。也因此，趙帥稱，超節(jié)點(diǎn)架構(gòu)本質(zhì)上是系統(tǒng)化思維的產(chǎn)物，它不是某一個(gè)點(diǎn)的突破，而是在現(xiàn)有技術(shù)、生態(tài)和成本約束下，從系統(tǒng)層面去打破芯片本身的性能邊界，最大化用戶價(jià)值。

超節(jié)點(diǎn)的發(fā)展也為中國本土產(chǎn)業(yè)鏈提供了發(fā)展機(jī)遇——高速連接器、線纜、板材、電源等上下游產(chǎn)業(yè)鏈廠商，都有望這個(gè)過程中找到屬于自己的突破點(diǎn)。這不僅能加速成本下降和技術(shù)普惠，更推動(dòng)了智能基礎(chǔ)設(shè)施的“平權(quán)化”。

放眼未來，趙帥認(rèn)為，AI數(shù)據(jù)中心正從“機(jī)柜級(jí)密度革命”邁向“數(shù)據(jù)中心級(jí)系統(tǒng)工程挑戰(zhàn)”，算力密度將持續(xù)攀升，能源供給、冷卻方式和系統(tǒng)管理也隨之進(jìn)入全面革新期。

從芯片到架構(gòu)，從系統(tǒng)到生態(tài)，技術(shù)演進(jìn)注定不會(huì)是一條單線道路，而是多路徑的協(xié)同創(chuàng)新。在這場關(guān)于未來的集體奔赴中，唯有持續(xù)開放、擁抱合作，才能構(gòu)筑真正普惠、可持續(xù)的智能算力基石。

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、廠商競相追逐超節(jié)點(diǎn)，開放架構(gòu)需求凸顯

二、單機(jī)運(yùn)行四大開源模型，全面支持主流框架

三、軟硬協(xié)同優(yōu)化實(shí)現(xiàn)性能突破，揭秘開放超節(jié)點(diǎn)背后創(chuàng)新

結(jié)語：開放超節(jié)點(diǎn)，帶動(dòng)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新

相關(guān)推薦

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、廠商競相追逐超節(jié)點(diǎn)，開放架構(gòu)需求凸顯

二、單機(jī)運(yùn)行四大開源模型，全面支持主流框架

三、軟硬協(xié)同優(yōu)化實(shí)現(xiàn)性能突破，揭秘開放超節(jié)點(diǎn)背后創(chuàng)新

結(jié)語：開放超節(jié)點(diǎn)，帶動(dòng)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新

相關(guān)推薦

一、廠商競相追逐超節(jié)點(diǎn)，開放架構(gòu)需求凸顯

二、單機(jī)運(yùn)行四大開源模型，全面支持主流框架

三、軟硬協(xié)同優(yōu)化實(shí)現(xiàn)性能突破，揭秘開放超節(jié)點(diǎn)背后創(chuàng)新

結(jié)語：開放超節(jié)點(diǎn)，帶動(dòng)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新