男人的天堂2023最新网址,人人妻人人澡人人爽蜜桃,第一区第二区在线观看视频

芯東西（公眾號(hào)：aichip001）
作者 | ?ZeR0
編輯 | ?漠影

芯東西2月25日?qǐng)?bào)道，2月24日，由兩位前谷歌工程師創(chuàng)辦的美國(guó)AI芯片創(chuàng)企MatX宣布完成5億美元（約合人民幣34億元）B輪融資，其大模型芯片MatX One預(yù)計(jì)一年內(nèi)完成流片。

據(jù)外媒報(bào)道，MatX透露其目前的估值已達(dá)數(shù)十億美元，也就是已躋身獨(dú)角獸行列。

MatX宣稱MatX One能實(shí)現(xiàn)遠(yuǎn)超其他芯片的吞吐量，同時(shí)延遲也最低。這款芯片基于可分割的脈動(dòng)陣列，兼具大型脈動(dòng)陣列出色的能效和面積效率，同時(shí)在小型矩陣上也能實(shí)現(xiàn)高利用率。

據(jù)MatX披露，該芯片結(jié)合了SRAM優(yōu)先設(shè)計(jì)的低延遲和HBM的長(zhǎng)上下文支持。這些特性加上對(duì)數(shù)值計(jì)算的新詮釋，使其在大語(yǔ)言模型上的吞吐量高于任何已發(fā)布的系統(tǒng)，同時(shí)延遲與SRAM優(yōu)先設(shè)計(jì)相當(dāng)。

MatX的測(cè)試表明，根據(jù)每平方毫米的計(jì)算性能指標(biāo)，其規(guī)劃芯片的性能可以超越英偉達(dá)即將推出的Rubin Ultra。

2022年，MatX由Reiner Pope和Mike Gunter創(chuàng)辦，目標(biāo)打造一款最適合大語(yǔ)言模型的芯片。

Reiner Pope曾為谷歌的芯片和AI模型開發(fā)軟件，Mike Gunter曾是谷歌TPU的硬件工程師。

如今，MatX的團(tuán)隊(duì)規(guī)模已發(fā)展到約100人。

由前OpenAI研究員Leopold Aschenbrenner創(chuàng)立的投資公司Situational Awareness與Jane Street領(lǐng)投了MatX的B輪融資。

在Aschenbrenner看來，MatX的芯片非常適合處理預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)，“它很有可能成為這一代最重要的AI芯片公司?！?/p>

前特斯拉AI總監(jiān)、OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy，以及Alchip、Marvell等供應(yīng)鏈上的投資者也參與了本輪融資。

Andrej Karpathy在社交平臺(tái)上分享了他參投MatX的想法。

融資34億！新晉AI芯片獨(dú)角獸誕生

他認(rèn)為，token需求激增，為大語(yǔ)言模型的底層內(nèi)存和計(jì)算資源的合理配置提供了絕佳機(jī)會(huì)。一個(gè)根本且不易察覺的限制是，受限于芯片制造工藝，內(nèi)存池會(huì)分為兩個(gè)完全不同的池（物理實(shí)現(xiàn)方式也不同）：1）緊鄰計(jì)算單元的片上SRAM，速度極快但容量極低；2）片外DRAM容量很大，但內(nèi)容難獲取。

此外，還有許多架構(gòu)細(xì)節(jié)（例如脈動(dòng)陣列）、數(shù)值計(jì)算等因素需要考慮。如何設(shè)計(jì)最優(yōu)的物理基礎(chǔ)架構(gòu)，并在大語(yǔ)言模型的核心工作流程（推理預(yù)填充/解碼、訓(xùn)練/微調(diào)等）中合理配置內(nèi)存和計(jì)算資源，以實(shí)現(xiàn)最佳吞吐量/延遲/成本比，這或許是當(dāng)今最具吸引力且回報(bào)最高的智力難題之一。

“這一切都是為了快速、低成本地獲取大量token?？梢哉f，最重要的工作流程（在緊湊的智能體循環(huán)中對(duì)長(zhǎng)token上下文進(jìn)行推理解碼）是目前兩種陣營(yíng)（HBM優(yōu)先的英偉達(dá)陣營(yíng)和SRAM優(yōu)先的Cerebras陣營(yíng)）最難同時(shí)實(shí)現(xiàn)的?！盞arpathy寫道。

官網(wǎng)顯示，對(duì)于大型100層MoE模型，MatX的AI芯片每秒可輸出超過2000個(gè)token，其橫向擴(kuò)展互連能力可支持包含數(shù)十萬(wàn)張芯片的集群。

融資34億！新晉AI芯片獨(dú)角獸誕生

當(dāng)前，英偉達(dá)和谷歌的AI芯片都主要依賴HBM來處理訓(xùn)練AI模型所需的大量計(jì)算。還有一些芯片公司采用靜態(tài)隨機(jī)存取存儲(chǔ)器（SRAM）來更快地處理單個(gè)用的查詢，以滿足日益增長(zhǎng)的推理需求。

“我們的立場(chǎng)是，實(shí)際上可以在同一個(gè)產(chǎn)品中同時(shí)實(shí)現(xiàn)這兩點(diǎn)，而且這樣會(huì)得到一個(gè)更好的產(chǎn)品?！盡atX創(chuàng)始人兼CEO Reiner Pope談道。

他在社交平臺(tái)X上回復(fù)網(wǎng)友說：“與其他HBM廠商不同，我們擁有足夠的SRAM和互連帶寬，足以支持將權(quán)重存儲(chǔ)在SRAM中。HBM中的key值對(duì)不會(huì)增加延遲，因?yàn)槊芗x取可以預(yù)取，而稀疏讀取的數(shù)據(jù)量很小。除了內(nèi)存系統(tǒng)之外，我們還擁有最高的FLOPS/mm2?！?/p>

據(jù)外媒報(bào)道，MatX預(yù)計(jì)在今年完成芯片的最終設(shè)計(jì)，并希望在2027年開始出貨。該公司計(jì)劃與臺(tái)積電合作生產(chǎn)該產(chǎn)品。

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

相關(guān)推薦