智東西(公眾號(hào):zhidxcom)
作者 | 心緣
編輯 | 漠影

自文明誕生起,人類一直在尋求能夠更加有效存儲(chǔ)信息的方式。

從遠(yuǎn)古時(shí)代用結(jié)繩計(jì)數(shù),到在木板、石塊、紙本上記錄文字,再到數(shù)字存儲(chǔ)技術(shù)誕生,唱片、磁帶、光盤、硬盤、閃存等風(fēng)靡于世,每一輪存儲(chǔ)介質(zhì)的更新?lián)Q代,都會(huì)開啟新的市場(chǎng)機(jī)遇之門。

如今,創(chuàng)新帷幕再度拉開,被寄予打破“內(nèi)存墻”限制、突破功耗瓶頸的存算一體芯片技術(shù),在后摩爾時(shí)代拔地而起。

這在楊越眼中,是任何一次底層的技術(shù)革新都可能難遇的人生機(jī)會(huì),可能每隔10年乃至更長(zhǎng)時(shí)間,才會(huì)出現(xiàn)一次。

嗅到這一風(fēng)向,2021年2月,一家領(lǐng)域?qū)<壹Y(jié)的初創(chuàng)公司蘋芯科技正式起航。

其核心團(tuán)隊(duì)技術(shù)背景深厚:由新型存儲(chǔ)器及人工智能(AI)芯片領(lǐng)域知名學(xué)者、杜克大學(xué)電子與計(jì)算機(jī)工程系正教授、IEEE/ACM Fellow陳怡然,以及覆蓋軟硬件設(shè)計(jì)的技術(shù)專家楊越、章堯君、許振隆組成。

陳怡然和楊越是清華大學(xué)校友,陳怡然畢業(yè)于電子系,楊越畢業(yè)于自動(dòng)化系,章堯君是陳怡然的首位博士畢業(yè)生,許振隆曾在臺(tái)積電任職多年。

在創(chuàng)始團(tuán)隊(duì)光環(huán)加持下,蘋芯科技從公開露面至今一直備受業(yè)界關(guān)注。就在本周,這家創(chuàng)企剛剛完成新一輪千萬(wàn)級(jí)美元融資,此前它已經(jīng)完成三款存算一體芯片的流片,其科研成果還入選了今年舉辦的固態(tài)電路頂會(huì)ISSCC 2022。

蘋芯科技聯(lián)合創(chuàng)始人兼CEO楊越告訴智東西,蘋芯除了目前三款I(lǐng)P芯片,今年下半年將有一款面向端側(cè)低功耗應(yīng)用的完整SoC流片,并以此規(guī)劃打造完整智能感知決策系統(tǒng),這顆SoC芯片將具備語(yǔ)音處理、人臉檢測(cè)等多模態(tài)功能,用于完成系統(tǒng)商業(yè)化落地的目標(biāo)。

一、清華“90師兄弟組隊(duì)創(chuàng)業(yè),要革傳統(tǒng)計(jì)算體系的命

在清華園求學(xué)的那段時(shí)光,楊越和陳怡然并無(wú)交集,也不會(huì)想到多年以后,這位比自己大4屆的師兄將在美國(guó)斯坦福大學(xué)旁的餐館里,向自己發(fā)起組隊(duì)創(chuàng)業(yè)的邀請(qǐng)。

1998年,楊越被保送進(jìn)入清華自動(dòng)化系,正值陳怡然學(xué)完本科課程、開啟碩士學(xué)業(yè)。三年后,陳怡然赴美國(guó)普度大學(xué)讀博士,期間索尼的一篇論文,給了他研發(fā)非易失性存儲(chǔ)器技術(shù)的靈感。

楊越在清華讀完書,又到加拿大多倫多大學(xué)計(jì)算機(jī)工程系攻讀博士,開始接觸存儲(chǔ)相關(guān)技術(shù),側(cè)重研究軟件方向。

另一邊,畢業(yè)后的陳怡然選擇先進(jìn)入工業(yè)界歷練一番。他曾在新思科技、希捷等芯片和存儲(chǔ)名企做研發(fā),早在2009年已經(jīng)開始探索用非易失性存儲(chǔ)器做神經(jīng)網(wǎng)絡(luò)加速。后來(lái)他轉(zhuǎn)向?qū)W術(shù)界,2010年加入美國(guó)匹茲堡大學(xué),后加入美國(guó)杜克大學(xué)電子與計(jì)算機(jī)工程系,長(zhǎng)期潛心科研。

值得一提的是,因?qū)π滦痛鎯?chǔ)器、神經(jīng)擬態(tài)計(jì)算及深度學(xué)習(xí)加速等方面的學(xué)術(shù)貢獻(xiàn),陳怡然教授當(dāng)選了IEEE和ACM雙料Fellow。迄今他已發(fā)表近500篇論文,獲得8次國(guó)際會(huì)議和研討會(huì)的最佳論文獎(jiǎng)、1次最佳海報(bào)獎(jiǎng)和14次最佳論文提名,在存儲(chǔ)及AI計(jì)算研究領(lǐng)域聲名遠(yuǎn)揚(yáng)。

楊越則在存儲(chǔ)行業(yè)持續(xù)沉淀,先是博士期間參與創(chuàng)辦一家固態(tài)硬盤(SSD)公司,并主要負(fù)責(zé)整個(gè)軟件的開發(fā)測(cè)試;后來(lái)于2019年初到美國(guó)存儲(chǔ)芯片巨頭美光科技的3D XPoint組做首席系統(tǒng)架構(gòu)師),其團(tuán)隊(duì)研發(fā)的前沿存儲(chǔ)硬盤3D XPoint X100,性能比傳統(tǒng)SSD快了1000倍。

“清華幫”組隊(duì)創(chuàng)業(yè),要打破芯片能效天花板,對(duì)話蘋芯科技CEO▲楊越

就在他們專注于各自工作時(shí),信息產(chǎn)業(yè)掀起一股新的巨浪——自2016年AI系統(tǒng)AlphaGo首次擊敗世界圍棋冠軍起,AI浪潮開始席卷全球,各類AI芯片如雨后春筍般破土而出。

彼時(shí),傳統(tǒng)的馮·諾依曼計(jì)算機(jī)體系架構(gòu),是大多數(shù)AI芯片的根基。但這類架構(gòu)存在一大局限性:不必要的功耗浪費(fèi)太多了

對(duì)于動(dòng)輒處理海量數(shù)據(jù)的AI計(jì)算來(lái)說(shuō),這種局限性日益顯得捉襟見肘。該體系下,計(jì)算單元與存儲(chǔ)單元完全分離,數(shù)據(jù)在兩者之間頻繁搬運(yùn),造成額外的延時(shí)和能耗開銷。讀寫一次內(nèi)存數(shù)據(jù)的能耗,甚至?xí)扔?jì)算一次數(shù)據(jù)的能耗多幾百倍。

當(dāng)摩爾定律逼近極限,傳統(tǒng)架構(gòu)的芯片性能“天花板”近在咫尺,要做到10倍乃至100倍的性能提升,必須實(shí)現(xiàn)架構(gòu)層面的顛覆式創(chuàng)新。

存內(nèi)計(jì)算技術(shù),作為極具潛力的AI芯片未來(lái)方向,終于從幕后走到臺(tái)前。

隨著新型存儲(chǔ)器和AI硬件兩大技術(shù)潮流交匯,計(jì)算與存儲(chǔ)之間的界限變得模糊,一個(gè)史無(wú)前例的時(shí)代機(jī)遇,擺在了陳怡然、楊越等人的眼前——基于存內(nèi)計(jì)算的底層架構(gòu)創(chuàng)新,將是一條AI計(jì)算的通途。

二、我們不想做第1001AI芯片公司

在斯坦福大學(xué)旁邊,陳怡然跟楊越一起吃了頓飯,聊起創(chuàng)辦存算一體AI芯片公司的想法。

兩人一拍即合,楊越覺得,這非常符合他對(duì)新興事物的追求,他相信存內(nèi)計(jì)算的技術(shù)路線能將整個(gè)芯片系統(tǒng)的性能提上一個(gè)新的臺(tái)階。

顧名思義,存內(nèi)計(jì)算方法用存儲(chǔ)器做計(jì)算,從根本上解決時(shí)延、功率等方面的損耗,打破了“內(nèi)存墻”、“功耗墻”的瓶頸,因此能做到數(shù)量級(jí)程度地提升相關(guān)的計(jì)算效率、能效比等核心指標(biāo)。

再加上當(dāng)前AI深度學(xué)習(xí)算法涉及大量矩陣乘加運(yùn)算,這些矩陣擺放數(shù)據(jù)的方式與數(shù)據(jù)在內(nèi)存中的存放方式相似,用存儲(chǔ)器做AI計(jì)算加速的思路日漸成熟,各路資本也紛至沓來(lái),爭(zhēng)相下注。

此時(shí)不創(chuàng)業(yè),更待何時(shí)?

另外兩位技術(shù)大牛也決定和陳怡然、楊越組隊(duì)“干大事”。

一位是章堯君,他畢業(yè)于上海交通大學(xué),后在匹茲堡大學(xué)電子工程系讀博士,師從陳怡然教授,他已在新型存儲(chǔ)器領(lǐng)域工作十年,曾設(shè)計(jì)開發(fā)多款MRAM商用芯片。

另一位是許振隆,他本碩畢業(yè)于中國(guó)臺(tái)灣新竹清華大學(xué),多年任職于臺(tái)積電,擁有逾

20年芯片設(shè)計(jì)經(jīng)驗(yàn),曾帶領(lǐng)團(tuán)隊(duì)成功交付多款量產(chǎn)芯片。

當(dāng)時(shí)參與規(guī)劃組建這個(gè)團(tuán)隊(duì)的,還有同為清華校友、現(xiàn)任清華大學(xué)電子工程系系主任的汪玉教授。汪玉曾參與創(chuàng)辦國(guó)內(nèi)明星AI芯片企業(yè)深鑒科技,后來(lái)該公司被全球FPGA龍頭賽靈思收購(gòu),他與楊越還是高中同窗。

就這樣,2021年2月,蘋芯科技呱呱墜地。

存內(nèi)計(jì)算的英文是「Processing in memory」,縮寫為PIM,蘋芯科技的英文名「PIMCHIP」便由此而來(lái)。“蘋芯”的“蘋”,即是PIM的諧音。

蘋芯創(chuàng)始團(tuán)隊(duì)兵分兩路,陳怡然教授作為董事長(zhǎng)總攬全局,CEO楊越和CTO章堯君在北京搭建起蘋芯的初始團(tuán)隊(duì),負(fù)責(zé)整個(gè)系統(tǒng)的研發(fā);許振隆則帶隊(duì)負(fù)責(zé)搭建存內(nèi)計(jì)算的內(nèi)核。

“我們不想做第1001家AI芯片公司?!绷钠饎?chuàng)業(yè)初心,楊越希望在AI時(shí)代背景下,將蘋芯科技發(fā)展成為非馮·諾依曼架構(gòu)新計(jì)算范式的引領(lǐng)者。

在他看來(lái),用一個(gè)新的技術(shù)去解決一個(gè)舊的問題,這沒什么意思,存算一體的使命不只是為了迎合市場(chǎng)需求,而應(yīng)該去開辟一些新的戰(zhàn)場(chǎng),這才是創(chuàng)新技術(shù)的長(zhǎng)遠(yuǎn)價(jià)值所在。

“我們更多思考的是,在人工智能時(shí)代里面,關(guān)注的點(diǎn)到底是什么。你要去做1001家AI芯片公司,還是去為一個(gè)之前沒有智能化的公司完成智能化轉(zhuǎn)型,哪一個(gè)對(duì)我們來(lái)說(shuō)是更有意義的?”

三、創(chuàng)業(yè)半年,SRAM存內(nèi)計(jì)算加速器測(cè)試成功

什么對(duì)蘋芯是更有意義的?

為了回答這個(gè)問題,蘋芯團(tuán)隊(duì)走訪了很多客戶,了解對(duì)方的痛點(diǎn)、對(duì)技術(shù)的要求,以及能利用技術(shù)實(shí)現(xiàn)什么核心價(jià)值。

“我們一直對(duì)技術(shù)抱有敬畏之心,在戰(zhàn)略層面沿著先做技術(shù)、再做平臺(tái)、然后做產(chǎn)品的思路,發(fā)展過(guò)程中幾條腿同時(shí)走路?!睏钤较嘈疟绕鹋c巨頭狹路相逢,初創(chuàng)公司的機(jī)會(huì)更多是在細(xì)分領(lǐng)域中,能夠快速迭代,了解新領(lǐng)域的know-how,快速滿足用戶的剛需。

令楊越很有成就感的是,蘋芯的團(tuán)隊(duì)氛圍非常融洽。“我能感覺到大家每天都是非常希望來(lái)上班的,工作目標(biāo)、職業(yè)規(guī)劃都制定得很清晰?!?/p>

在他眼中,這是一群特別靠譜的工作伙伴。

作為一家初創(chuàng)公司,蘋芯必須保持很快的流片節(jié)奏。第二款芯片流片測(cè)試完成后,大家非常淡定,出去吃了頓簡(jiǎn)單的慶功宴,便馬不停蹄地開始推進(jìn)下一個(gè)研發(fā)任務(wù)。

2021年9月7日,蘋芯科技宣布其基于SRAM架構(gòu)的存內(nèi)計(jì)算加速器S200已經(jīng)測(cè)試成功。它可以將深度學(xué)習(xí)算法中占主導(dǎo)的基本運(yùn)算在存儲(chǔ)器內(nèi)完成,能大幅提升計(jì)算效率,并能完成無(wú)損精度的運(yùn)算。蘋芯團(tuán)隊(duì)稱,這款加速器「首次將商用存內(nèi)計(jì)算帶入28nm時(shí)代」。

“清華幫”組隊(duì)創(chuàng)業(yè),要打破芯片能效天花板,對(duì)話蘋芯科技CEO▲S200芯片性能參數(shù)概覽

該成果還發(fā)表在有“固態(tài)電路領(lǐng)域奧林匹克”之稱的芯片頂會(huì)ISSCC 2022上。其32Kb無(wú)ADC架構(gòu)SRAM存內(nèi)計(jì)算加速單元基于28nm工藝搭建模塊,能效比高達(dá)27.38TOPS/W INT8,同時(shí)實(shí)現(xiàn)1.041Mb/mm2的高面效比。

而在同等條件下,世界上多數(shù)加速器測(cè)試結(jié)果,通常介于2-3TOPS/W之間。

足足將能效比提升10倍,蘋芯是怎么做到的?

四、兩大技術(shù)優(yōu)勢(shì),三個(gè)未來(lái)目標(biāo)

蘋芯的存內(nèi)計(jì)算加速器S200有兩大技術(shù)優(yōu)勢(shì):28nm工藝和全數(shù)字化設(shè)計(jì)

楊越說(shuō),選擇28nm是綜合考慮的決定。先進(jìn)節(jié)點(diǎn)固然能帶來(lái)更高性能,但也意味著更高的流片和量產(chǎn)成本,這與端側(cè)芯片對(duì)成本的苛刻要求相矛盾。28nm則相對(duì)成本更低,同時(shí)也能展現(xiàn)出SRAM向高級(jí)制程節(jié)點(diǎn)兼容性好的優(yōu)勢(shì)。

此外,多家晶圓代工廠具備28nm制造能力,在供給產(chǎn)能方面更加穩(wěn)定和充裕。

S200的另一重優(yōu)勢(shì),是全數(shù)字化設(shè)計(jì)。

以前存內(nèi)計(jì)算芯片主要是模擬芯片,優(yōu)勢(shì)是能效高,但會(huì)犧牲一定精度。而蘋芯研發(fā)的無(wú)ADC架構(gòu)SRAM存內(nèi)計(jì)算加速單元,不僅能保障精度,能效性也能做到更加領(lǐng)先。除了整型數(shù)據(jù)的支持外,楊越提到浮點(diǎn)數(shù)據(jù)也在蘋芯的技術(shù)支持范圍內(nèi),處于持續(xù)優(yōu)化驗(yàn)證的過(guò)程中。

“清華幫”組隊(duì)創(chuàng)業(yè),要打破芯片能效天花板,對(duì)話蘋芯科技CEO▲蘋芯科技存算一體AI芯片實(shí)物照片

軟件研發(fā)同樣是AI芯片公司的戰(zhàn)略重心。

據(jù)楊越觀察,端側(cè)客戶相對(duì)沒那么關(guān)心芯片底層設(shè)計(jì),他們更在乎端側(cè)芯片的實(shí)際表現(xiàn),包括性能、成本以及好不好用,有三種常見訴求:一是易用性,即上手不費(fèi)勁;二是可定制性,客戶可能有自己的算子,有二次開發(fā)需求;三是可擴(kuò)展性,當(dāng)硬件計(jì)算能力升級(jí),軟件不能成為瓶頸。

蘋芯也非常重視軟硬件協(xié)同工作,定義有自己的指令集,并圍繞上述訴求展開研發(fā),既支持做定制,又顧及升級(jí)至數(shù)百TOPS板卡時(shí)的支持。楊越透露說(shuō),蘋芯還在做Turnkey方案的準(zhǔn)備。

為了公司能夠堅(jiān)持自有發(fā)展戰(zhàn)略規(guī)劃的實(shí)施,蘋芯在初期客戶與合作伙伴的選擇上非常慎重,除了發(fā)展理念的契合,還會(huì)考慮客戶業(yè)務(wù)需求面臨的痛點(diǎn)是否主要由傳統(tǒng)馮·諾依曼架構(gòu)的瓶頸導(dǎo)致?,F(xiàn)階段,他們希望能通過(guò)更多實(shí)踐,能夠充分展現(xiàn)存內(nèi)計(jì)算技術(shù)的優(yōu)勢(shì),讓這一先進(jìn)技術(shù)能夠真正扎根于實(shí)際應(yīng)用,并拓展更寬廣的未來(lái)。

談及未來(lái)三年目標(biāo),楊越說(shuō),首先是實(shí)現(xiàn)落地,二是繼續(xù)鞏固蘋芯在SRAM存內(nèi)計(jì)算方向的領(lǐng)先地位,三是在新型存儲(chǔ)器研發(fā)方面有所突破。

“我們要維護(hù)蘋芯本身的技術(shù)先進(jìn)性和領(lǐng)先性,因此不管在SRAM還是新型存儲(chǔ)器方向,我們都在持續(xù)進(jìn)行著最前沿的探索?!睏钤秸f(shuō)。

五、探索打開高能效計(jì)算之門的金鑰匙

在楊越看來(lái),存算一體AI芯片公司直面的競(jìng)爭(zhēng)對(duì)手不是彼此,而是那些傳統(tǒng)的AI芯片公司。

“我覺得市場(chǎng)并沒有進(jìn)入同質(zhì)化競(jìng)爭(zhēng)的階段?!彼劦?,“更重要的是大家要擰成一股繩,把存內(nèi)計(jì)算技術(shù)的先進(jìn)性和可落地性展現(xiàn)出來(lái)?!?/p>

相較傳統(tǒng)AI芯片,存算一體AI芯片的挑戰(zhàn)會(huì)更加寬泛。存內(nèi)計(jì)算本身是一門技術(shù)壁壘森嚴(yán)的設(shè)計(jì)方法學(xué),需要多年經(jīng)驗(yàn)積累、大量資源以及時(shí)間投入才能實(shí)現(xiàn)。也正因此,過(guò)去六年,存算一體AI芯片創(chuàng)業(yè)幾乎均由技術(shù)專家主導(dǎo)。

“清華幫”組隊(duì)創(chuàng)業(yè),要打破芯片能效天花板,對(duì)話蘋芯科技CEO▲國(guó)內(nèi)在研存算一體AI芯片的企業(yè)(智東西制表)

當(dāng)前存算一體AI芯片創(chuàng)業(yè)呈多元化趨勢(shì),有模擬芯片與數(shù)字芯片之分,有NOR Flash、ReRAM、SRAM、MRAM等不同新型存儲(chǔ)器。其目標(biāo)市場(chǎng)也各不相同,從可穿戴設(shè)備、智能家居、視頻監(jiān)控到智能駕駛、云端數(shù)據(jù)中心應(yīng)有盡有。

這種“各自為政”的特點(diǎn),使存算一體很難出現(xiàn)一個(gè)統(tǒng)一的編程標(biāo)準(zhǔn),大家都是針對(duì)自己的應(yīng)用場(chǎng)景和性能目標(biāo),各建各的軟件棧。無(wú)論選擇小算力還是大算力應(yīng)用,企業(yè)都得摸著石頭過(guò)河。

考慮到現(xiàn)階段的實(shí)際情況與技術(shù)發(fā)展的現(xiàn)實(shí)規(guī)律,蘋芯團(tuán)隊(duì)選擇先在小算力上完成全技術(shù)通路和商業(yè)通路,積累更多能力后,再將算力做大。

“清華幫”組隊(duì)創(chuàng)業(yè),要打破芯片能效天花板,對(duì)話蘋芯科技CEO▲當(dāng)前主流AI芯片設(shè)計(jì)對(duì)比(智東西制表)

之所以選擇SRAM來(lái)完成技術(shù)驗(yàn)證與落地,蘋芯團(tuán)隊(duì)主要出于四點(diǎn)考慮:

一是SRAM在存儲(chǔ)器歷史長(zhǎng)河中長(zhǎng)期存在,技術(shù)相對(duì)成熟,穩(wěn)定性和良率都有保障;二是它具備先進(jìn)節(jié)點(diǎn)的兼容性,客戶從65nm升級(jí)到16nm,能保證繼續(xù)使用;三是在開發(fā)接口方面比非易失性存儲(chǔ)器更簡(jiǎn)單;四是非常短的讀寫延遲和無(wú)限次的in-place擦寫次數(shù)。

盡管SRAM屬于易失性存儲(chǔ)器,掉電后數(shù)據(jù)就丟了,但AI實(shí)際應(yīng)用很少出現(xiàn)按分按秒的頻繁斷電情形,否則這對(duì)計(jì)算體系結(jié)構(gòu)的其他部分傷害很大,是一個(gè)應(yīng)該主要規(guī)避的問題。

楊越認(rèn)為,無(wú)論從算力還是落地容易程度來(lái)看,SRAM最先可能在端側(cè)取得較大規(guī)模的產(chǎn)業(yè)化。

AI時(shí)代的終端及邊緣計(jì)算需求日益旺盛。如果所有計(jì)算都傳至云端處理,傳輸過(guò)程會(huì)造成時(shí)延;此外,很多用戶不愿意將自己的隱私數(shù)據(jù)上傳至云端,AI計(jì)算本地化的需求正在興起。這對(duì)AI芯片帶來(lái)新的要求——更高效率、更低功耗,而基于SRAM的存算一體方法恰恰擅長(zhǎng)于此。

“每一個(gè)SRAM的內(nèi)核能夠做到多少絕對(duì)算力,我們非常清楚?!睏钤秸f(shuō),芯片的算力、面積、效率等基礎(chǔ)指標(biāo)互相牽制。如果想突出高能效比及成本等優(yōu)勢(shì),那么算力難免要做些平衡。

相比其他類型的存儲(chǔ)器,SRAM存在單元面積偏大、存在靜態(tài)功耗高、成本略高等問題,但楊越認(rèn)為,僅從SRAM本身來(lái)考慮,是不全面的。

存內(nèi)計(jì)算在系統(tǒng)中扮演協(xié)處理器的角色,要比的不止是存儲(chǔ)器,而應(yīng)該從整個(gè)系統(tǒng)層面來(lái)看性能表現(xiàn)和成本影響。SRAM的這些短板,可以通過(guò)系統(tǒng)設(shè)計(jì)來(lái)矯正差距。

例如,端側(cè)發(fā)生的大多事情都是主控設(shè)備不感興趣的,利用這一特點(diǎn),蘋芯降低功耗的解決方案是在設(shè)備待機(jī)時(shí)將大部分SRAM存算單元關(guān)掉,只預(yù)留一個(gè)睡眠模式,在最小的模塊里保持監(jiān)測(cè)狀態(tài),當(dāng)物體檢測(cè)、語(yǔ)音交互等感興趣的事件發(fā)生時(shí),存內(nèi)計(jì)算模塊才會(huì)被喚醒。

當(dāng)前存算一體芯片的拳頭優(yōu)勢(shì)是能效比,其高能效比主要體現(xiàn)在存儲(chǔ)單元層,但這個(gè)數(shù)字還沒有跨越到系統(tǒng)級(jí)。這是因?yàn)閮?nèi)核與系統(tǒng)之間的通信,會(huì)受帶寬和其他數(shù)據(jù)處理需求的限制,很多存內(nèi)計(jì)算資源沒有被飽和地利用起來(lái),從而沒有最大化的發(fā)揮存算一體的優(yōu)勢(shì)。

蘋芯正在做面向存算一體的AI算法改良工作,即通過(guò)軟硬件協(xié)同設(shè)計(jì),提高計(jì)算單元利用率,釋放其在兼顧吞吐量和效率方面的優(yōu)勢(shì)。

考慮到存儲(chǔ)密度的限制,目前SRAM更適合做計(jì)算密集型應(yīng)用。但在真實(shí)應(yīng)用場(chǎng)景中,很多網(wǎng)絡(luò)模型非常復(fù)雜,可能存儲(chǔ)密集與計(jì)算密集兼而有之,因此蘋芯還計(jì)劃研發(fā)一個(gè)混合設(shè)計(jì)架構(gòu),讓ReRAM或MRAM和SRAM搭配協(xié)作,不同的存儲(chǔ)器各司其職,最終獲得更好的整體性能。

畢竟,誰(shuí)能率先設(shè)計(jì)出兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu),誰(shuí)就擁有了打開高能效計(jì)算之門的金鑰匙。

六、60個(gè)問題與CEO角色適應(yīng)

現(xiàn)在,楊越的筆記本電腦里,正躺著一個(gè)長(zhǎng)期思考的問題清單,里面已經(jīng)列了60個(gè)關(guān)乎公司發(fā)展的重要問題,足足填滿了5頁(yè)slides。

楊越說(shuō),他需要化繁為簡(jiǎn),先去解決前三項(xiàng)最重要的問題。

最近他在看一本書《我在硅谷管芯片:芯片產(chǎn)品線經(jīng)理生存指南》,這是一位硅谷芯片產(chǎn)品線經(jīng)理寫的,總結(jié)了芯片設(shè)計(jì)、生產(chǎn)、銷售、管理到市場(chǎng)營(yíng)銷和升級(jí)維護(hù)的工作全流程。

他覺得,CEO應(yīng)扮演好兩個(gè)角色,一是有銷售的屬性和精神,是一種不達(dá)目的不罷休的精神;二是成為一個(gè)好的產(chǎn)品經(jīng)理,努力提升整個(gè)公司的一個(gè)形象和品牌,完成技術(shù)變現(xiàn)。

對(duì)于已在海外生活多年的楊越來(lái)說(shuō),回國(guó)創(chuàng)業(yè)意味著要融入新環(huán)境,但他并沒有為此感到負(fù)擔(dān)。他更看重“能夠有機(jī)會(huì)參與科技的變革和升級(jí)的浪潮,并有幸做出貢獻(xiàn)。這些人生際遇與經(jīng)歷的價(jià)值將遠(yuǎn)遠(yuǎn)勝過(guò)安穩(wěn)的生活?!?/p>

“我這個(gè)人適應(yīng)能力和學(xué)習(xí)能力都非常強(qiáng)。”楊越回憶起創(chuàng)業(yè)初期,朋友們給了他很多有價(jià)值的參考意見。如果非要說(shuō)有什么需要適應(yīng)的,那大概是環(huán)境的改變:國(guó)內(nèi)外創(chuàng)業(yè)氛圍大不相同,國(guó)內(nèi)的創(chuàng)業(yè)沖勁好過(guò)世界上任何一個(gè)國(guó)家,節(jié)奏相對(duì)更快、對(duì)結(jié)果要求更多,而國(guó)外很多創(chuàng)業(yè)團(tuán)隊(duì)以技術(shù)為導(dǎo)向,更在乎對(duì)技術(shù)本身的追求。

“我本身是有技術(shù)潔癖的人,如果看到一些技術(shù)上的不求甚解,或者說(shuō)沒有打破砂鍋問到底的態(tài)度,我都會(huì)指出并提出嚴(yán)格的要求?!?創(chuàng)業(yè)后,楊越的思維發(fā)生了一些轉(zhuǎn)變,做公司不止是在技術(shù)上展現(xiàn)控制力,而是要在整個(gè)行業(yè)逐漸樹立一個(gè)“先行者”的角色。

壓力當(dāng)然也是有的。

“每天都是在救火狀態(tài),”楊越說(shuō),每天大大小小的挑戰(zhàn)接踵而至,包括公司的戰(zhàn)略發(fā)展制定、合作伙伴溝通、日常運(yùn)營(yíng),甚至研發(fā)中的debug,跟一眾芯片公司搶奪人才等等。

由于蘋芯團(tuán)隊(duì)擴(kuò)張很快,他們還總是面臨辦公室空間不夠用的問題。還有一些突發(fā)事件的應(yīng)急。比如,今年上半年,連綿不絕的新冠疫情,給蘋芯做封裝、板級(jí)demo等方面帶來(lái)一些進(jìn)度延遲。因此,楊越還在持續(xù)學(xué)習(xí)、自我提升。

工作之余,他也會(huì)參加一些體育活動(dòng),比如他喜愛的足球。“在創(chuàng)業(yè)之后,踢球的時(shí)間越來(lái)越少,所以非常珍惜每次踢球的時(shí)間?!痹瓉?lái)在上大學(xué)時(shí),楊越曾是清華自動(dòng)化系的足球隊(duì)隊(duì)長(zhǎng),獲得過(guò)校聯(lián)賽冠軍;出國(guó)后,他還在高手云集的多倫多華人聯(lián)賽中獲得過(guò)最佳射手。

七、先讓第一家客戶用起來(lái)

現(xiàn)階段的蘋芯,面臨“理想與面包”的選擇問題。其商務(wù)拓展戰(zhàn)略團(tuán)隊(duì)分布很廣,既有跟進(jìn)消費(fèi)電子類的,也有智能制造、智慧農(nóng)業(yè)等方向。

楊越很清楚,等需求到眼前再行動(dòng),會(huì)很被動(dòng)。尤其是創(chuàng)企,必須主動(dòng)創(chuàng)造需求,將技術(shù)帶來(lái)的直觀價(jià)值送到客戶面前。AI芯片公司得先貼上一個(gè)“能落地”的標(biāo)簽,讓第一家、第二家客戶用起來(lái),第三家到第一百家客戶才會(huì)接踵而至。

“我們根本邏輯是想去解決一些能夠拓展認(rèn)知邊界的問題,這樣才叫人工智能?!睏钤秸f(shuō),很多人希望AI將人類能完成的事情做到更好,但這不是AI真正的意義所在?!拔覀兊南敕ㄊ?,讓AI去完成人完成不了的事情,或者說(shuō)是很難去完成的事情,換句話說(shuō),它應(yīng)該去做雪中送炭的事,而不應(yīng)該去做錦上添花的事?!?/p>

據(jù)他判斷,AI的殺手級(jí)應(yīng)用還在探索過(guò)程中,市場(chǎng)有巨大的開拓空間,目前AI芯片市場(chǎng)仍然處于爆發(fā)前的勢(shì)態(tài)。但他相信很快將有一兩家AI芯片公司,在非消費(fèi)電子類行業(yè)里打開一個(gè)市場(chǎng)。

今年上半年,半導(dǎo)體行業(yè)普遍面臨的資本縮圈問題,但楊越發(fā)現(xiàn),也許是得益于技術(shù)先進(jìn)性,這一趨勢(shì)對(duì)存算一體芯片企業(yè)的融資進(jìn)程和估值并沒有造成很大的影響。不過(guò)他也觀察到,技術(shù)先進(jìn)性已經(jīng)不是資本唯一的考量標(biāo)準(zhǔn),現(xiàn)在投資正慢慢回歸理性,投資機(jī)構(gòu)要看落地方向、財(cái)務(wù)預(yù)期,以及一些芯片創(chuàng)業(yè)的經(jīng)典邏輯。

看向未來(lái),存算一體AI芯片要走向大規(guī)模商業(yè)落地,他認(rèn)為關(guān)鍵在于解決市場(chǎng)需求問題?;仡櫘?dāng)年美國(guó)半導(dǎo)體的興起,科學(xué)及產(chǎn)業(yè)政策的驅(qū)動(dòng)起到很大助力,僅靠補(bǔ)貼、優(yōu)惠等策略,不足以解決實(shí)際需求問題,要帶動(dòng)上游芯片產(chǎn)業(yè)的發(fā)展,必須鼓勵(lì)下游的企業(yè)使用新的技術(shù)產(chǎn)品。

在楊越看來(lái),現(xiàn)階段存算一體AI芯片產(chǎn)業(yè)發(fā)展面臨的主要變量,是政策層面如何幫助芯片公司實(shí)現(xiàn)收入的從負(fù)轉(zhuǎn)正,即構(gòu)建正確的商業(yè)營(yíng)收模型,幫助半導(dǎo)體公司生存下來(lái)。

至于技術(shù)難題,那終將會(huì)被克服。

結(jié)語(yǔ):站著走出去,才是勝利

時(shí)間過(guò)得很快,蘋芯科技轉(zhuǎn)眼已創(chuàng)辦18個(gè)月了。

芯片架構(gòu)創(chuàng)新的必要性,正隨著摩爾定律放緩而愈發(fā)凸顯。當(dāng)制程工藝演進(jìn)逐漸逼近物理極限,后摩爾時(shí)代的芯片優(yōu)化路徑,需要借助先進(jìn)制程、先進(jìn)封裝與架構(gòu)創(chuàng)新的組合拳。

不同時(shí)代對(duì)計(jì)算的要求不同。某種程度上,楊越希望蘋芯能夠成為「人工智能時(shí)代的Arm」。

就如當(dāng)年Arm解決了移動(dòng)端的芯片需求,現(xiàn)在,蘋芯團(tuán)隊(duì)也看到了類似Arm當(dāng)年的機(jī)會(huì)——當(dāng)一個(gè)硬件設(shè)計(jì)和創(chuàng)新,能實(shí)現(xiàn)更可靠、更穩(wěn)定的AI計(jì)算,能做到多、快、好、省,那么終端智能將變得無(wú)處不在。

在充滿變動(dòng)的時(shí)代背景下,蘋芯團(tuán)隊(duì)對(duì)很多事情也提前做好最壞的打算,為此儲(chǔ)備糧草,控制好現(xiàn)金流,專注提升核心競(jìng)爭(zhēng)力,持續(xù)提高自身抵抗風(fēng)險(xiǎn)的能力,以期走得更加長(zhǎng)遠(yuǎn)。

進(jìn)門雖已屬不易,能站著走出去,才是勝利。