智東西(公眾號(hào):zhidxcom)
文 | 心緣

手中無(wú)劍,勝在芯。8月29日,阿里平頭哥新“劍”出鞘。

這把新“劍”是一站式AIoT芯片設(shè)計(jì)平臺(tái),名字意同武學(xué)的至高境界——“無(wú)劍”。

現(xiàn)在國(guó)內(nèi)造芯公司起名越來(lái)越講究引經(jīng)據(jù)典,華為幾乎承包了《山海經(jīng)》,紫光新芯片取名為古代皇帝賜予大臣的第六種禮器“虎賁”,如今阿里平頭哥的“無(wú)劍”典出金庸武俠小說(shuō)。

話說(shuō)獨(dú)孤求敗40歲前使用玄鐵重劍,40歲后,“草木竹石均可為劍,漸進(jìn)于無(wú)劍勝有劍之境?!?/p>

這正是平頭哥對(duì)無(wú)劍平臺(tái)寄予的厚望,沒(méi)有芯片,但卻能幫各類芯片設(shè)計(jì)企業(yè)鍛就芯片。

阿里平頭哥芯片設(shè)計(jì)平臺(tái)“無(wú)劍”出鞘!成本周期壓縮至50%,解密三大硬核實(shí)力

按照平頭哥的介紹,該平臺(tái)能幫助芯片設(shè)計(jì)企業(yè),將設(shè)計(jì)成本和設(shè)計(jì)周期壓縮50%,顯著降低定制化芯片的研發(fā)門(mén)檻,降低效率、提升質(zhì)量,讓企業(yè)能更加專注于開(kāi)發(fā)出與應(yīng)用場(chǎng)景更好融合的芯片產(chǎn)品。

同日,基于平頭哥自研玄鐵CPU的無(wú)劍視覺(jué)AI平臺(tái)問(wèn)世,已應(yīng)用到媒體AI芯片、AI視覺(jué)芯片、邊緣AI服務(wù)器芯片等IoT產(chǎn)品中。

發(fā)布會(huì)期間,平頭哥發(fā)言人不僅詳細(xì)解讀無(wú)劍平臺(tái)的三大硬核實(shí)力和亮點(diǎn),解答無(wú)劍如何與阿里云實(shí)現(xiàn)云端協(xié)同,而且就AI芯片發(fā)展現(xiàn)狀、AIoT時(shí)代對(duì)芯片研發(fā)的挑戰(zhàn)、阿里平頭哥在未來(lái)產(chǎn)業(yè)扮演的角色等問(wèn)題一一回應(yīng)。

經(jīng)透露,無(wú)劍平臺(tái)采用的是授權(quán)模式,不排除未來(lái)開(kāi)源的可能。

另外,在云端,平頭哥自研的第一款NPU芯片也將于今年發(fā)布,其性能處于業(yè)界領(lǐng)先定位,主要用于阿里云數(shù)據(jù)中心。

一、無(wú)劍的三大硬核能力

無(wú)劍平臺(tái)由SoC架構(gòu)、處理器、各類IP、操作系統(tǒng)、軟件驅(qū)動(dòng)和開(kāi)發(fā)工具等模塊構(gòu)成,支持第三方AI加速引擎,并包含AI必須的基礎(chǔ)軟件體系。

它能提供集芯片架構(gòu)、基礎(chǔ)軟件、算法與開(kāi)發(fā)工等一體的整體解決方案,能夠承擔(dān)AIoT芯片約80%的通用設(shè)計(jì)工作量,讓芯片研發(fā)企業(yè)只需專注于剩余20%的專用設(shè)計(jì)工作。

1、硬件:異構(gòu)AI加速引擎框架

為了充分發(fā)揮各種不同硬件的效能,平頭哥打造了一個(gè)多場(chǎng)景靈活可配置的異構(gòu)AI加速引擎框架,允許用戶自定義。

平頭哥提供神經(jīng)網(wǎng)絡(luò)加速庫(kù)及異構(gòu)編譯器技術(shù),向芯片廠商提供多粒度的硬件抽象接口。

無(wú)論是低功耗低成本的語(yǔ)音芯片,還是高性能低時(shí)延的視覺(jué)芯片,芯片廠商可以根據(jù)各種硬件特征,快速對(duì)接到AI加速引擎,高效地發(fā)揮硬件性能。

該引擎支持當(dāng)前所有主流框架,幾乎所有的標(biāo)準(zhǔn)模型都能夠在上面一鍵部署;它也提供一套便捷的自定義層開(kāi)發(fā)接口,方便開(kāi)發(fā)者多樣化需求。

2、應(yīng)用開(kāi)發(fā):標(biāo)準(zhǔn)統(tǒng)一的開(kāi)發(fā)框架

平頭哥開(kāi)發(fā)了一套標(biāo)準(zhǔn)統(tǒng)一的應(yīng)用開(kāi)發(fā)框架,同一個(gè)應(yīng)用可以在不同算力的硬件上進(jìn)行無(wú)縫遷移。

據(jù)悉,平頭哥集成開(kāi)發(fā)環(huán)境完美融合該引擎,并添加一鍵部署、圖形化算力分析、異構(gòu)多核聯(lián)合調(diào)試等功能,解決實(shí)際開(kāi)發(fā)過(guò)程中最困難的問(wèn)題。

根據(jù)其實(shí)際客戶開(kāi)發(fā)數(shù)據(jù)的統(tǒng)計(jì),整個(gè)軟件框架可為芯片廠商節(jié)省60%的AI基礎(chǔ)軟件開(kāi)發(fā)成本,縮短方案廠商50%的應(yīng)用開(kāi)發(fā)時(shí)間。

3、基礎(chǔ)軟件:對(duì)接豐富資源

軟件工具鏈?zhǔn)腔A(chǔ)軟件,是芯片推廣過(guò)程中必不可少的工具,軟件工具鏈的優(yōu)劣很大程度上決定著芯片被使用的概率。

由于基礎(chǔ)軟件商業(yè)變現(xiàn)難,通常不被產(chǎn)品公司重視。

軟件生態(tài)是開(kāi)發(fā)者能夠獲取資源的一個(gè)大環(huán)境,開(kāi)發(fā)者總是愿意采用生態(tài)好、資源豐富的AI芯片產(chǎn)品。

二、視覺(jué)平臺(tái)已落地,玄鐵910是主控CPU

此次發(fā)布的無(wú)劍視覺(jué)AI平臺(tái),主要面向視覺(jué)AI場(chǎng)景,會(huì)根據(jù)客戶需求持續(xù)升級(jí)。

近期發(fā)布的RISC-V處理器玄鐵910,是無(wú)劍視覺(jué)AI平臺(tái)的主控CPU。

玄鐵910與芯片設(shè)計(jì)公司自研的AI加速引擎形成高性能異構(gòu)計(jì)算的完整方案。

這一視覺(jué)平臺(tái)的其他性能有:最大存儲(chǔ)帶寬400Gbps,單通道PCIE接口帶寬16Gbps,可支持16TOPS以下的邊緣側(cè)AI計(jì)算需求。

據(jù)介紹,該平臺(tái)已應(yīng)用到多媒體AI芯片、AI視覺(jué)芯片、邊緣AI服務(wù)器芯片等多家IoT廠商的產(chǎn)品中。

無(wú)劍平臺(tái)同時(shí)對(duì)IP公司開(kāi)放,吸納全球最有競(jìng)爭(zhēng)力的IP產(chǎn)品與無(wú)劍平臺(tái)進(jìn)行原型流片驗(yàn)證,已經(jīng)過(guò)硅驗(yàn)證,并且已在阿里內(nèi)部和多家客戶的芯片產(chǎn)品中得到應(yīng)用。

未來(lái),無(wú)劍平臺(tái)還將面向MCU、工業(yè)、安全、車(chē)載、接入等應(yīng)用領(lǐng)域開(kāi)發(fā)基礎(chǔ)設(shè)施及周邊技術(shù),持續(xù)推出面向領(lǐng)域的SoC平臺(tái)。

三、無(wú)劍如何將設(shè)計(jì)成本和周期各砍一半?

無(wú)劍能將設(shè)計(jì)成本和周期分別降低50%,主要來(lái)源于兩個(gè)方面:

第一,平臺(tái)化的設(shè)計(jì)方法讓IP能夠很快的接入到系統(tǒng),大幅降低IP支持成本,IP的價(jià)格將大幅下降。

第二,通過(guò)硬件平臺(tái)化和軟件平臺(tái)化的思路,研發(fā)上面的人力投入大幅降低。綜合來(lái)講,設(shè)計(jì)成本有望降低50%。

平臺(tái)化的思路,是指減少芯片設(shè)計(jì)過(guò)程中的重復(fù)性的投入,50%以上的設(shè)計(jì)驗(yàn)證工作是可以消除的。

另外,如果平臺(tái)的各種模擬IP與代工廠工藝已經(jīng)完成了驗(yàn)證,可以跳過(guò)3個(gè)月以上的試生產(chǎn)(MPW)的階段,直接進(jìn)入量產(chǎn),通常芯片從設(shè)計(jì)到量產(chǎn)的時(shí)間可以達(dá)到9個(gè)月以內(nèi)。

“敏捷設(shè)計(jì)是下一階段芯片設(shè)計(jì)領(lǐng)域發(fā)展的重點(diǎn)方向,”清華大學(xué)微電子所副所長(zhǎng)、清微智能創(chuàng)始人尹首一教授表示,“軟硬件深度融合的有行業(yè)特點(diǎn)的芯片平臺(tái)讓芯片設(shè)計(jì)公司省去很多底層的芯片開(kāi)發(fā)工作,更加專注于產(chǎn)品定義與核心技術(shù)本身,形成差異化的芯片產(chǎn)品,提升市場(chǎng)競(jìng)爭(zhēng)力?!?/p>

四、端云協(xié)同,能天然接入阿里云

AIoT在線智能的特點(diǎn),需要端云協(xié)同來(lái)實(shí)現(xiàn)。

所謂端云協(xié)同,是指在下一代芯片開(kāi)發(fā)時(shí),僅要考慮到端上的計(jì)算能力,還要考慮云上的能力。

例如,AI芯片的網(wǎng)絡(luò)模型需與云端頻繁互動(dòng),需要從芯片底層到操作系統(tǒng)方面的架構(gòu)支持。

平頭哥隸屬于阿里云智能,根據(jù)阿里云業(yè)務(wù)場(chǎng)景進(jìn)行云端一體架構(gòu)的探索與嘗試。

無(wú)劍AI芯片平臺(tái)的端云一體,是平頭哥軟硬件基礎(chǔ)能力的體現(xiàn),體現(xiàn)在圍繞云計(jì)算的場(chǎng)景中,端側(cè)設(shè)備具有實(shí)時(shí)與云端應(yīng)用互動(dòng)的能力。

基于平頭哥芯片平臺(tái)的產(chǎn)品能天然接入阿里云,與云端應(yīng)用生態(tài)對(duì)接后將形成新的產(chǎn)品形態(tài)。

五、“平頭哥”模式與阿里的芯片定位

阿里平頭哥芯片設(shè)計(jì)平臺(tái)“無(wú)劍”出鞘!成本周期壓縮至50%,解密三大硬核實(shí)力

平頭哥的長(zhǎng)遠(yuǎn)目標(biāo),是做AIoT時(shí)代芯片基礎(chǔ)設(shè)施提供者,為了接近這個(gè)“小目標(biāo)”,它提出了芯片設(shè)計(jì)的“平頭哥模式”:

以無(wú)劍平臺(tái)為核心,從芯片到應(yīng)用全棧開(kāi)放集成,實(shí)現(xiàn)處理器、算法、操作系統(tǒng)等軟硬件核心技術(shù)的深度融合,打破傳統(tǒng)通用芯片時(shí)代IP授權(quán)商用模式成本高、使用難、周期長(zhǎng)的局限,為企業(yè)提供從芯片到應(yīng)用的全棧技術(shù)能力。

簡(jiǎn)而言之,平頭哥模式具有三大特點(diǎn):全棧、開(kāi)放、被集成。

它的優(yōu)勢(shì)很明顯:一是IP、系統(tǒng)芯片設(shè)計(jì)經(jīng)驗(yàn)豐富,在處理器領(lǐng)域有充足話語(yǔ)權(quán);二是有錢(qián),也愿意長(zhǎng)期砸錢(qián)、砸人才;三是整合豐富的生態(tài)資源,通過(guò)構(gòu)建平臺(tái),降低芯片設(shè)計(jì)門(mén)檻。

這與阿里在芯片上的定位一致,即做好芯片行業(yè)的基礎(chǔ)設(shè)施。

處理器是所有高端系統(tǒng)芯片都需要的產(chǎn)品,是最核心的基礎(chǔ)設(shè)施產(chǎn)品,阿里將投入重金打造好技術(shù),同時(shí)構(gòu)建應(yīng)用生態(tài)。

除了處理器以外,阿里還將繼續(xù)開(kāi)發(fā)操作系統(tǒng)、軟硬件融合的算法、核心的IP等,將這些共性的技術(shù)能夠做好、做精、做出競(jìng)爭(zhēng)力。

當(dāng)然,大目標(biāo)是要形成生態(tài),然后開(kāi)放給他們的芯片設(shè)計(jì),使之基于高質(zhì)量的基礎(chǔ)設(shè)施打造芯片產(chǎn)品,以提升整體的產(chǎn)業(yè)競(jìng)爭(zhēng)力。

六、芯片設(shè)計(jì)進(jìn)入3.0時(shí)代

平頭哥半導(dǎo)體研究員孟建熠認(rèn)為,芯片設(shè)計(jì)方法正在進(jìn)入新的3.0時(shí)代。

阿里平頭哥芯片設(shè)計(jì)平臺(tái)“無(wú)劍”出鞘!成本周期壓縮至50%,解密三大硬核實(shí)力

1.0時(shí)代從1990至2000年,芯片設(shè)計(jì)基于ASIC流程進(jìn)行,每次研發(fā)新芯片都需從電路開(kāi)始重新設(shè)計(jì)。

2000年后進(jìn)入2.0時(shí)代,基于IP的模塊化的設(shè)計(jì)方法,降低了芯片的開(kāi)發(fā)成本和設(shè)計(jì)風(fēng)險(xiǎn)。

AIoT市場(chǎng)具有強(qiáng)應(yīng)用驅(qū)動(dòng)、場(chǎng)景碎片化等特征,隨著AIoT應(yīng)用發(fā)展如火如荼,需要更加高效的設(shè)計(jì)方法。

由此,芯片設(shè)計(jì)進(jìn)入3.0時(shí)代,在基礎(chǔ)框架/模板基礎(chǔ)上,定制符合應(yīng)用需求的芯片產(chǎn)品,以最快速度推向精準(zhǔn)市場(chǎng)。

據(jù)國(guó)際數(shù)據(jù)公司IDC預(yù)測(cè),到2025年,全球聯(lián)網(wǎng)的IoT設(shè)備將達(dá)到416億臺(tái),這些端上設(shè)備將產(chǎn)生的數(shù)據(jù)量是79.4ZB,相當(dāng)于9萬(wàn)億部時(shí)長(zhǎng)2小時(shí)的高清電影。

Gartner預(yù)測(cè),其中80%的IoT設(shè)備將由AI加持。

在摩爾定律時(shí)代,芯片研發(fā)追求通用性,比工藝、比投入。

在后摩爾定律時(shí)代,碎片化的AIoT場(chǎng)景對(duì)芯片的要求更多在于市場(chǎng)靈敏度,芯片研發(fā)比的是需求適配和成本。

傳統(tǒng)通用芯片設(shè)計(jì)方式往往太重,成本投入高、設(shè)計(jì)周期長(zhǎng),很難適應(yīng)未來(lái)AIoT市場(chǎng)小批量、定制化的需求。

很多SoC設(shè)計(jì)方法雖然效率較ASIC設(shè)計(jì)方法有很大提升,但從IP到系統(tǒng)集成驗(yàn)證、再到軟件調(diào)試過(guò)程,依然耗時(shí)耗成本。

無(wú)劍芯片平臺(tái)正是針對(duì)這一痛點(diǎn),試圖提供全新的、更加高效的設(shè)計(jì)方法學(xué)。

這只是平頭哥野心的初步成果,平頭哥的雄偉目標(biāo),是以生態(tài)營(yíng)造者的角色,引領(lǐng)芯片3.0時(shí)代。

結(jié)語(yǔ):AIoT芯片或進(jìn)入更快落地潮

算力是推動(dòng)AI產(chǎn)業(yè)發(fā)展的重要?jiǎng)恿?,而在智能?yīng)用不斷快速裂變的今時(shí)今日,所有芯片都面臨著升級(jí)。

近年來(lái),傳統(tǒng)芯片公司、互聯(lián)網(wǎng)公司、AI芯片創(chuàng)企和算法公司紛紛投入AI芯片的浪潮之中,開(kāi)發(fā)出滿足自身或市場(chǎng)需求的AI芯片。

AI芯片的第一波浪潮已經(jīng)過(guò)去,很多產(chǎn)品正面臨著市場(chǎng)嚴(yán)酷的考驗(yàn),大浪淘沙,缺乏應(yīng)用場(chǎng)景的AI芯片將被市場(chǎng)淘汰。

而隨著像無(wú)劍這樣的一體式芯片設(shè)計(jì)平臺(tái)的普及,很多中小型的設(shè)計(jì)公司可以根據(jù)應(yīng)用快速定制出芯片產(chǎn)品,形成“快魚(yú)吃慢魚(yú)”的格局。

AIoT產(chǎn)業(yè)或許將呈現(xiàn)更欣欣向榮的定制化芯片落地浪潮。