智東西(公眾號(hào):zhidxcom)
文 | Lina

人工智能熱潮的興起已然是不爭(zhēng)的事實(shí),就在你讀文章的此時(shí)此刻,為期三天的ICLR國(guó)際學(xué)習(xí)表征會(huì)議剛剛落下帷幕。這場(chǎng)由全球兩位深度學(xué)習(xí)巨頭舉辦的學(xué)術(shù)研討會(huì)在近年來聲名鵲起,一躍已經(jīng)成為人工智能領(lǐng)域的重要會(huì)議之一,谷歌、百度、Facebook、英偉達(dá)等各大公司爭(zhēng)相加碼贊助。(6位大牛21場(chǎng)演講,一文看盡最牛深度學(xué)習(xí)大會(huì)ICLR!

而在這份贊助廠商名單上,一個(gè)中國(guó)創(chuàng)企尤為引人注目——深鑒科技。這是一家非常年輕的公司,履歷卻驚人地亮眼,公司內(nèi)部聚集了無數(shù)清華、斯坦福的技術(shù)大牛,在各種學(xué)術(shù)研討會(huì)上拿獎(jiǎng)拿到手軟。而且成立剛滿一年,不僅拿到了500萬美元的天使輪,還在今年年初敲定了數(shù)千萬美元的A輪融資,估值超過10億人民幣。

那么它是做什么的呢?既然贊助ICLR大會(huì),那么自然與深度學(xué)習(xí)有關(guān)。

深度學(xué)習(xí)分為訓(xùn)練(Training)和應(yīng)用(Inference)兩部分,深鑒科技主要解決應(yīng)用問題。簡(jiǎn)單來說就是企業(yè)將自己的深度學(xué)習(xí)算法模型訓(xùn)練好之后,由深鑒科技將其壓縮20-50倍并編譯,最終產(chǎn)品以板卡形式呈現(xiàn)。

深鑒科技基于的是FPGA平臺(tái):與擅長(zhǎng)訓(xùn)練的GPU相比,F(xiàn)PGA功耗更小、整體性價(jià)比更高,更適合用于應(yīng)用。但是由于FPGA的開發(fā)難度高、周期長(zhǎng),因此很多公司不愿使用。深鑒科技相當(dāng)于給用戶提供了一個(gè)黑盒子,企業(yè)只需要提供輸入模型和數(shù)據(jù),由深鑒科技提供應(yīng)用層的FPGA解決方案。

智東西從很早之前就開始關(guān)注深鑒科技了。今年2月,深鑒科技首席科學(xué)家韓松的“深度壓縮”論文獲得了FPGA芯片領(lǐng)域頂級(jí)會(huì)議FPGA 2017的最佳論文獎(jiǎng);而更早之前,在去年的ICLR國(guó)際學(xué)習(xí)表征會(huì)議上,最佳論文獎(jiǎng)也被深鑒科技斬獲。同年的另一篇最佳論文獎(jiǎng)獲得者大家一定非常熟悉,那就是AlphaGo開發(fā)者——谷歌DeepMind。

巧合的是,深鑒科技與智東西同在人工智能創(chuàng)業(yè)勝地——五道口,而且公司離得特別近,也算是緣分。今天,智東西來到了公司內(nèi)部,與創(chuàng)始人兼CEO姚頌仔細(xì)地聊了聊。

一、“姚老板”與他的師兄弟們(還有師父)

成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?

姚頌給人的第一感覺——很年輕,也很瘦。帶著眼鏡,穿著長(zhǎng)袖的藍(lán)白細(xì)格子衫,人非常nice、很健談、也很好說話。

但。是。

請(qǐng)不要誤以為眼前只是某位面相清秀的普通理工科男生,這可是一個(gè)實(shí)打?qū)嵉膶W(xué)術(shù)大牛。從小一路直升,高三直接保送進(jìn)清華,進(jìn)入電子系后大一就進(jìn)了實(shí)驗(yàn)室(理工科的同學(xué)大概可以理解這有多么厲害),本科階段不僅在斯坦佛訪問、微軟亞洲研究院實(shí)習(xí)、開發(fā)項(xiàng)目、發(fā)表論文、差不多就是把別人本碩博的事情一起做完了……此外,姚頌還擔(dān)任過電子系科協(xié)主席,主辦過電設(shè)等一系列科創(chuàng)賽事——也正是因?yàn)橹飨奈恢檬诸愃乒镜腃EO,因此姚頌在大三時(shí)就有了個(gè)外號(hào):“姚老板”。

而深鑒科技的另外幾位聯(lián)合創(chuàng)始人與合伙人則更是臥虎藏龍。

成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?

(左到右:?jiǎn)昔?,汪玉,姚頌,韓松)

汪玉——也就是姚頌口中提到的“汪老師”,姚頌在大一時(shí)進(jìn)的就是汪老師實(shí)驗(yàn)室——清華電子系98級(jí)畢業(yè)生,現(xiàn)任清華大學(xué)電子工程系副教授、黨委副書記。從2006年開始研究FPGA,現(xiàn)在是ACM FPGA技術(shù)委員會(huì)亞太地區(qū)的唯一成員。

CTO單羿,清華電子系博士,04級(jí)本科,曾在地平線機(jī)器人擔(dān)任FPGA技術(shù)負(fù)責(zé)人、在百度深度學(xué)習(xí)研究院擔(dān)任高級(jí)工程師。

首席科學(xué)家韓松,清華電子系08級(jí)本科,斯坦佛博士在讀。韓松也就是我們上文提到的最佳論文獎(jiǎng)獲得者,其研發(fā)的“深度壓縮(Deep Compression)”的技術(shù),它不僅可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響準(zhǔn)確度,還可以使用“片上存儲(chǔ)”來存儲(chǔ)深度學(xué)習(xí)算法模型,減少內(nèi)存讀取,大幅度減少功耗。

“我是里面年紀(jì)最小的一個(gè),11級(jí)的?!薄耙习濉闭f完這話,低頭笑了笑。

現(xiàn)在深鑒科技整個(gè)團(tuán)隊(duì)有70人,其中將近一半都是清華出身,而且放眼望去……..幾乎全部都是男生。這家在2016年3月3日正式成立的公司,在剛成立一個(gè)月就拿到了金沙江創(chuàng)投與高榕資本的500萬美元天使輪融資,今年年初更是敲定了數(shù)千萬美元的A輪融資,投資方包括了FPGA的開山鼻祖——賽靈思(Xilinx)。

二、從GPU到FPGA,風(fēng)起云涌的深度學(xué)習(xí)

人工智能的火熱已然有目共睹,從如雨后春筍般增長(zhǎng)融資的各類AI創(chuàng)企、國(guó)內(nèi)外無數(shù)巨頭高調(diào)進(jìn)軍加碼、再到“人工智能”被寫入我國(guó)政府工作報(bào)告等諸多新聞中皆可見一斑。其實(shí)人工智能的概念早已有之,為什么近年如此火熱呢?

姚頌認(rèn)為,深度學(xué)習(xí)和以往的人工智能不一樣,不僅已經(jīng)能夠在某些領(lǐng)域超過了人類,而且原來人臉識(shí)別、微表情、醫(yī)療、SLAM等都有專家,每個(gè)領(lǐng)域的專家不能復(fù)用,但現(xiàn)在深度學(xué)習(xí)的AI框架可以把所有領(lǐng)域都囊括進(jìn)去,對(duì)于硬件加速很友好,應(yīng)用范圍很廣。

然而說起深度學(xué)習(xí),大家最聯(lián)想到的還是GPU——五六年前,跑機(jī)器學(xué)習(xí)算法主要用的還是CPU,CPU通用性好,硬件框架已經(jīng)很成熟,非常友好。然而,隨著機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的運(yùn)算量越來越大,CPU已經(jīng)不能滿足人們的需求,人們進(jìn)而把眼光轉(zhuǎn)向了GPU。

GPU不僅有更強(qiáng)大的并行處理能力,還有更加強(qiáng)大的控制數(shù)據(jù)流和儲(chǔ)存數(shù)據(jù)的能力,因此可以令神經(jīng)網(wǎng)絡(luò)訓(xùn)練的速度提升10-20倍,從而能夠?qū)⒃疽獢?shù)周甚至幾月的訓(xùn)練時(shí)間縮短至數(shù)天。深度學(xué)習(xí)分為訓(xùn)練(Training)和應(yīng)用(Inference)兩部分,尤其是在訓(xùn)練階段,其所需的數(shù)據(jù)計(jì)算之大,遠(yuǎn)不是曾經(jīng)CPU時(shí)代的人們敢于去想象的。

這對(duì)專注于GPU生產(chǎn)的英偉達(dá)來說,確實(shí)是一個(gè)好消息,英偉達(dá)在去年的股價(jià)飆升也證明了這一點(diǎn)。然而這消息對(duì)于全世界最大的CPU制造商英特爾來說,就沒那么友好了——不過,做不好我們可以買呀,2015年12月29日,踩著2015的尾巴與2016的前頭,英特爾宣布以167億美元全資收購(gòu)FPGA/CPLD公司阿爾特拉(Altera),至于阿爾特拉和前文提到的塞靈思(Xilinx)的關(guān)系嘛,大概就像是肯德基和麥當(dāng)勞。

咦?不是說好的GPU嗎?為什么聊起了FPGA?

FPGA(Field Programmable Gate Array)全稱“可編程門陣列”,是作為專用集成電路領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了全定制電路的不足,又克服了原有可編程邏輯器件門電路數(shù)有限的缺點(diǎn)。

成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?

(賽靈思推出的UltraScale架構(gòu)FPGA)

簡(jiǎn)單來說, FPGA的“可編程”指的是可以用戶通過重新配置邏輯資源來不停嘗試,通過編輯不同的配置文件把同一個(gè)FPGA進(jìn)行不同屬性的設(shè)置,直到獲得最佳方案,非常靈活。而深度學(xué)習(xí)作為一門尚在發(fā)展中的技術(shù),F(xiàn)PGA的這種靈活、可編程、允許試錯(cuò)的特性對(duì)它來說是非常友好的,這是第一點(diǎn)。

除了靈活性外,第二點(diǎn)則是功耗。一塊GPU的功耗動(dòng)輒100W、200W,功耗巨大。雖然英偉達(dá)也推出了面向嵌入端的GPU設(shè)備(比如Jetson TX2系列,其標(biāo)準(zhǔn)功耗為7.5W/15W),但對(duì)于無人機(jī)、安防攝像頭這種功耗敏感型的硬件端來說則仍舊會(huì)存在功耗過大、發(fā)熱、過度影響電池續(xù)航等問題,而功耗能做到3W、4W的FPGA此處優(yōu)勢(shì)凸顯。

第三點(diǎn)則是延遲問題,雖然GPU的運(yùn)行速度比FPGA快,但是GPU的高性能來自于它的并行處理能力,訓(xùn)練時(shí)效果很好,但在應(yīng)用時(shí)一次性只能處理一張輸入圖像,優(yōu)勢(shì)不能完全發(fā)揮,造成延時(shí)。

不過,GPU由于峰值計(jì)算性能高、內(nèi)存接口帶寬高等優(yōu)勢(shì),依舊是目前深度學(xué)習(xí)訓(xùn)練階段的最佳選擇。但在應(yīng)用方面,F(xiàn)PGA的靈活、低功耗、而且價(jià)格相對(duì)低廉等優(yōu)勢(shì)開始凸顯。目前國(guó)內(nèi)外不少大公司開始逐漸注意到維護(hù)、采購(gòu)、散熱、內(nèi)部損耗成本等問題,開始逐漸將FPGA引入自己的系統(tǒng)內(nèi),比如去年亞馬遜和賽靈思合作,推出了基于FPGA的亞馬遜云服務(wù)、百度大腦使用了基于FPGA版的AI專有芯片、騰訊云也發(fā)布FPGA云服務(wù)器等等,市場(chǎng)接受度正在不斷提升。

三、產(chǎn)品落地:DPU與深度壓縮

雖然FPGA有種種好處,但是也存在一個(gè)大問題,那就是開發(fā)難度。由于傳統(tǒng)FPGA開發(fā)需要使用硬件描述語言(Verilog或VHDL)而不是傳統(tǒng)的計(jì)算機(jī)語言(比如C語言),程序員需要在FPGA公司提供的編譯器基礎(chǔ)上進(jìn)行二次開發(fā),造成了開發(fā)難度大、開發(fā)周期長(zhǎng)(一般需要3-6個(gè)月)等問題,所以很多公司不愿意使用它。

深鑒相當(dāng)于給這些不愿意直接使用FPGA的廠商提供了一個(gè)帶接口的黑盒子,廠商把自己的算法模型訓(xùn)練好之后,將模型與數(shù)據(jù)通過接口傳入,由深鑒科技進(jìn)行壓縮和編譯,生成的指令可以在FPGA上運(yùn)行,廠商直接得到需要的輸出結(jié)果。

為此,深鑒科技提出了“DPU”這一概念,DPU(Deep Learning Processing Unit,深度學(xué)習(xí)處理單元),相當(dāng)于把壓縮、編譯、執(zhí)行的整個(gè)“黑盒子”過程具象化,最后的落地形態(tài)是一塊板卡。

成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?
成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?

(上:亞里士多德板,用于嵌入端。下:笛卡爾版,用于大數(shù)據(jù)端)

其中壓縮的這一環(huán)節(jié)尤為值得一提,由于跟GPU相比,F(xiàn)PGA在帶寬上存在一定劣勢(shì)。而深鑒科技的聯(lián)合創(chuàng)始人兼首席科學(xué)家韓松(對(duì),就是FPGA 2017、ICLR 2016等大會(huì)上拿獎(jiǎng)拿到手軟那個(gè)韓松)正在研究“深度壓縮”(Deep Compression)技術(shù),他的獲獎(jiǎng)?wù)撐闹薪忉屃巳绾卫蒙疃葔嚎s將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響準(zhǔn)確度,從而降低計(jì)算復(fù)雜度、存儲(chǔ)空間、以及帶寬對(duì)其的限制。

姚頌還告訴智東西,每套DPU并不需要根據(jù)不同公司而定制不同的板卡,只要是同類應(yīng)用都可以復(fù)用?!氨热绻続想要做車牌(識(shí)別),公司B想要做人臉(識(shí)別),這些公司只需要自己換不同的算法模型接入就行,DPU可以復(fù)用。”

成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?

(搭載有深鑒板卡的無人機(jī))

目前,深鑒科技的合作伙伴主要集中在無人機(jī)、安防、數(shù)據(jù)中心這三個(gè)領(lǐng)域,代表企業(yè)分別是無人機(jī)廠商零度智控、上市公司東方網(wǎng)力、以及搜狗。比如在零度智控的無人機(jī)中載入板卡,為其提供人臉識(shí)別、跟隨、手勢(shì)照相等功能,功耗只有3W,不會(huì)對(duì)電力續(xù)航產(chǎn)生太大的影響。如安防攝像頭等的其他嵌入式端也是3W的功耗,數(shù)據(jù)中心應(yīng)用的功耗則只有30-40W。公司下一步的拓展目標(biāo)包括產(chǎn)品的平臺(tái)化與標(biāo)準(zhǔn)化、推進(jìn)與其他大互聯(lián)網(wǎng)公司合作等,進(jìn)一步推進(jìn)產(chǎn)品成熟化。

四、“神人”云集

這里的“神人”值得不是學(xué)術(shù)大神——當(dāng)然,辦公室里放眼望去,各類編程代碼高手云集,學(xué)術(shù)能力自然不必說了——這里的“神人”值的是那些特別有趣的人。

深鑒科技的整個(gè)公司氛圍有點(diǎn)像硅谷,氣氛和環(huán)境比較輕松,但工作節(jié)奏比硅谷緊湊多了——畢竟身處五道口。公司里的學(xué)術(shù)大神不少,體育大神也特別多。不僅有足球、籃球、羽毛球三個(gè)球隊(duì),其中還有一個(gè)曾在國(guó)安青年俱樂部的足球大拿,跟所有人踢起來都不是一個(gè)量級(jí)的……

再比如另外一位研發(fā)總監(jiān),搞起研發(fā)來還是特別扛得住。之前在搞一個(gè)FPGA的項(xiàng)目時(shí),剛好碰上他孩子剛出生。于是當(dāng)時(shí)就看見他坐在客廳里,一邊抱著娃,一邊寫代碼。

可以,這很Work Hard, Play Hard。

姚頌本人自然是“神人”之一。按他的講法,“我自己比較躁動(dòng),比較喜歡新方式?!背藢W(xué)術(shù)之外,社工、運(yùn)動(dòng)、音樂什么的,“都玩一點(diǎn)”。本科畢業(yè)后,姚頌獲得了美國(guó)卡內(nèi)基梅隆大學(xué)(CMU)的博士offer,還伴有每年高額的學(xué)術(shù)獎(jiǎng)金,但姚頌拒絕了。一開始時(shí)父母當(dāng)然不同意,最后還是汪玉老師親自出馬才說服了姚爸姚媽。

不知道是不是口頭禪,在整個(gè)采訪過程中,姚頌經(jīng)常說的一句話是——“這是一件非常好玩的事情”,恍惚間給人一種錯(cuò)覺,像是深度學(xué)習(xí)、FPGA、神經(jīng)網(wǎng)絡(luò)等等知識(shí)理論其實(shí)一點(diǎn)都不復(fù)雜,運(yùn)營(yíng)一間幾十近百人、估值過10億的技術(shù)公司也似乎輕而易舉。

結(jié)語:科學(xué)技術(shù)是第一生產(chǎn)力

當(dāng)智東西問到“創(chuàng)業(yè)過程中最大的感觸是什么?”時(shí),姚頌說,最大的感觸是,“一項(xiàng)理論從技術(shù)、到產(chǎn)品、到市場(chǎng)、最后收入,每一步都是非常重大的?!痹谝粋€(gè)商業(yè)產(chǎn)品中,純理論的技術(shù)部分可能只占的30%,后續(xù)的產(chǎn)品研發(fā)、商業(yè)落地。因此對(duì)于學(xué)術(shù)能力較強(qiáng)的團(tuán)隊(duì)而言,如何掌控學(xué)術(shù)與商業(yè)的平和,為市場(chǎng)帶來有價(jià)值實(shí)戰(zhàn)產(chǎn)品,是需要認(rèn)真思考的問題。

但話說回來,在人工智能領(lǐng)域,技術(shù)依舊是如今的第一生產(chǎn)力。云集了重多技術(shù)大拿的深鑒科技能夠在成立的這短短一年多里推出產(chǎn)品、與廠商達(dá)成合作、并且順利拿到融資并獲得高估值,成績(jī)單還是十分亮眼的。隨著深度學(xué)習(xí)的發(fā)展,國(guó)內(nèi)外的各大企業(yè)也在逐漸擁抱FPGA,在這樣的浪潮下,深鑒科技專注于深度學(xué)習(xí)應(yīng)用落地,瞄準(zhǔn)FPGA的開發(fā)難這一痛點(diǎn),前景值得期待。

在此之前,F(xiàn)PGA最大的應(yīng)用在通信領(lǐng)域,開始被用在深度學(xué)習(xí)還是近年的事情。跟CPU、GPU這類已經(jīng)經(jīng)歷過多年市場(chǎng)驗(yàn)證的產(chǎn)品不同,一方面FPGA還算是一個(gè)較為小眾的市場(chǎng),哪怕是巨頭賽靈思,其市值也只在150億美元左右(截至發(fā)稿,英偉達(dá)市值約570億美元),推進(jìn)產(chǎn)業(yè)接受仍需要時(shí)間;另一方面FPGA仍舊是一個(gè)對(duì)人力資源要求較高的技術(shù),在公司未來的擴(kuò)張過程中,如何更好地招攬F(tuán)PGA人才、人力成本是否會(huì)進(jìn)一步增加,也是可能面臨的挑戰(zhàn)之一。


硬創(chuàng)先鋒

挖掘全球最具潛力的智能創(chuàng)業(yè)項(xiàng)目

項(xiàng)目投遞:微信添加hawkren001

成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?