智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣

智東西8月23日報道,過去三個月,生成式AI浪潮變數(shù)叢生,國內AI大模型產業(yè)也連爆大事:

6月29日美團宣布完成對AI大模型獨角獸企業(yè)光年之外的收購,搜狗創(chuàng)始人王小川創(chuàng)立的AI大模型創(chuàng)企百川智能連發(fā)3款開源大模型;此前被光年之外收購的AI大模型創(chuàng)企OneFlow(一流科技)的創(chuàng)始人袁進輝也于本周證實,一流科技團隊將瞄準大模型推理成本問題重新創(chuàng)業(yè)。

有趣的是,這些處于國內AI大模型競賽焦點的主人公們——美團創(chuàng)始人王興、光年之外創(chuàng)始人王慧文、搜狗&百川智能創(chuàng)始人王小川、一流科技創(chuàng)始人袁進輝——都是清華學子。

在如火如荼開展的AI大模型競賽中,清華學子可謂“搶盡”了風頭,除了王慧文、王小川等互聯(lián)網“老炮”高調入場外,還有多位清華學院派教授、清華畢業(yè)生躬身入局。據(jù)智東西不完全統(tǒng)計,近期活躍的AI大模型創(chuàng)企中,擁有清華背景的創(chuàng)始人至少有17位,涉及11家企業(yè)。清華系創(chuàng)業(yè)團隊儼然正撐起國內AI大模型創(chuàng)業(yè)浪潮的半壁江山。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲近期活躍在國內大模型浪潮中的清華系創(chuàng)企(整理自公開信息)

一、大佬創(chuàng)業(yè):90年代清華師兄弟、互聯(lián)網“老炮”高調入局

很多年后,人們回憶起國內這場盛況空前的AI大模型創(chuàng)業(yè)潮時刻:有兩個人的名字一定會率先浮現(xiàn)在眼前,那就是王慧文和王小川。就在今年2月和4月,這兩位互聯(lián)網老炮接連官宣創(chuàng)業(yè),劍指大模型。

除了這些共同點外,王小川和王慧文這對師兄弟曾于1996、1997年先后畢業(yè)于清華大學。

1、王慧文:2個月成獨角獸,沒產品成最大隱患

最先官宣創(chuàng)業(yè)的是王慧文。2月中旬,王慧文6天連發(fā)5條朋友圈,從表明態(tài)度到“500萬美元帶資進組求組隊”、發(fā)“AI英雄榜”,最終AI大模型創(chuàng)企光年之外成型。

王慧文的創(chuàng)業(yè)之路總能看到美團創(chuàng)始人王興的身影。1997年,王慧文考進清華大學電子工程系,因緣際會與王興成為上下鋪兄弟。戲謔的是,他們二人形影不離的原因是,成績優(yōu)異的王慧文進入清華大學后發(fā)現(xiàn)在眾多佼佼者中自己只能算個“學渣”,因而與成績相近的王興惺惺相惜。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲王慧文(右一)和王興(中間)

畢業(yè)后兩人幾經波折,最終在美團“勝利會師”。讀研期間,王慧文和王興雙雙退學瞄準了彼時在美國興起的社交網絡,打造出風靡大學生群體的校內網后陷入商業(yè)化困境,隨后選擇出售校內網財富自由,兩人分開創(chuàng)業(yè)。2010年,王慧文加入美團,再次與王興聯(lián)手。2020年,42歲、身價120億人民幣的王慧文選擇從美團退休。

這次,王慧文又出山,入局AI大模型。官宣創(chuàng)業(yè)后,頂尖人才、高額融資紛至沓來。前有北京智源人工智能研究院副院長劉江、被稱為“搜狗輸入法之父”的馬占凱等加入,后有王興、快手創(chuàng)始人宿華掏錢投資。成立兩個月后,光年之后迅速躍升獨角獸,估值達10億美元。

這背后,不是技術出身的王慧文開始緊鑼密鼓地召集人才,4月,光年之外完成收購同為清華系創(chuàng)企一流科技。這家創(chuàng)企的創(chuàng)始人是師從中國人工智能奠基者張鈸院士的袁進輝。

在此之后,手持豐厚資本、技術的光年之外業(yè)務布局即將走上正軌,成為AI大模型創(chuàng)業(yè)焦點的王慧文,6月底之際卻被曝出已經因病離崗,隨后,王興入局,光年之外被美團全權收購。

目前來看,王慧文的AI大模型創(chuàng)業(yè)之路已經畫上了終局,此后他是否會重返“戰(zhàn)場”仍是個未知數(shù),但成立半年之久的光年之后在產品端尚無進展官宣的當下,就幾經波折,這或許已經成為這家頭頂數(shù)道光環(huán)的大模型創(chuàng)企的最大風險。

2、王小川:百余天官宣3個大模型,投資陣容豪華

反觀與王慧文受關注度幾乎持平的王小川,4個月時間就拿出三款大模型,并開啟了大模型商業(yè)化的探索。

鼎鼎有名的清華大學計算機系的96級畢業(yè)生,是國內互聯(lián)網產業(yè)第一波弄潮兒,他們參與并見證了中國互聯(lián)網發(fā)展的每一個時刻,堪稱“互聯(lián)網夢之隊”。王小川就是其中之一。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲百川智能創(chuàng)始人兼CEO王小川

1996年,因獲得國際奧林匹克信息學競賽金牌的王小川被點招入清華大學計算機系,這一待就是七年。從計算機專業(yè)到生物方向,從國內青年社區(qū)平臺ChinaRen到搜狐,王小川的技術才華施展的范圍逐漸擴大,但他的物理空間卻幾乎沒有離開過五道口,王小川也被稱為“清華東門守門員”。

王小川也把百川智能安家到了五道口。今年4月,王小川聯(lián)手前搜狗COO茹立云成立百川智能,官宣入場大模型創(chuàng)業(yè),更有多位搜狗團隊老員工主動申請帶資加入,據(jù)王小川在第三個大模型發(fā)布時透露,目前百川智能中前搜狗員工的比例占到30-40%。

成立一個月后,百川智能就拿到了來自騰訊、小米、金山、清華大學資產管理有限公司、好未來等十余家機構的聯(lián)合投資,這樣的豪華投資陣容鮮有先例。

四個月時間,百川智能已經發(fā)布參數(shù)量130億的通用大語言模型Baichuan-13B-Base、對話模型Baichuan-13B-Chat及其INT4/INT8兩個量化版本、530億參數(shù)規(guī)模的Baichuan-53B,覆蓋開源到閉源。下一步,王小川要在大模型開源的基礎上,以搜狗曾經的超級應用經驗為基礎,找到大模型的超級應用以及比肩GPT能力的大模型。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲百川大模型演示案例

王慧文、王小川都是曾經締造中國互聯(lián)網的清華學子,隱退多年后,又在大模型浪潮下躬身入局。除了這兩位互聯(lián)網老炮外,還有眾多清華系教授、學生在這場硝煙彌漫的大模型賽道中格外扎眼。

二、學院派:五位教授領銜,孵化多個大模型創(chuàng)企

清華大學當之無愧是國內AI大模型賽道的人才寶地,現(xiàn)有的學術力量風頭正盛,五位教授領銜的AI大模型創(chuàng)業(yè)浪潮正在徐徐拉開帷幕。

在人工智能領域,不得不提的就是智源研究院這一響當當?shù)拿^。2018年,智源研究院正式成立,將北京大學、清華大學、中國科學院、百度、字節(jié)跳動等人工智能產業(yè)的頭部院校、企業(yè)的頂尖人才聚集到一起。

當OpenAI的GPT-3發(fā)布后,智源研究院率先發(fā)起大模型項目,唐杰、劉知遠、黃民烈、楊植麟……等清華大學知名AI學者紛紛投身其中,他們共同構成了后來悟道大模型的研發(fā)團隊。

這些AI大牛也成為了這波大模型創(chuàng)業(yè)浪潮中的核心力量。

1、唐杰:核心成員曾參與知名大模型研發(fā),融資拿到手軟

智譜AI、智源研究院、月之暗面、循環(huán)智能,這些身處大模型熱潮中心的公司,都與清華大學計算機系教授唐杰關系匪淺。

唐杰教授光環(huán)加身,他既是清華大學計算機系知識工程實驗室(KEG)帶頭人,同時是智源研究院學術副院長、悟道項目負責人。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲唐杰(圖源:清華大學)

事實上,最開始唐杰并不相信機器智能會超越人,他的主要研究方向是數(shù)據(jù)挖掘和知識工程,而大規(guī)模預訓練模型的出現(xiàn),讓他看到了機器智能超越人的可能性。

2020年OpenAI甩出GPT-3,攪動了整個人工智能產業(yè)。隨后,2020年10月,智源研究院率先確定了大模型研究戰(zhàn)略方向,時任智源副院長的唐杰帶領團隊在2021年發(fā)布了悟道1.0和2.0模型。同時,悟道2.0憑借萬億級參數(shù)規(guī)模創(chuàng)下中國首個、全球最大的世界紀錄。

與此同時,KEG實驗室孵化的智譜AI,其核心團隊也多為悟道大模型的研發(fā)人員,今年7月,剛剛收購光年之外的美團獨家投資了智譜AI,融資金額達數(shù)億人民幣。目前,智譜AI中英雙語開源模型ChatGLM、代碼生成模型CodeGeeX等大模型及應用產品矩陣。

除唐杰本人外,他鼎鼎大名的得意門生楊植麟也入局大模型,從清華畢業(yè)的楊植麟在美國卡內基梅隆大學師從蘋果和谷歌的AI大牛。6月12日,楊植麟劍指大模型的新創(chuàng)企月之暗面亮相,剛成立就迅速拿到紅杉、真格機構投資,市場估值達3億美元。不過,楊植麟頭頂?shù)墓猸h(huán)遠不止于此,早在2016年,楊植麟就創(chuàng)立了專注于自然語言理解的循環(huán)智能,還曾參與華為盤古大模型研發(fā)。

月之暗面其他三位聯(lián)合創(chuàng)始人中張宇韜周昕宇也畢業(yè)于清華,張宇韜與楊植麟同為唐杰的學生。

?清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

2、孫茂松:從信息處理到法律大模型,創(chuàng)企數(shù)量、涉足種類都處前列

清華大學人工智能研究院教授孫茂松是自然語言處理與社會人文計算實驗室(THUNLP)的負責人,劉知遠師承孫茂松。相比于唐杰教授,孫茂松和劉知遠團隊的創(chuàng)業(yè)公司更多,并且涉足的應用領域也更豐富。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲孫茂松(左)劉知遠(右)

深言科技基于預訓練模型打造中文信息處理引擎、面壁智能聚焦于基礎大模型的核心技術、冪律智能則要將自然語言處理應用于法律。此前,王慧文還曾傳出要收購深言科技和面壁智能,但這些收購傳聞最后都不了了之。

2021年,一款名叫WantWords的反向詞典突然在社交平臺上爆火,兩三周時間吸引了約30萬用戶。這一應用的研發(fā)人員就是后來深言科技的創(chuàng)始團隊。WantWords基于深度學習能幫助人們根據(jù)語義描述查找詞語,這一產品也幫助豈凡超打響名號。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲WantWords反向詞典主頁

早有創(chuàng)業(yè)想法的豈凡超,2022年畢業(yè)成立了深言科技,孫茂松擔任首席科學家,并且深言科技的核心團隊均為清華碩博士背景。成立至今,深言科技已完成三輪融資,最新一輪融資中騰訊、好未來在列。盡管具體的融資金額尚未披露,但據(jù)傳其估值在第二輪融資完成后已達1億美元。

另一家被傳收購的面壁智能,創(chuàng)始人曾國洋是劉知遠的學生,同時劉知遠擔任聯(lián)合創(chuàng)始人,面壁智能已經完成近千萬元的種子輪融資,此前推出了CPM-Live百億中文大模型直播訓練項目。

今年4月,知乎宣布與面壁智能共同開發(fā)了“知海圖AI”,并為其注資數(shù)千萬人民幣,這也一舉打破了面壁智能曾被收購的傳言。技術、人才、資本、應用、數(shù)據(jù)等多重因素的加持,使得面壁智能的大模型已經在知乎的應用實現(xiàn)大規(guī)模應用。

除了這兩家創(chuàng)企,還有清華大學計算機系人工智能所博士涂存超成立的冪律智能,這家公司關注的是自然語言處理技術與法律領域的結合。今年6月,冪律智能聯(lián)合智譜AI發(fā)布了基于中文千億大模型的法律垂直大模型PowerLawGLM。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

3、黃民烈:瞄準心理咨詢具體場景,要做中國版Character AI

同樣參與悟道大模型研發(fā)的清華大學計算機科學與技術系長聘教授黃民烈,在創(chuàng)業(yè)初期就瞄準了具體的應用落地場景。

2021年,黃民烈教授創(chuàng)立了聆心智能,其創(chuàng)始團隊多來自于清華大學、北京大學、北京師范大學等高??蒲性核刂聊壳?,聆心智能已經完成三輪融資,投資機構包括清華系的智譜華章等,其中披露具體融資金融的為去年12月完成的數(shù)千萬元天使+輪融資。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲清華大學計算機科學與技術系長聘教授黃民烈(圖源:清華大學人工智能研究院)

創(chuàng)立初期,黃民烈教授就專注于讓人工智能能為心理亞健康患者提供病情診斷、個性化干預的方案。這一創(chuàng)業(yè)目標的想法來源于黃民烈教授與其身患抑郁癥學生的故事。

今年7月,聆心智能發(fā)布了超擬人大模型CharacterGLM,提供千人千面的AI形象來陪伴用戶、與用戶聊天等,基于這一大模型,聆心智能還正在內測用戶興趣互動社區(qū)新產品AiU。

與這波大模型浪潮中瞄準OpenAI的創(chuàng)企不同,聆心智能此前曾透露,他們要做的是“中國的Character AI”,Character AI的最大特點就是讓用戶創(chuàng)建個性化的AI角色來進行交互。

4、朱軍:主攻多模態(tài)大模型,拿到螞蟻、百度風投投資

清華大學計算機系教授、清華大學人工智能研究院基礎理論研究中心主任朱軍也是最新入局的一位清華系教授。生數(shù)科技成立于今年3月,其核心團隊大多來自清華大學人工智能研究院,主要打造多模態(tài)通用大模型。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲清華大學計算機系教授、清華大學人工智能研究院基礎理論研究中心主任朱軍(圖源:北京智源大會官網)

朱軍教授第一次創(chuàng)業(yè)可以追溯至2018年,彼時專注于提升人工智能安全性的瑞萊智慧RealAI成立,專注于提升人工智能的安全性。

生數(shù)科技正是由瑞萊智慧孵化而來,成立至今拿到兩輪投資,今年6月拿到螞蟻集團、BV百度風投等的近億元人民幣融資,今年8月拿到錦秋基金獨家投資的數(shù)千萬人民幣。

生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝還是孫茂松教授的學生,他此前在接受采訪時談道,生數(shù)科技當前所訓練的大模型圖像生成效果已經超過Stable Diffusion,預計將于年內趕超Midjourmy。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

5、周伯文:面向消費者業(yè)務,自研百億級垂直大模型

最后一位與上述幾位教授的情況略有不同,清華大學惠妍講席教授、清華大學電子工程系長聘教授、清華大學電子系協(xié)同交互智能研究中心主任周伯文,是AI大牛重返學界的典型代表。

從IBM到京東,周伯文從事人工智能基礎理論和核心技術研究已達20年。自從2003加入IBM,他連任多個大型項目重要技術、管理職位,還作為IBM Watson集團首席科學家領隊開發(fā)了IBM Watson集團人工智能平臺。2017年加入京東后,又成為推動京東人工智能、京東云發(fā)展的重要人物。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲清華大學惠妍講席教授、清華大學電子工程系長聘教授、清華大學電子系協(xié)同交互智能研究中心主任周伯文(圖源:啟明創(chuàng)投)

2021年,他從京東離職后,2022年中旬,清華大學官宣聘任周伯文。

除了重返學界外,周伯文也瞄準了AI創(chuàng)業(yè)這條路。2021年,銜遠科技成立,這家公司的核心產品瞄準的是消費行業(yè),提供基于商品供應鏈大模型的企業(yè)級多輪對話平臺ProductGPT。并且,該公司的信息顯示,這一AI大模型是其自研,參數(shù)規(guī)模為數(shù)百億級,能讓大模型在具備通用能力的基礎上更擅長理解人與商品。

清華大學的學術力量已經站上大模型創(chuàng)業(yè)的擂臺,既有清華教授下場創(chuàng)業(yè),又有師生搭檔入局。事實上,在國內的創(chuàng)業(yè)大潮中,清華幫已經不止一次撐起產業(yè)的半壁江山,而這都離不開上個世紀清華大學在人工智能領域的前瞻布局。

三、從0開始迎頭趕上,清華大學撐起大模型創(chuàng)業(yè)半壁江山

清華大學,這一所匯聚了國內眾多頂尖人才的高校,也是中國人工智能技術萌芽誕生的地方。

相比當下的火熱程度,40多年前“人工智能”這個詞匯在國內的專業(yè)人士眼里也很陌生。1978年,人工智能第一次出現(xiàn)在了清華大學內部,自動控制系更名為計算機技術與應用系,內部人工智能與智能控制教研組成立,拉開了人工智能領域的教學序幕。

清華大學也創(chuàng)下了全國人工智能領域的多個第一,1978年招收第一批碩士生;1983年成立首個智能機器人實驗室;1983年在國際人工智能大會(IJCAI)上發(fā)表我國第一篇學術論文;1984年獲得人工智能領域的第一個國際重要獎項;1987年第一位人工智能領域的博士生畢業(yè);1990年成立全國第一個有關人工智能的國家重點實驗室“智能技術與系統(tǒng)”;2005年“清華大學計算機科學實驗室”成立,也就是當今人工智能領域無人不知的“姚班”;2018年成立跨系交叉研究機構“清華大學人工智能研究院”……

我國逐漸在人工智能領域里趕超世界領先水平,并占據(jù)一席之地。

然而,寥寥數(shù)語始終無法完全概括清華大學從一片空白到如今碩果累累的不易。上個世紀七十年代,中國人工智能領域生物控制和模式識別等方向的研究已開始起步,但受政治環(huán)境等影響,人工智能的研究一定程度上來說處于停滯狀態(tài)。

國內求學無門的研究人員為了更全面系統(tǒng)地認識人工智能領域,改革開放后赴美求學,40多歲的張鈸就是這批留學生中的一位,他作為訪問學者前往美國伊利諾伊大學香檳分校進修學習,國內NLP研究奠基人黃昌寧在耶魯大學進行了為期一年的訪問。而他們都成為了我國人工智能產業(yè)的重要奠基人和推動者。

清華系17人,撐起中國大模型創(chuàng)業(yè)半壁江山

▲張鈸院士在計算機系建立六十周年致辭(圖源:清華大學)

總的來看,我國人工智能研究起步比國外晚了20多年,經歷了從無到有、從弱到強的發(fā)展歷程。如今,國內人工智能產業(yè)的發(fā)展已經與其他國家?guī)缀跆幱谕黄鹋芫€,清華系的創(chuàng)業(yè)者作為這一波大模型浪潮中的中堅力量,憑借前人在人工智能領域的奠基、自身過硬的技術積累以及對前沿技術的探索、求真精神,正在從象牙塔走向練兵場并迅速成長。

結語:清華創(chuàng)業(yè)幫蓄勢待發(fā)

清華大學可以稱得上國內人工智能研究的起源地之一,在這一波人工智能新浪潮下,清華系無疑被寄予厚望。

除創(chuàng)業(yè)勢頭迅猛外,資本市場也選擇重金押注清華創(chuàng)業(yè)團隊,4月,深言科技新一輪融資完成后最新估值達1億美元,6月生數(shù)科技完成近億元天使輪融資,騰訊被曝今年6月向光年之外投資5000萬美元……

如今,大模型創(chuàng)業(yè)浪潮已經漸趨冷靜,眾多清華系創(chuàng)企已經競相官宣大模型成果,并投身到大模型應用落地中。中國大模型創(chuàng)業(yè)者們的新一輪競賽已經開始,并且愈發(fā)激烈。

如今,清華大學的優(yōu)勢逐漸凸顯,不僅成為大模型領域的人才軍備庫,同時占據(jù)了國內大模型創(chuàng)業(yè)浪潮的半壁江山。

參考資料:計算機系建立六十周年致辭《與計算機系共同成長》