智東西(公眾號(hào):zhidxcom)
作者 | 程茜
編輯 | 李水青

智東西11月26日消息,11月24日,字節(jié)跳動(dòng)技術(shù)副總裁楊震原在2025字節(jié)跳動(dòng)獎(jiǎng)學(xué)金頒獎(jiǎng)典禮上發(fā)表演講,他透露2026年P(guān)ICO將有新品發(fā)布。

為提升MR技術(shù)中虛擬物體和現(xiàn)實(shí)世界的融合度,PICO為MR設(shè)備全鏈路自研了專(zhuān)用消費(fèi)級(jí)芯片,2022年6月立項(xiàng)、2024年回片,目前已進(jìn)入量產(chǎn),實(shí)測(cè)顯示,芯片系統(tǒng)延遲在12毫秒左右。

字節(jié)跳動(dòng)VP復(fù)盤(pán)12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

▲字節(jié)跳動(dòng)副總裁楊震原

楊震原于2014年加入字節(jié)跳動(dòng),從最初幫助字節(jié)跳動(dòng)創(chuàng)始人張一鳴搭建新的推薦算法至今已接近12年。他在演講中回顧了字節(jié)跳動(dòng)幾個(gè)重要的技術(shù)發(fā)展節(jié)點(diǎn):

2014年,他們用大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)來(lái)搭建推薦系統(tǒng),在僅有5個(gè)人的情況下,只能選兩個(gè)人各自負(fù)責(zé)一套優(yōu)化器方案;

2020年字節(jié)開(kāi)始探索科學(xué)計(jì)算產(chǎn)生的有價(jià)值數(shù)據(jù);

2021年收購(gòu)PICO,2023年因硬件體驗(yàn)不成熟,內(nèi)部決定減少內(nèi)容和營(yíng)銷(xiāo)投入,堅(jiān)定技術(shù)投入。從技術(shù)成果來(lái)看,PICO最終成品目前平均PPD(每度像素?cái)?shù))達(dá)到40,中心區(qū)域超過(guò)45,屬于行業(yè)領(lǐng)先水平;通過(guò)MicroOLED定制提升XR設(shè)備清晰度;字節(jié)全鏈路自研的MR頭顯專(zhuān)用消費(fèi)級(jí)芯片目前進(jìn)入量產(chǎn)。

最后是大模型方面,2021年字節(jié)內(nèi)部就有員工訓(xùn)練了大語(yǔ)言模型,但當(dāng)時(shí)他們得到的結(jié)論是,大模型目前沒(méi)什么用。楊震原說(shuō),這也說(shuō)明當(dāng)時(shí)他們很沒(méi)眼光。

這也對(duì)應(yīng)了此前PICO被曝產(chǎn)品計(jì)劃更改、裁員以及計(jì)劃研發(fā)MR設(shè)備的消息。

2023年12月,據(jù)外媒The Information報(bào)道,PICO計(jì)劃取消原有PICO 5的研發(fā)計(jì)劃,轉(zhuǎn)而研發(fā)高端MR頭顯,對(duì)標(biāo)蘋(píng)果Vision Pro。同一時(shí)期,PICO還被曝開(kāi)啟裁員、調(diào)崗,從2023年年初的1800余人團(tuán)隊(duì),縮減至800余人。

今年7月,PICO被曝正在研發(fā)一款MR設(shè)備,計(jì)劃將數(shù)字內(nèi)容疊加在現(xiàn)實(shí)世界視野中,直接對(duì)標(biāo)Meta即將推出的輕量級(jí)MR設(shè)備。

以下是演講全文的關(guān)鍵內(nèi)容總結(jié):

2014年,張一鳴想用大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)來(lái)搭建推薦系統(tǒng),解決各種媒體形式,包括圖片、文字、視頻的推薦,他們計(jì)劃2014年做到萬(wàn)億級(jí)別的特征規(guī)模

楊震原提到這背后在優(yōu)化算法方面的挑戰(zhàn),LR的優(yōu)化是成熟技術(shù),但不同的方法效率、效果差異巨大。字節(jié)內(nèi)部當(dāng)時(shí)僅5個(gè)人,只能選兩個(gè)人同步負(fù)責(zé)兩套優(yōu)化器方案,同步進(jìn)行調(diào)研。

字節(jié)跳動(dòng)VP復(fù)盤(pán)12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

2014年底,字節(jié)逐漸引入FM類(lèi)算法,后來(lái)演化成更通用的深度學(xué)習(xí)體系。如今,其已發(fā)現(xiàn)面向模型訓(xùn)練環(huán)節(jié)的流式更新、較淺層的神經(jīng)網(wǎng)絡(luò)算法在推薦中依然有不錯(cuò)的效果。

2020年,他們意識(shí)到科學(xué)計(jì)算能產(chǎn)生很多有價(jià)值數(shù)據(jù)。

字節(jié)跳動(dòng)在第一性原理計(jì)算、分子動(dòng)力學(xué)上進(jìn)行了探索。今年,字節(jié)和比亞迪成立了聯(lián)合實(shí)驗(yàn)室,會(huì)將高通量自動(dòng)化實(shí)驗(yàn)與科學(xué)計(jì)算算法結(jié)合,探索AI for Science在電池材料領(lǐng)域的工業(yè)落地應(yīng)用。目前,GPU加速DFT計(jì)算、力場(chǎng)+分子動(dòng)力學(xué)模擬、預(yù)測(cè)+設(shè)計(jì)模型均已投入字節(jié)企業(yè)合作伙伴進(jìn)行實(shí)際應(yīng)用。

字節(jié)跳動(dòng)VP復(fù)盤(pán)12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

2021年,字節(jié)收購(gòu)了PICO團(tuán)隊(duì),開(kāi)始同步推進(jìn)兩個(gè)產(chǎn)品路線(xiàn),一是以當(dāng)前的產(chǎn)品形態(tài)為主,同時(shí)投入資源運(yùn)營(yíng)視頻、直播等內(nèi)容,較為激進(jìn)的營(yíng)銷(xiāo);二是投資基礎(chǔ)技術(shù),追求核心體驗(yàn)上一個(gè)大臺(tái)階。

楊震原透露,2023年,其內(nèi)部決定減少內(nèi)容和營(yíng)銷(xiāo)投入,更堅(jiān)定的投入技術(shù)路線(xiàn)。這是因?yàn)楫?dāng)時(shí)產(chǎn)品的硬件體驗(yàn)尚未成熟,無(wú)法支撐大規(guī)模市場(chǎng)應(yīng)用。

楊震原列舉了目前PICO探索的幾條技術(shù)路線(xiàn),包括XR設(shè)備清晰度、MR、交互。

清晰度方面,他們最終的成品平均PPD(每度像素?cái)?shù))達(dá)到40,中心區(qū)域超過(guò)45。楊震原說(shuō),這應(yīng)該屬于行業(yè)領(lǐng)先水平。PPD指人眼睛看一個(gè)度大概有多少像素,PPD大于30大概可以看文字,40會(huì)比較清晰,到60的視覺(jué)體驗(yàn)會(huì)接近視網(wǎng)膜級(jí)清晰度。

為了提升XR設(shè)備的清晰度,2022年P(guān)ICO和供應(yīng)商啟動(dòng)了MicroOLED定制,這使得光學(xué)顯示系統(tǒng)得以進(jìn)一步縮小,從而讓MR頭顯輕便的同時(shí)獲得更高的PPI和整體清晰度。

字節(jié)跳動(dòng)VP復(fù)盤(pán)12年發(fā)展!劇透明年P(guān)ICO新品、全自研MR芯片

MR設(shè)備需要專(zhuān)用芯片,2022年6月,字節(jié)跳動(dòng)內(nèi)部立項(xiàng),全鏈路自研了一顆MR頭顯專(zhuān)用的消費(fèi)電子芯片。芯片于2024年回片,目前已進(jìn)入量產(chǎn)階段,各項(xiàng)指標(biāo)均達(dá)到設(shè)計(jì)要求。

其實(shí)測(cè)顯示,系統(tǒng)延遲可以做到12毫秒左右,楊震原稱(chēng),這非常不容易,即便是世界頂尖公司用軟件來(lái)做,也很難在不明顯犧牲畫(huà)質(zhì)的前提下把延遲壓到25毫秒以?xún)?nèi)。

還有交互層面,PICO建設(shè)了專(zhuān)業(yè)的高精度測(cè)試系統(tǒng)、專(zhuān)門(mén)的3D重建機(jī)制與高精度手勢(shì)數(shù)據(jù)采集系統(tǒng)等,以對(duì)現(xiàn)實(shí)環(huán)境做識(shí)別等。

2023年,進(jìn)入大模型時(shí)代,字節(jié)跳動(dòng)開(kāi)始大力投入。

2021年,字節(jié)內(nèi)部就有員工訓(xùn)練了大語(yǔ)言模型,但內(nèi)部將其用于改進(jìn)搜索發(fā)現(xiàn)效果并沒(méi)有提升。因此當(dāng)時(shí)他們得到的結(jié)論是,大模型目前沒(méi)什么用。楊震原說(shuō),這也說(shuō)明當(dāng)時(shí)他們很沒(méi)眼光。

2022年開(kāi)始投入至今,豆包已經(jīng)成為國(guó)內(nèi)最流行的AI對(duì)話(huà)助手,根據(jù)IDC的報(bào)告火山引擎是中國(guó)MaaS市場(chǎng)的第一名。

楊震原還分享了他對(duì)如何評(píng)估是否達(dá)到AGI的看法,第一是如何讓大模型提高學(xué)習(xí)能力,第二是IO能力,也是AI和世界交互的能力。

演講全文地址:https://mp.weixin.qq.com/s/WtN9e5XXwAAaMR2ymNUMuA