智東西(公眾號(hào):zhidxcom)
作者|依婷
編輯|漠影
智東西12月5日?qǐng)?bào)道,2022年ChatGPT面世即萬(wàn)眾矚目,又在兩個(gè)月內(nèi)獲得了1億注冊(cè)用戶,點(diǎn)燃了大眾對(duì)AI的期待,也讓業(yè)界看到了AI大模型技術(shù)廣泛的應(yīng)用前景。
兩年間,AI大模型如雨后春筍般涌現(xiàn)。中國(guó)信通院數(shù)據(jù)顯示,截至2024年7月,全球AI大模型數(shù)量為1328個(gè)(包含同一企業(yè)、同一模型的不同參數(shù)版本),中國(guó)大模型數(shù)量占比36%。行業(yè)對(duì)模型的研發(fā)和應(yīng)用也已經(jīng)從最開(kāi)始的大語(yǔ)言模型,走到了多模態(tài)模型。而算力、網(wǎng)絡(luò)等AI大模型賴以生存和發(fā)展的基礎(chǔ)設(shè)施,仍需要不斷優(yōu)化。
在中國(guó)大模型進(jìn)入所謂“洗牌年”的節(jié)點(diǎn)上,昨日,智東西等媒體和中國(guó)AI大模型獨(dú)角獸MiniMax副總裁劉華、騰訊云北區(qū)云原生總經(jīng)理田豐進(jìn)行了交流。他們從雙方公司的合作出發(fā),談及了算力、網(wǎng)絡(luò)對(duì)AI大模型落地應(yīng)用帶來(lái)的影響。
一、多模態(tài)大模型期待更有性價(jià)比的算力
MiniMax成立于2021年12月,是“國(guó)產(chǎn)大模型六小虎”之一,自主研發(fā)了包括萬(wàn)億參數(shù)的MoE文本大模型、語(yǔ)音和音樂(lè)大模型、圖像大模型、視頻大模型在內(nèi)的多模態(tài)通用大模型。
成立至今三年,基于不同模態(tài)的通用大模型,MiniMax推出了智能助手“海螺AI”、AI內(nèi)容社區(qū)“星野”“Talkie”等C端應(yīng)用;MiniMax開(kāi)放平臺(tái)則為企業(yè)和開(kāi)發(fā)者提供API服務(wù)。
采訪中,劉華從AI大模型公司的角度出發(fā),談到了多模態(tài)大模型應(yīng)用過(guò)程中不斷提高的算力成本問(wèn)題。
他說(shuō),以往的大模型處理的是文本任務(wù),現(xiàn)在的大模型處理的是語(yǔ)音任務(wù)、視頻任務(wù);用token來(lái)計(jì)算的話,一個(gè)小視頻的tokens比一篇文章的tokens高出太多。如果要讓新的技術(shù)落地、讓更多的企業(yè)或個(gè)人能夠接受新技術(shù),就必須確保大模型能夠以非常有性價(jià)比的方式處理大規(guī)模的輸入或輸出。
二、大集群并不等于大算力,要優(yōu)化資源利用率
自MiniMax成立以來(lái),騰訊云就與其建立了合作關(guān)系,為其提供算力、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施支持。田豐形容兩家公司“是一起手牽手走到今天”,在大模型的發(fā)展過(guò)程中,“一起去解決難題,是雙向奔赴的一個(gè)過(guò)程”。
站在云服務(wù)廠商的視角,田豐分享了這兩三年來(lái)自己對(duì)客戶需求變化的觀察。
他說(shuō),大模型公司客戶早期可能需要的是千卡集群,現(xiàn)在可能都是要上萬(wàn)卡,后續(xù)可能會(huì)到十萬(wàn)卡,“這個(gè)規(guī)模對(duì)我們的組網(wǎng)的能力、集群的運(yùn)維,都是一個(gè)非常大的、全新的挑戰(zhàn),跟原來(lái)完全是不一樣的”。
田豐拿“網(wǎng)絡(luò)”舉例。他稱,訓(xùn)練萬(wàn)億參數(shù)的大模型時(shí),傳統(tǒng)的網(wǎng)絡(luò)協(xié)議容易造成擁堵、高延時(shí)。在這個(gè)過(guò)程中,0.1%的丟包率都會(huì)導(dǎo)致50%的續(xù)訓(xùn)效率的下降;中斷恢復(fù)之后,需要從上一個(gè)續(xù)訓(xùn)點(diǎn)繼續(xù)訓(xùn)練模型,這會(huì)給萬(wàn)億規(guī)模的模型訓(xùn)練造成非常大的損失。
另外,田豐還提到,大集群并不等于大算力,算力不是靠簡(jiǎn)單地“堆”出來(lái)的,而是需要大量?jī)?yōu)化和調(diào)整GPU資源的利用率,以及網(wǎng)絡(luò)傳輸通訊的效率。
結(jié)語(yǔ):大模型開(kāi)啟淘汰賽,技術(shù)最終要盈利去賺錢(qián)
整整兩年時(shí)間,生成式AI走過(guò)通用基座大模型的“百模大戰(zhàn)”與“價(jià)格戰(zhàn)”,面臨落地應(yīng)用與商業(yè)化檢驗(yàn)。多模態(tài)模型的研發(fā)和優(yōu)化依舊在緊鑼密鼓地進(jìn)行,應(yīng)用落地并成功跑出商業(yè)模式也不可或缺。
AI大模型行業(yè)或許已進(jìn)入淘汰賽階段,算力、技術(shù)、產(chǎn)品都成為競(jìng)爭(zhēng)要素。中國(guó)大模型“洗牌年”,大模型公司和云服務(wù)廠商們都在打起精神。
可能就像是田豐在采訪中說(shuō)的:“實(shí)踐是檢驗(yàn)AI的唯一標(biāo)準(zhǔn)。AI大模型是長(zhǎng)跑,投資人和創(chuàng)業(yè)者都需要有信心和耐心,炫酷的技術(shù)最終還是要落實(shí)到商業(yè)化本身,要盈利去賺錢(qián)。”