智東西(公眾號(hào):zhidxcom
作者?|?香草
編輯?|?李水青

智東西6月28日?qǐng)?bào)道,今天,百度在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會(huì)2024上,正式發(fā)布文心大模型4.0 Turbo版本,其同步上線網(wǎng)頁端和API接口,App端也將陸續(xù)上線。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心大模型4.0 Turbo API開放

同時(shí),飛槳平臺(tái)發(fā)布新一代飛槳框架3.0 Beta版本,具備大模型訓(xùn)推一體、動(dòng)靜統(tǒng)一自動(dòng)并行、編譯器自動(dòng)優(yōu)化以及大模型多硬件適配等特色。

百度智能代碼助手Baidu Comate升級(jí)至2.5版本,開發(fā)、業(yè)務(wù)迭代及企業(yè)落地速度大幅提升,并擁有了全新的中文名“文心快碼”,正式加入百度“文心大家族”。

據(jù)百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰介紹,文心一言目前用戶規(guī)模已突破3億,每日調(diào)用量超過5億;飛槳平臺(tái)已累計(jì)服務(wù)1465萬開發(fā)者、37萬企業(yè),構(gòu)建了超95萬個(gè)模型。

一、用戶規(guī)模突破3億,文心大模型4.0 Turbo上線

經(jīng)過幾十年的發(fā)展,AI技術(shù)從早期的人工撰寫規(guī)則,到后來的統(tǒng)計(jì)機(jī)器學(xué)習(xí),演進(jìn)到深度學(xué)習(xí)時(shí)代,再到大模型時(shí)代,算法、模型變得更加通用和統(tǒng)一。

王海峰談道,大模型為AGI帶來曙光,可以從兩個(gè)角度解讀,一是AI技術(shù)的通用性,二是AI能力的全面性。其中,全面的AI能力主要包括理解、邏輯、生成、記憶四個(gè)部分。

百度于2019年3月推出文心大模型1.0,經(jīng)過多次迭代,其4.0版本于去年10月發(fā)布。目前,文心一言累計(jì)用戶規(guī)模已達(dá)3億,日調(diào)用次數(shù)5億。

今天,百度推出文心大模型4.0 Turbo版本,其網(wǎng)頁端、API即日起面向用戶開放,App端也將陸續(xù)上線,企業(yè)用戶可登錄百度智能云千帆大模型平臺(tái)調(diào)用API服務(wù)。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心大模型4.0 Turbo發(fā)布

文心4.0 Turbo在生成速度和效果上大幅提升。王海峰現(xiàn)場(chǎng)演示了其與4.0版本的生成效果對(duì)比,在相同的提示詞下,4.0 Turbo的生成速度明顯更快,生成內(nèi)容也更具條理性。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心4.0 Turbo與文心4.0生成速度對(duì)比

在基礎(chǔ)模型升級(jí)上,百度進(jìn)一步研發(fā)了智能體(Agent)機(jī)制,包括理解、規(guī)劃、反思和進(jìn)化,使其能夠可靠執(zhí)行、自我進(jìn)化,并一定程度上將思考過程白盒化,讓大模型像人一樣思考和行動(dòng),調(diào)用工具自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實(shí)現(xiàn)自主進(jìn)化。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲基于文心大模型的智能體升級(jí)

百度還與中國(guó)工程院朱有勇院士及團(tuán)隊(duì)共同打造了首個(gè)農(nóng)業(yè)智能體“農(nóng)民院士智能體”,其基于文心智能體平臺(tái)創(chuàng)建,吸收了朱有勇院士的研究成果以及相關(guān)的農(nóng)業(yè)知識(shí),可以為農(nóng)民解答生產(chǎn)生活中的問題。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲農(nóng)民院士智能體

百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜談道,在過去半年,用戶使用文心大模型的日均提問量提升了78%,提問平均長(zhǎng)度提升89%,使用的提示詞變得越來越復(fù)雜、具體。

大量的應(yīng)用基于文心大模型進(jìn)行創(chuàng)新,截至目前,文心一言已經(jīng)創(chuàng)作了5.9億篇文章,繪制了2.4億張圖片,生成了70億行代碼,共輔助了1.3億人次工作。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心大模型累計(jì)成效

吳甜還分享了文心大模型星河共創(chuàng)計(jì)劃取得的成果,自去年8月啟動(dòng)以來,已創(chuàng)建1000+大模型工具,超55萬AI應(yīng)用,積累了超1000B高質(zhì)量數(shù)據(jù)。

例如,百度與長(zhǎng)光衛(wèi)星技術(shù)有限公司合作開發(fā)了共生地球智能助手,上線首月就服務(wù)了3.1萬用戶,解答遙感技術(shù)問題超3.8萬次。

二、飛槳推出3.0測(cè)試版,四層框架、四大優(yōu)勢(shì)

飛槳是百度推出的開源開放產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái),據(jù)王海峰介紹,其目前已累計(jì)服務(wù)1465萬開發(fā)者、37萬家企業(yè),創(chuàng)建了95萬個(gè)模型。

今天,飛槳框架3.0 Beta版本正式發(fā)布,具備動(dòng)靜統(tǒng)一自動(dòng)并行、編譯器自動(dòng)優(yōu)化、大模型多硬件適配、大模型訓(xùn)推一體4大特點(diǎn)。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲百度飛槳框架3.0 Beta

在設(shè)計(jì)理念上,考慮到大模型和異構(gòu)多芯發(fā)展趨勢(shì),為了保障大模型訓(xùn)練推理性能、簡(jiǎn)化大模型開發(fā)調(diào)優(yōu)過程以及更好地適配各種芯片,飛槳與文心聯(lián)合,在訓(xùn)練、推理兩個(gè)方面定向優(yōu)化。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲飛槳框架設(shè)計(jì)理念

具體來說,動(dòng)靜統(tǒng)一的自動(dòng)并行能力通過極簡(jiǎn)開發(fā),實(shí)現(xiàn)大模型的混合并行訓(xùn)練,可以將分布式訓(xùn)練核心代碼量減少50%以上,典型模型訓(xùn)練性能領(lǐng)先20%。

編譯器自動(dòng)優(yōu)化能高效支撐大模型與AI科學(xué)計(jì)算,通過一體化設(shè)計(jì)提升通用模型訓(xùn)練效率,將大模型推理通用性能提升30%,典型科學(xué)計(jì)算模型求解速度領(lǐng)先71%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲編譯器自動(dòng)優(yōu)化

在大模型多硬件適配方面,通過低成本的硬件接入支撐軟硬協(xié)同優(yōu)化,開發(fā)者僅需適配30余接口即可全面支持大模型訓(xùn)練、壓縮、推理。

大模型訓(xùn)推一體是飛槳框架3.0的核心特色,通過訓(xùn)練、壓縮、推理的無縫銜接,實(shí)現(xiàn)RLHF訓(xùn)練復(fù)用推理引擎加速2.1倍,量化壓縮復(fù)用分布式策略效率提升3.8倍。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲大模型訓(xùn)推一體

從整體框架來看,飛槳3.0分為表示層、調(diào)度層、算子層、適配層共4層架構(gòu)。值得注意的是,飛槳3.0的開發(fā)接口和2.0版本完全兼容,用戶無需將代碼推翻重來。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲飛槳3.0框架

飛槳還針對(duì)AI for Science進(jìn)行了優(yōu)化,能夠適配主流科學(xué)計(jì)算庫(kù)130多個(gè)模型,覆蓋數(shù)據(jù)、機(jī)理、數(shù)理融合的全球求解模式,能廣泛支持科學(xué)問題分析,其中基于高階自動(dòng)微分及編譯優(yōu)化技術(shù),方程求解類模型對(duì)比PyTorch求解速度平均領(lǐng)先71%。

三、智能代碼助手升級(jí)2.5版本,覆蓋百度內(nèi)部80%程序員

百度副總裁陳洋發(fā)布了智能代碼助手Comate的2.5版本,升級(jí)后的代碼助手集成了更多研發(fā)知識(shí),覆蓋流程更全面。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲百度智能代碼助手升級(jí)2.5版本

同時(shí),該助手還擁有了中文名字——文心快碼,正式加入百度文心大家族。

陳洋介紹道,文心快碼的“快”主要體現(xiàn)在3個(gè)方面:開發(fā)速度快、業(yè)務(wù)迭代快、企業(yè)落地快。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼2.5

具體來說,在開發(fā)速度上,文心快碼融合了更多研發(fā)知識(shí),包括數(shù)百位技術(shù)專家的實(shí)踐經(jīng)驗(yàn)、十億級(jí)研發(fā)領(lǐng)域知識(shí)以及上萬企業(yè)的研發(fā)場(chǎng)景。

在百度內(nèi)部使用中,基于文心快碼生成的開發(fā)框架代碼準(zhǔn)確度達(dá)到80%,單位時(shí)間內(nèi)提交代碼數(shù)量提升了35%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼開發(fā)速度提升

在業(yè)務(wù)迭代上,文心快碼無縫集成研發(fā)各個(gè)環(huán)節(jié),包括需求的調(diào)研、設(shè)計(jì),代碼的編寫、測(cè)試、發(fā)布等。

陳洋稱,在百度研發(fā)環(huán)節(jié)的單點(diǎn)提效上,基于文心快碼的單行代碼編寫時(shí)長(zhǎng)壓縮到1.74秒,部署腳本自動(dòng)生成達(dá)到秒級(jí),單次線下環(huán)境部署耗時(shí)節(jié)省10分鐘以上??偟膩碚f,對(duì)單個(gè)工程師的研發(fā)整體提效超過14%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼業(yè)務(wù)迭代速度提升

在企業(yè)落地層面,針對(duì)行業(yè)規(guī)范差異、企業(yè)私域知識(shí)、代碼助手與企業(yè)內(nèi)部工具結(jié)合等痛點(diǎn),文心快碼提供安全可信、適配業(yè)務(wù)等核心能力。

經(jīng)過1年的實(shí)踐周期,在百度內(nèi)部過萬名工程師中,文心快碼的覆蓋率已達(dá)到80%,其生成代碼的采用率達(dá)到46%,新增代碼生成占比29%。

陳洋還分享了標(biāo)桿客戶喜馬拉雅的落地案例,其只用1個(gè)季度,就實(shí)現(xiàn)了工程師中90%的覆蓋率,代碼采納率達(dá)到44%,新增代碼生成占比33%。

文心大模型4.0 Turbo來了!百度推出文心快碼2.5,已覆蓋內(nèi)部80%程序員

▲文心快碼企業(yè)落地案例

喜馬拉雅CTO姜杰稱,文心快碼與喜馬拉雅積累的研發(fā)能力、知識(shí)相融合,大幅縮短了技術(shù)調(diào)研和代碼編寫時(shí)間,極大提升了企業(yè)整體研發(fā)效率和產(chǎn)品質(zhì)量。

目前,文心快碼提供標(biāo)準(zhǔn)版、專業(yè)版、企業(yè)版以及企業(yè)專有版共4個(gè)版本,其中專業(yè)版面向?qū)I(yè)開發(fā)者限時(shí)開放,基礎(chǔ)功能和高級(jí)功能與模型不限量使用。

結(jié)語:AI進(jìn)入工業(yè)大生產(chǎn)階段

從歷史的角度來看,縱觀前三次工業(yè)革命,其核心驅(qū)動(dòng)力量機(jī)械技術(shù)、電氣技術(shù)和信息技術(shù)都具備很強(qiáng)的通用性。王海峰談道,當(dāng)它們呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的工業(yè)大生產(chǎn)特征時(shí),核心技術(shù)就進(jìn)入工業(yè)大生產(chǎn)階段。

目前,包括算法、數(shù)據(jù)、模型、工具等在內(nèi)的AI技術(shù),也已經(jīng)具備了較強(qiáng)的通用性,并具備了標(biāo)準(zhǔn)化、模塊化和自動(dòng)化的特征,推動(dòng)AI進(jìn)入工業(yè)大生產(chǎn)階段。