智東西(公眾號:zhidxcom)
作者 | 云鵬
編輯 | 漠影

今天,AI視頻模型火爆全球,呈現(xiàn)出百家爭鳴的態(tài)勢。雖然Sora姍姍來遲,卻還是在上線當(dāng)天就被擠爆了服務(wù)器。

國外有Runway、Luma AI這樣的老牌玩家,國內(nèi)則有各路AI創(chuàng)企和互聯(lián)網(wǎng)科技巨頭接連亮出自家的“中國造Sora”,各種AI生成視頻越來越多地出現(xiàn)在大眾視野中。

愛詩科技、生數(shù)科技、Minimax等AI創(chuàng)企不斷掏出新策略、新功能、新玩法輪番轟炸,而科技大廠字節(jié)跳動、快手也入場攪局。

▲由愛詩科技旗下PixVerse v3.5生成

與此同時,AI視頻生成技術(shù)也在快速迭代發(fā)展,競爭來到新的階段。AI視頻模型的競爭開始從能用到好用,視頻生成的速度、質(zhì)量成為核心競爭焦點(diǎn);另一邊,視頻生成也不局限于文字,隨手發(fā)一張圖就能生成精美視頻已經(jīng)成為現(xiàn)實(shí)。

在這批AI視頻生成開拓者們中間,國內(nèi)愛詩科技旗下PixVerse已成為跑的最快的一家,并在全球市場立下了良好口碑。PixVerse App海外市場一經(jīng)上線,在多個國家殺入下載榜前列甚至位列榜首。

從上個月剛剛火爆全網(wǎng)、朋友圈頻頻刷屏的“毒液特效”視頻,到12月“猛男肌肉特效”視頻,這些“經(jīng)典”都出自PixVerse之手,二者在生成總量上超過幾百萬次,在海外Tiktok平臺曝光量已經(jīng)過億,其在全球范圍的熱度甚至一度超越了Runway和Sora。

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲谷歌搜索熱度趨勢圖,來源:Google Trends

在C端取得如此驕人戰(zhàn)績后,PixVerse繼續(xù)加快腳步,開“卷”專業(yè)AI創(chuàng)作能力,最近PixVerse的v3.5模型版本已經(jīng)正式發(fā)布。

不少海外AI專業(yè)創(chuàng)作者和藝術(shù)家都在體驗(yàn)測試版的過程中給出了極高的評價,稱3.5版本具有非常高的靈活性、富有創(chuàng)意,并且動畫效果著實(shí)很贊。

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲AI藝術(shù)家Pierrick Chevallier

正式上線后,立刻有不少用戶亮出了自己的得意新作,效果還是比較驚艷的:

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲來自X平臺用戶Alfred Cadoux

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲來自X平臺AI創(chuàng)作者AZIZ

智東西也提前體驗(yàn)了PixVerse v3.5的內(nèi)測版本,其生成速度領(lǐng)先數(shù)倍于競品,畫面細(xì)節(jié)滿滿、想象力豐富,動漫效果更是一騎絕塵,可以說十分驚艷。從日常娛樂到專業(yè)創(chuàng)作,AI視頻生成正愈發(fā)深度地走進(jìn)我們的生活。

一、5秒光速出圖,全球首個接近實(shí)時生成的AI視頻模型來了

為了感受PixVerse生成視頻速度之快,我們首先挑選了一個日常生活中常常會遇到的輕負(fù)載高頻次的場景——讓表情包動起來,直接讓一些靜態(tài)梗圖變成動圖!

根據(jù)我們實(shí)際體驗(yàn),在極速(Turbo)模式下,利用一張常見表情包生成視頻的時間最短只有5秒左右,平均在8秒左右。

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

從生成效果來看,基本的描述都可以比較準(zhǔn)確地實(shí)現(xiàn),角色的肢體動作比較自然,遮擋關(guān)系都非常正確,尤其適合做表情包。

雖然在個別案例中,一些視頻生成模型常見的細(xì)節(jié)穿模問題還有待優(yōu)化,但能在10秒之內(nèi)生成如此質(zhì)量的視頻,在體驗(yàn)上已經(jīng)是一種跨越式提升了。

我們也對比了國外的AI視頻生成老大哥Runway,不得不說,Runway在速度這塊的確沒輸多少,也比較快,但生成視頻質(zhì)量卻與PixVerse存在不小差距。生成效果甚至很難達(dá)到“可用”狀態(tài)。

▲基于相同圖片和提示詞,Runway生成結(jié)果

這種犧牲質(zhì)量換速度的策略顯然存在很大風(fēng)險,稍不留神就會“翻車”。

相比Runway,國內(nèi)的可靈、海螺,生成同樣主題視頻的質(zhì)量會好一些,與PixVerse相對接近,但是在速度上卻慢了不少,平均生成時間都在2-3分鐘之間,個別速度較快的案例可以在1分鐘左右。

值得一提的是,PixVerse生成視頻的速度并不是用質(zhì)量換來的,整體對比下來,PixVerse的生成質(zhì)量、對描述的還原程度,在大部分測試中都是最高的。

海外AI藝術(shù)家Volodymyr Cherner也亮出了自己的最新作品,他評論稱,PixVerse可以在1分鐘內(nèi)生成1080P的高清視頻,而不像其他產(chǎn)品一樣需要8-10分鐘,可以說是既快又好的代表了。

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲Volodymyr Cherner作品

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲Volodymyr Cherner作品

所以,高效且高質(zhì)量的視頻生成能夠帶來什么?

最顯而易見的就是效率的提升,進(jìn)而可以轉(zhuǎn)化成實(shí)際生產(chǎn)中的經(jīng)濟(jì)效益提升。

但即使是1分鐘,也與PixVerse存在數(shù)倍的速度差距,10秒與2分鐘之間的差別,帶來的就是十幾倍的生產(chǎn)效率提升。

同樣時間內(nèi),PixVerse可以給創(chuàng)作者提供更多的創(chuàng)作機(jī)會,發(fā)覺更多靈感和創(chuàng)意,大幅增加優(yōu)質(zhì)素材產(chǎn)出的概率、提高效率。

OpenAI的Sora在測試階段,就曾因視頻生成速度太慢的問題飽受詬病,初期Sora甚至需要10多分鐘才能生成一段1分鐘視頻。Luma AI的Dream Machine發(fā)布后,很多用戶甚至需要排隊(duì)等待數(shù)小時才能得到生成的視頻,這無疑大大消耗了用戶的耐心,讓體驗(yàn)打折扣。

相比之下,PixVerse可以幾秒、十幾秒生成視頻,這種體驗(yàn)讓AI視頻生成真正變得更普及,我們可以隨時隨地利用AI生成視頻并與他人交流、分享、使用。

二、解密底層模型升級:運(yùn)動控制、細(xì)節(jié)表現(xiàn)出眾,動漫創(chuàng)作效果行業(yè)第一

正如前文所說,“快”只是PixVerse的一個核心優(yōu)勢,其在生成質(zhì)量方面的表現(xiàn)也可圈可點(diǎn),尤其是在運(yùn)動控制、細(xì)節(jié)呈現(xiàn)以及動漫/動畫效果的表達(dá)上十分亮眼。

首先是運(yùn)動控制的穩(wěn)定性。比如在這個山路騎行的視頻中,人物騎行的動作十分自然,車輛行駛的軌跡也控制的比較好,遠(yuǎn)處的背景與騎行者的關(guān)系也保持的比較穩(wěn)定,鏡頭跟隨效果自然。

在滑板視頻中,滑板的運(yùn)動軌跡展現(xiàn)是極為困難的,同時模型對人物肢體動作的控制和展現(xiàn)也都表現(xiàn)的比較好,沒有出現(xiàn)明顯的不協(xié)調(diào)或違和感。

接下來,我們來看看PixVerse模型對細(xì)節(jié)的表現(xiàn)力,以及非現(xiàn)實(shí)創(chuàng)作能力。

在這組圣誕老人在紐約都市夜晚送圣誕禮物的視頻中,我們選擇了3D動畫模式,模型表現(xiàn)出了出色的非現(xiàn)實(shí)畫面創(chuàng)作能力,對于圣誕老人會以何種形式出現(xiàn)在大都市中,模型給出了很好的答案。

同時,圣誕老人的形象可愛逼真,馴鹿的運(yùn)動姿態(tài)很自然,符合常理。在雪橇滑行過程中,我們甚至可以看到很多細(xì)節(jié),比如雪橇的顛簸、雪花輕輕濺起、陰影自然跟隨。

在另一個北極熊在極光下做冰雕的視頻中,3D動畫版的北極熊憨態(tài)可掬,十分可愛,其毛發(fā)柔順細(xì)密仿佛觸手可及,同時北極熊手握冰雕工具的姿態(tài)也十分準(zhǔn)確,進(jìn)行雕刻的動作也十分自然真實(shí),另外冰雕中的光線映射也比較擬真。

模型可以很好地想象出本不可能存在的場景,并將一些基本的動作和細(xì)節(jié)的刻畫都做到位。

在另外兩組現(xiàn)實(shí)人物面部特寫視頻中,模型一方面可以非常高質(zhì)量的呈現(xiàn)人物面部細(xì)節(jié),比如膚質(zhì)、毛孔,同時模型可以準(zhǔn)確呈現(xiàn)我們描述的人物神態(tài),比如驚恐或是平靜。

火光在人物面部的映射,視頻背景的自然虛化,這些細(xì)節(jié)也都做的比較到位。

在動漫、動畫創(chuàng)作方面,我們還讓PixVerse生成了一組海賊王主題的視頻,視頻中路飛和娜美在船頭激情碰拳,模型可以準(zhǔn)確還原動漫人物的標(biāo)志性特點(diǎn),角色的配色都沒有問題,同時動作自然沒有違和感。

在一組動漫風(fēng)格的賽車追逐戰(zhàn)視頻中,漫畫中常見的速度感、力量感線條表達(dá)被很好地呈現(xiàn)了出來,車輛的運(yùn)動、鏡頭的運(yùn)鏡都處理的十分到位。

可以看到,在動漫、動畫創(chuàng)作方面,PixVerse的表現(xiàn)是十分驚艷的。據(jù)了解,目前PixVerse的動漫動畫視頻創(chuàng)作效果SOTA行業(yè)第一。

最后,PixVerse的視頻生成還支持首尾幀功能,用3D數(shù)字藝術(shù)家Travis Davids的話來說,兩幅構(gòu)圖相近的圖像放在一起非常有趣,就像變魔術(shù)一樣。

最快5秒光速出片,全球首個接近實(shí)時生成的AI視頻模型來了

▲Travis Davids作品,下方圖片為首尾幀

整體來看,PixVerse 3.5版本的升級帶來了非常直觀的用戶體驗(yàn)提升,其兼顧了生成速度和畫質(zhì),在細(xì)節(jié)表現(xiàn)上十分出眾,動畫動漫效果成為其突出優(yōu)勢之一。結(jié)合極具性價比的價格,不論是對大眾消費(fèi)者還是專業(yè)創(chuàng)作者,PixVerse無疑都是當(dāng)下國內(nèi)AI視頻生成領(lǐng)域的更優(yōu)選擇。

結(jié)語:AI視頻大模型競爭升級,從能用走向普及好用

如今,AI大模型技術(shù)的發(fā)展已經(jīng)從比拼參數(shù)走向比拼商業(yè)化落地,如何真正給消費(fèi)者和企業(yè)帶來好的體驗(yàn),真正賦能生產(chǎn)力、提升生產(chǎn)效率,成為競爭焦點(diǎn)。AI視頻生成賽道也不例外。

相比姍姍來遲吊足胃口的Sora,國內(nèi)外一眾AI創(chuàng)企和科技巨頭都已亮出各種產(chǎn)品,像PixVerse這樣的年輕力量已經(jīng)走向世界舞臺并斬獲佳績。愛詩科技憑借底模的升級,在速度顛覆性提升的基礎(chǔ)上兼顧質(zhì)量,將AI視頻模型生成從能用帶向好用。

今天,AI視頻生成工具這把火正越燒越旺,消費(fèi)者認(rèn)知度也越來越強(qiáng),隨著“內(nèi)卷”的加劇,企業(yè)想要真正殺出重圍,還是要靠技術(shù)硬實(shí)力說話。體驗(yàn)好不好,消費(fèi)者自會用腳投票。