智東西(公眾號:zhidxcom)
編輯 | Panken

智東西1月15日報道,今日,生數(shù)科技發(fā)布視頻大模型Vidu 2.0,將視頻大模型的價格進一步打下來。

Vidu 2.0的核心升級包括:速度上,視頻生成速度跑進10秒;?價格上,生成單秒視頻僅需4分錢,同時上線“錯峰模式”,支持閑時不限量生成,不卡積分、不卡條數(shù);?模型效果首尾幀流暢,風格和多主體保持更穩(wěn)定,鏡頭運動表現(xiàn)出色。

▲國外用戶生成的Vidu不同版本對比視頻

此外,Vidu研發(fā)團隊也罕見公布了運營數(shù)據(jù):自2024年7月底全球上線以來,20天用戶數(shù)突破百萬,上線100天用戶數(shù)突破千萬。截至目前,來自全球200個國家和地區(qū)的用戶在Vidu平臺上共計生產(chǎn)了上億條視頻。

根據(jù)已公開的數(shù)據(jù),Vidu是目前全球增速最快的AI視頻模型產(chǎn)品。?

一、生成時長最快不到10秒,速度提升3倍

生成速度是視頻大模型的一大瓶頸。Vidu團隊一直在方面精進,去年7月底全球上線1.0版本時,單片段的實測推理速度就已跑進了30秒內(nèi),實現(xiàn)全球最快,此次2.0在生成速度上更是突破到秒級。

不管是圖生視頻、首尾幀生視頻,生成4秒512P單片段視頻不到10秒,速度比前代版本提升了3倍

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了▲Vidu 2.0 512-4s圖生視頻生成速度實時測評?

而提升生成速度對廣告制作、影視動畫等專業(yè)內(nèi)容創(chuàng)作的效率提升很有幫助。

比如廣告商業(yè)片,以前傳統(tǒng)廣告制作中,光拍攝周期可能在3-5天,后期制作更是耗時耗力,從5-15天不等,總體上一條1分鐘廣告片的交付周期在1個月左右。?

而使用Vidu 2.0,理想狀態(tài)下,僅需花5分鐘就能跑出足夠1分鐘時長的視頻素材,等于是既節(jié)約拍攝時間,又節(jié)省后期制作成本。??

二、加量還降價!單秒視頻僅需“4分錢”,百元就能產(chǎn)出1分鐘商業(yè)片??

目前市場上的視頻模型采用的是訂閱制,訂閱費不菲,每月還會有積分的限制。

Sora剛上線時,就有海外用戶吐槽Sora價格“太貴了”,生成一個5秒480P視頻成本為0.5美元,折合人民幣3.63元,生成一段1080p視頻成本更是高達27元。?

再比如Runway,產(chǎn)出一條素材需要花費25積分,每月625積分只能產(chǎn)出25條5秒左右的素材片段。而做1分鐘的廣告片,至少需要可能5分鐘甚至更多的素材,每月625積分是遠遠不夠用的。若生成質(zhì)量不高,還需要不斷地提升會員權益,不斷買積分。?

此次Vidu 2.0推出了全新的收費套餐,直接將每秒單價成本降至最低4分錢,讓人人都能用得起。?

橫向與同類模型產(chǎn)品對比,以各家720P每秒單價計算,Vidu 2.0為0.258元/秒,行業(yè)平均價格約為0.6元/秒。

大致算下來的話,Vidu 2.0 720P的收費僅為行業(yè)平均的43%,也就是連現(xiàn)在業(yè)內(nèi)平均價格的一半都不到。Runway雖然效果不錯,但每秒單價超過了0.5元。?

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了

價格便宜了,意味著能生成更多的視頻素材。

以720P為例,目前市面上的視頻模型,10元錢平均只能生成20秒的視頻,而Vidu 2.0能生成38秒的視頻,接近行業(yè)平均水平的2倍。

也就是說,可能用不到百元的成本,就能完成一支短片的制作。

粗略算筆賬,通常傳統(tǒng)廣告片制作需要經(jīng)過平面、動效、剪輯等流程,需要雇傭剪輯師、畫師、特效師等等,即使是一個4-5人的小團隊,按照普通出品水準,制作1分鐘廣告片的行業(yè)平均成本至少也在3000-5000元左右。

而采用Vidu 2.0生成1分鐘商業(yè)廣告片素材的成本在3-5元左右,即便考慮素材的有效率和后期剪輯配音等成本,1分鐘廣告片的成本也大約為100元左右,相比傳統(tǒng)制作廣告,成本下降到1/50~1/30

據(jù)爆款AI短劇創(chuàng)作者閑人一坤分享,以前做類似規(guī)模的動畫項目,團隊規(guī)模通常需要40-50人,現(xiàn)在整個項目組不到10個人就能高效運轉(zhuǎn),人力需求直接降低到了原來的四分之一以下。成本上,傳統(tǒng)的影視拍攝需要投入大量資金購買專業(yè)設備和軟件,動輒幾十萬甚至上百萬的投入。而使用Vidu,整體的軟件使用成本降到了一個完全不同的數(shù)量級,可以說是大大降低了創(chuàng)作的門檻和成本。

Vidu還悄悄上線了省錢妙招——“錯峰模式”。

該模式有點類似于飯店閑時特價,用戶申請的任務將排隊等待流量低峰時執(zhí)行,錯峰生成不僅不扣用戶現(xiàn)有積分,而且生成素材無限量,想生成多少次就生成多少次。

有率先體驗Vidu 2.0內(nèi)測的用戶在社交平臺評價:“目前vidu,生成很快,再配合無限生成,很爽?!?/p>

三、風格、主體、動作穩(wěn)定性更高

除了增速降價,Vidu 2.0的效果質(zhì)量也進一步升級。

首先是風格一致性保持更穩(wěn),畫面細節(jié)、主體更加穩(wěn)定,鏡頭運動理解更強,圖生視頻能夠完整理解風格元素、始終保持整體畫面風格一致。

比如一張卷發(fā)男子在花叢中的油畫圖片,風格偏印象派,Vidu 2.0生成的視頻能保持男生手中的花與畫面背景的花是一致的,油畫風格貫穿始終。其他模型生成的視頻則有不同程度的崩壞。

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了

再比如水墨風格的視頻生成,下圖老虎在慢慢靠近,Vidu 2.0沒有出現(xiàn)風格突然變換的問題,Pika 2.0生成的視頻則在最后幾秒突然變彩色,Runway的畫風也逐漸跑偏。

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了

生數(shù)還展示了一個將商品海報圖用Vidu 2.0參考生視頻變成動態(tài)視頻的示例,比如做一個貓糧的視頻宣傳,讓貓咪伸出爪子吃貓糧。

這種動態(tài)表現(xiàn)更能引發(fā)貓主子們的購買欲。不過可以看到畫面在還原物理特性上仍有進步空間,爪子碰到貓糧后不是自然地扒拉下貓糧,而是有點穿過貓糧的既視感。

Vidu 2.0的鏡頭運動表現(xiàn)也更自然流暢,對鏡頭運動指令的理解更加到位。據(jù)生數(shù)分享,電影中常見的上下左右推拉旋轉(zhuǎn)鏡頭運動方面,Vidu 2.0在同類視頻生成模型中表現(xiàn)更佳。

以下圖動漫人物為例,輸入提示詞“鏡頭順時針旋轉(zhuǎn)”,Vidu 2.0理解得更到位。

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了

首尾幀畫面切換同樣更加自然。繼2024年10月Vidu首次上線首尾幀功能后,Vidu 2.0將首尾幀的性能進一步提升,中間過渡更絲滑流暢,畫面穩(wěn)定性更強,同時在首尾幀中間的場景切換、鏡頭切換更具有想象力,實現(xiàn)了想象力和穩(wěn)定性更好的平衡。

例如下面的視頻,從兩個古人在秋天圍爐喝茶的畫面一下穿越到大雪紛飛的古城街頭,Vidu 2.0生成的視頻更讓人有種瞬時穿越感。

相比之下,Sora生成的視頻的切換,就有點像切PPT了。

Vidu 2.0還大幅提升了參考生視頻的性能。在不同風格的主體和背景的穩(wěn)定性上,Vidu 2.0不僅相較Vidu 1.5提升較大,而且相比Pika 2.0,在穩(wěn)定性上拉開了明顯差距。

在三維動畫風格中,Pika 2.0的視頻中出現(xiàn)了崩壞的情況,相對而言Vidu 2.0在多主體情況下仍然保持了畫面主體和背景的一致。

Vidu 2.0的主體相似度保持得更好,生成的視頻的主體、背景都與參考圖更像,即使在打架這種大幅度動作中也能保持主角的一致。相比之下,Pika 2.0生成的視頻中,白衣男生與參考圖完全判若兩人,眼睛都變成綠色了,很難將參考角色與視頻聯(lián)系起來。

四、用戶數(shù)20天破百萬,百天破千萬,全球增速第一

Vidu首次對外公布了運營數(shù)據(jù):自7月底全球上線以來,Vidu僅用了20天用戶數(shù)就突破百萬,上線100天用戶數(shù)就突破千萬。

截至目前,Vidu平臺累計生成的視頻數(shù)突破億條,其中“參考生視頻”功能僅上線三個月,用戶利用該功能生成的視頻數(shù)就已達到千萬級別。

雖然Vidu未公開最新用戶數(shù),但相比市面上已知的競品情況,愛詩科技于11月18日公布用戶數(shù)超1200萬,討論度較高的可靈于12月10日公布的用戶數(shù)超600萬。相比之下,Vidu在10月底就實現(xiàn)了千萬用戶數(shù),用戶規(guī)模遠超可靈。

從用戶覆蓋地區(qū)看,Vidu已服務了全球超過200個國家和地區(qū),用戶規(guī)模位列全球第一梯隊。

之前有一位美國60歲老奶奶MamaFish用Vidu把她創(chuàng)作的兒童故事變成視頻形式,在短短20分鐘內(nèi)創(chuàng)建50多個場景,而且成本非常便宜。MamaFish的視頻在YouTube上廣受歡迎,還因此獲得了更多收益。

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了
▲MamaFish利用Vidu創(chuàng)作的兒童動畫短片《如果我是一頭牛(If I Were A Cow)》的截圖

在日本,@8co28 是Vidu第一批早期用戶,是一位二次元愛好者,曾嘗試過kling、gen3、hailuo、pika、luma等產(chǎn)品來創(chuàng)作二次元動畫。最終,他選擇了用Vidu,認為Vidu在參考生視頻方面要比其他平臺有更強大的優(yōu)勢,同時對于大動作大動態(tài)的處理也十分突出。因為所制作AI視頻的出色效果,@8co28 吸引了更多人的關注,粉絲數(shù)已經(jīng)超過35萬。

1秒低至4分錢、20天用戶超百萬,國產(chǎn)視頻大模型把價格打下來了
▲@8co28 用Vidu生成的AI動畫截圖

Vidu的產(chǎn)品力也獲得了許多企業(yè)的認可。Evoke是一家面向海外用戶的AI圖生視頻應用,也是Vidu早期的Maas客戶。自從接入Vidu的API后,據(jù)Evoke內(nèi)部數(shù)據(jù),在“擁抱”、“親吻”等場景上,相較于同類視頻生成平臺,Vidu在模型準確率提升了超60%,在視頻生成時間上從270秒縮短到35秒,時間相對下降了近九成。用戶滿意度也有顯著提升,用戶取消視頻生成的概率降低了10%。這些用戶體驗幫助Evoke在海外獲得了更多注冊用戶和付費用戶。

結(jié)語:視頻大模型普惠第一步,拔高性價比

Vidu 2.0的發(fā)布,推動視頻生成進入“秒級時代”,再加上更親民的價格,標志著視頻生成領域邁向“人人可用”階段,從小眾走向大眾。

隨著生成時間的快速提升,長期來看,視頻生成逐步走向?qū)崟r生成,未來有望誕生全新的內(nèi)容互動形式,創(chuàng)造類似互動短劇、互動游戲等全新用戶體驗。?