智東西(公眾號:zhidxcom)
作者 | 陳駿達(dá)
編輯 | 漠影

這一多模態(tài)AI創(chuàng)意工具,迎來多項重磅升級!

智東西11月6日報道,近日,昆侖萬維旗下的多模態(tài)創(chuàng)意工具平臺SkyReels迎來一波集中升級,其中最大的亮點就是,他們用一張“無限畫布”,取代了復(fù)雜的創(chuàng)作交互方式。

在新版SkyReels上,無論是圖片、視頻生成還是數(shù)字人,每一種內(nèi)容的生成、編輯與組合都可以在同一張“無限畫布”上完成,并且通過簡單拖拽即可實現(xiàn)多模態(tài)內(nèi)容的自由創(chuàng)作。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

這些新功能并非孤立存在,而是相互聯(lián)動、形成層次分明的解決方案。SkyReels根據(jù)用戶不同的工具使用能力,提供了三種創(chuàng)作路徑:

熟悉AI工具的用戶可以直接使用AI模型生成圖片、視頻、音頻或數(shù)字人內(nèi)容;希望更高效創(chuàng)作的用戶,則可依托近30款聚焦特定場景的Expert Agent,快速完成生成;而對沒有創(chuàng)作經(jīng)驗的小白用戶,只需套用智能模板,通過簡單的文字描述和畫面替換,即可輕松復(fù)刻參考內(nèi)容。

在此基礎(chǔ)上,SkyReels還推出了Agentic Copilot模式——集Super Agent與Expert Agents于一體的“雙核驅(qū)動”體系。用戶可以通過自然語言、上傳素材或提供鏈接,讓AI理解并生成跨模態(tài)的創(chuàng)意內(nèi)容。我們還用這一功能,復(fù)刻了Vlog之父Casey Neistat的拍攝風(fēng)格。

無論是捕捉靈感瞬間,還是規(guī)劃完整的創(chuàng)作流程,Agent都能提供智能輔助,讓復(fù)雜的創(chuàng)作變得輕松、高效。

智東西對SkyReels近期的升級進(jìn)行了全面體驗。可以說,這一升級后的創(chuàng)作平臺,不僅在功能上提供了便利,更在整體體驗上實現(xiàn)了統(tǒng)一與流暢。無限畫布、智能Agent等要素的結(jié)合,讓用戶能夠在一個簡潔直觀的平臺上,實現(xiàn)海量創(chuàng)意的可能。

一、一張無限畫布,如何統(tǒng)一AI多模態(tài)創(chuàng)作?

如今的多模態(tài)AI創(chuàng)作平臺看起來五花八門、功能強大,但用起來卻常常讓人頭大。界面層層疊疊,操作邏輯又有點反直覺,更麻煩的是,不同功能之間(比如生圖、生視頻、生音頻)等往往處在不同的界面,甚至是不同的網(wǎng)站,毫無連貫感。

例如,谷歌推出的AI視頻創(chuàng)作工具Flow僅支持文本轉(zhuǎn)視頻、幀轉(zhuǎn)視頻和素材轉(zhuǎn)視頻,如果想用谷歌的Gemini 2.5 Flash生成圖像,并用于創(chuàng)作,還需切換到谷歌的其他AI工具。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

對創(chuàng)作者來說,這種割裂的體驗打斷了創(chuàng)作靈感,也拉高了AI工具的學(xué)習(xí)成本。AI本該讓創(chuàng)作更輕松、更有趣,但現(xiàn)在的門檻反而擋住了許多好點子。

那么,一個真正以創(chuàng)作者為中心、能夠打通多模態(tài)的AI創(chuàng)作平臺,應(yīng)該是什么樣的?

SkyReels給出的答案,就是一張“無限畫布”。

打開新版SkyReels,占據(jù)視覺中心的并非密集的功能面板,而是承載創(chuàng)作素材的畫布。這讓用戶的注意力和操作重心始終在創(chuàng)作本身,而不是被復(fù)雜的菜單和參數(shù)所干擾。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

所有AI功能與模型都被整合到畫布的側(cè)邊欄,既有昆侖萬維自家的多款模型,也覆蓋了當(dāng)前業(yè)內(nèi)的幾乎所有主流模型。在這片空間中,用戶可以自由地上傳圖像、音頻、視頻等多模態(tài)內(nèi)容,文生圖生成的素材可以成為圖像編輯、圖生視頻的起點。

這種設(shè)計符合用戶長期形成的心智模型。Photoshop以畫布為中心,工具和功能區(qū)被放在側(cè)邊欄或頂部菜單,用戶直接在畫布上操作圖像、繪制、編輯。AE同樣以畫布為視覺核心,所有特效、素材、合成操作在畫布上直觀呈現(xiàn),工具界面相對輔助。

在繼承經(jīng)典創(chuàng)作軟件的界面邏輯、降低用戶學(xué)習(xí)門檻的同時,SkyReels也對多模態(tài)創(chuàng)作流程進(jìn)行了創(chuàng)新整合,讓創(chuàng)作在圖像、視頻、音頻之間自由流動。

在無限畫布上,用戶主要以三種方式進(jìn)行交互與創(chuàng)作:拖拽、對話、二次編輯。

用戶可以一次性上傳多張圖片、多個視頻,并根據(jù)創(chuàng)作需求將素材拖拽到對應(yīng)的功能上。

例如,將靜態(tài)圖片拖拽到“視頻生成”功能上后,它便會在畫布原地變?yōu)閯討B(tài)視頻。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

如果需要讓視頻中的人物說出想要的臺詞,就只需拖動這個視頻到“Avatar(數(shù)字人)”功能上,人物就能開口說話。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

同時,用戶還能在無限畫布上捕捉并打磨靈感。當(dāng)聽到令人心動的音樂、看到有啟發(fā)性的視頻后,只需將音頻拖入Chat界面,與智能agent對話。Agent能幫助用戶逐步厘清創(chuàng)作需求,并最終生成相應(yīng)的視覺畫面。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

在獲得初步生成結(jié)果后,用戶可以進(jìn)行二次編輯——包括視頻風(fēng)格化、延長內(nèi)容或進(jìn)行UpScale畫質(zhì)升級等。這些操作都可在同一界面中完成,無需跳轉(zhuǎn)或切換。

SkyReels的無限畫布,把復(fù)雜的操作和設(shè)置都封裝在了簡單的物理動作背后。“我們希望用戶不需要學(xué)習(xí)AI,而只需要使用AI。”SkyReels團(tuán)隊這樣強調(diào)。

二、Agent深度融入創(chuàng)作,海量模板讓數(shù)字營銷更輕松

為了讓創(chuàng)作的流程進(jìn)一步提效與智能化,SkyReels 還引入了“雙核驅(qū)動”的智能創(chuàng)作體系——由Super Agent與Expert Agents共同構(gòu)成的全能與專業(yè)一體化系統(tǒng)。

在內(nèi)容創(chuàng)作的早期階段,靈感往往稍縱即逝,圖片、文字、視頻都有可能成為創(chuàng)作的起點。Super Agent的設(shè)計讓捕捉這種瞬間的創(chuàng)意需求變得更為容易。

在試用中,Super Agent的多模態(tài)識別能力表現(xiàn)出色:無論是上傳圖片、輸入文字,還是提供視頻,它都能跨模態(tài)快速理解意圖,并給出有針對性的反饋。

知名Vlogger Casey Neistat有“Vlog之父”稱號,其風(fēng)格啟發(fā)了不少創(chuàng)作者。如今,借助Super Agent的能力,普通人也能在SkyReels中復(fù)刻Neistat的風(fēng)格。

我們可以上傳Neistat的Vlog,并輸入指令“按照Casey Neistat的風(fēng)格幫我打造一只關(guān)于小狗的Vlog”。Super Agent系統(tǒng)能根據(jù)視頻的內(nèi)容,并結(jié)合公開信息,分析提煉創(chuàng)作風(fēng)格。

當(dāng)用戶的指令并不清晰時,Super Agent不會將錯就錯,而是會主動提問,讓用戶輸入所需信息,或是選擇創(chuàng)作方向。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

完全了解用戶需求后,Super Agent才會開始規(guī)劃創(chuàng)作流程,幫用戶逐步打造制作計劃、分鏡、生成角色與背景和生成視頻,期間,用戶不用手動切換工具,只需要確認(rèn)Agent提出的方案或動作,僅在不滿意時才需介入調(diào)整。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

SkyReels生成的首個鏡頭如下,無論是清晨的紐約城,還是富有動感的運鏡,都和Neistat的風(fēng)格有幾分神似。在此基礎(chǔ)上,用戶可以繼續(xù)按照計劃生成視頻,最終獲取足夠的創(chuàng)作素材。

更值得一提的是,Super Agent并非單次響應(yīng)的“問答式工具”,而是一個可以被隨時喚起、持續(xù)陪伴的創(chuàng)作伙伴,可以參與到用戶創(chuàng)作的每一個階段。

相比Super Agent的通用創(chuàng)意能力,Expert Agents更像是一個針對垂直行業(yè)打造的“專業(yè)智囊?guī)臁薄?/strong>目前SkyReels已內(nèi)置28個專家Expert Agents,覆蓋市場營銷、電商運營、虛擬形象打造和故事創(chuàng)作等領(lǐng)域。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

在我們的體驗中,營銷類Expert Agent尤其值得關(guān)注。要使用Expert Agents,用戶本身并不需要是特定領(lǐng)域的“專家”——Expert Agents在每個場景都會給出清晰的指引,用戶按照指引,像做填空題一樣補全產(chǎn)品賣點、目標(biāo)受眾、所傳遞的情緒、使用場景等關(guān)鍵信息后,系統(tǒng)便能生成完整的營銷素材,如海報、宣傳視頻等等。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

▲SkyReels幫助用戶厘清消費電子產(chǎn)品的宣傳視頻拍攝策略

這28個專家Agent均在特定領(lǐng)域經(jīng)過深度訓(xùn)練和優(yōu)化。它們內(nèi)置了該領(lǐng)域的專業(yè)知識庫和成熟的工作流程,能夠理解行業(yè)術(shù)語和復(fù)雜需求,提供具有行業(yè)洞察、可執(zhí)行性強的專業(yè)方案。這使非專業(yè)用戶也能快速獲得具備可執(zhí)行性的成品方案,而不必陷入反復(fù)調(diào)整和試錯。

隨著多Agent的協(xié)作機(jī)制進(jìn)一步完善,未來,這些Agent或許將有望組成專業(yè)團(tuán)隊,協(xié)作完成更為復(fù)雜的任務(wù)。

同時,為進(jìn)一步便利創(chuàng)作,SkyReels還配備了海量創(chuàng)作模板。這些模板同樣主打“簡單好用”,甚至連文字提示詞都無需輸入——用戶只需上傳基本的圖像素材,即可完成替換。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

例如,在服裝外貿(mào)電商場景,SkyReels的模板已經(jīng)覆蓋了不同人種、不同膚色、不同服裝類目,無論是T恤衫、衛(wèi)衣、夾克還是大衣,都有對應(yīng)的細(xì)分模板。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

替換元素后,新的衛(wèi)衣款式、品牌Logo能與原模板無縫融合,真正實現(xiàn)了模板效果的“所見即所得”。

智東西批量嘗試了多個不同樣式的模板,其融合效果始終穩(wěn)定可靠,幾乎沒有割裂感和不自然的觀感。

此類數(shù)字營銷工具,讓相關(guān)從業(yè)者無需耗費大量時間、精力拍攝宣傳素材,也減少了他們學(xué)習(xí)AI工具的機(jī)會成本。從業(yè)者可以把精力集中于產(chǎn)品創(chuàng)意與市場策略本身,從而更高效地實現(xiàn)品牌傳播與業(yè)務(wù)增長目標(biāo)。

三、底層模型能力集中升級,數(shù)字人能實現(xiàn)多人對話了

“無限畫布”、Agent、模板等創(chuàng)作方式的升級背后,是昆侖萬維在視頻生成模型底層能力上的不斷突破。

數(shù)字人能力方面,SkyReels V3模型首先在生成長度上實現(xiàn)跨越,能完成數(shù)分鐘的數(shù)字人畫面生成。借助這一功能,我們甚至可以用自己打造的卡通形象,拍一部新品宣傳廣告片。

SkyReels在生成數(shù)字人時,支持32個運鏡組合與鏡頭運動選項,能夠滿足不同敘事和畫面表達(dá)需求,使視覺表現(xiàn)更加生動自然。這些特性,讓數(shù)字人能勝任更為完整的營銷敘事,提升宣傳效果。

告別繁瑣切換!昆侖萬維SkyReels用“無限畫布”改變AI創(chuàng)作,一站式搞定圖文視頻

SkyReels V3還是業(yè)內(nèi)首個支持單鏡頭多人多輪對話的數(shù)字人模型。在傳統(tǒng)的數(shù)字人生成模型更多僅提供單人對口型和多人同時發(fā)聲。SkyReels V3則能精準(zhǔn)控制每個角色的說話時機(jī)、節(jié)奏、肢體語言和角色間的眼神互動,實現(xiàn)自然的多人對話流,甚至還能同步生成真實的環(huán)境音。

在創(chuàng)意場景,SkyReels現(xiàn)在還能將視頻的創(chuàng)意延展,或是轉(zhuǎn)變?yōu)樘囟ǖ娘L(fēng)格。

這些能力基于升級的SkyReels V3。其視頻延長不再局限于業(yè)內(nèi)“單鏡頭拉長”的傳統(tǒng)方式,而是基于視頻語義和用戶Prompt,智能預(yù)測下一個鏡頭的合理延續(xù)與場景內(nèi)容。

SkyReels V3視頻延長支持多種切鏡方式,包括影視拍攝中常用的切入鏡頭、切出鏡頭、反打鏡頭、多角度鏡頭、切離鏡頭等,能生成具備敘事邏輯與視覺連貫性的延展片段,讓鏡頭語言更豐富,畫面更具動感與電影感。

這一能力讓用戶可以從短視頻中自然過渡至更完整的敘事結(jié)構(gòu),為影視預(yù)演、電商視頻延展、UGC 創(chuàng)作等場景提供更高效的生成方式。

而SkyReels V3此次的風(fēng)格化模型并非簡單的“濾鏡遷移”。它通過對視頻時序一致性、細(xì)節(jié)保真度與光影邏輯的深度優(yōu)化,實現(xiàn)了1:1的角色、動作和場景保真。

無論是“辛普森風(fēng)”、“樂高風(fēng)”還是“梵高風(fēng)”,視頻中的細(xì)節(jié)都能保持一致,讓風(fēng)格化不再只是“涂層”,而是深度地融合到畫面之中。

與市面上常見的5秒級別LoRA一鍵風(fēng)格化不同,SkyReels的模型保持了原視頻的動態(tài)結(jié)構(gòu)與語義邏輯。這讓風(fēng)格遷移具備了更強的穩(wěn)定性和一致性,足以支撐時長更長廣告創(chuàng)意、動畫預(yù)演的視覺再創(chuàng)作。

結(jié)語:SkyReels升級背后,昆侖萬維的AI全景布局

SkyReels近期的升級,只是昆侖萬維在AI領(lǐng)域的部分探索。昆侖萬維近期披露的財報顯示,其AI布局已經(jīng)涵蓋大模型、AGI研究、多模態(tài)創(chuàng)作平臺、智能音樂與語音、游戲與社交等方向,并開源了Skywork-Reward、Skywork-R1V、UniPic、Matrix-3D 等系列模型,推出了SkyReels、Mureka、Linky、StarMaker和DramaWave等多款應(yīng)用。

這也帶動了其業(yè)績的快速增長。昆侖萬維在本財年前三季度的營收已達(dá)58億元,同比增長 52%,海外收入占比93%。作為中國AI出海的重要力量之一,昆侖萬維有望持續(xù)推動AI技術(shù)研發(fā)、產(chǎn)品迭代和商業(yè)化應(yīng)用,打造覆蓋研發(fā)、創(chuàng)作和內(nèi)容生態(tài)的全方位AI平臺。