2025年4月中旬,快手和字節(jié)這兩個(gè)老對手,在AI視頻生成領(lǐng)域,再次狹路相逢。
先是4月14日,字節(jié)跳動(dòng)的視頻生成基礎(chǔ)模型Seaweed,低調(diào)上線了官網(wǎng),還釋出了技術(shù)報(bào)告。
“四兩撥千斤”,是字節(jié)這次在視頻領(lǐng)域,想要達(dá)到的效果。首發(fā)的模型Seaweed-7B,不僅用70億的參數(shù),實(shí)現(xiàn)了超越140億參數(shù)同類模型的效果,訓(xùn)練效率也相當(dāng)高:同類模型的訓(xùn)練普遍要百萬GPU小時(shí),Seaweed-7B只用了66.5萬 H100 GPU小時(shí)。

相比字節(jié)的低調(diào),快手想在視頻生成領(lǐng)域營造的聲勢,要浩大的多。
4月15日,在發(fā)布會(huì)上,快手高級副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤,對著到場的幾百人,用極高的評價(jià)為快手在視頻生成領(lǐng)域的成績定調(diào):
“‘可靈’吹響了整個(gè)視頻生成賽道的挑戰(zhàn)哨?!薄霸谖覀冎?,各個(gè)廠商都開始發(fā)視頻生成模型?!?/p>
的確,快手在2024年6月6日的視頻生成模型“可靈”,在一眾“Sora期貨”中,靠著大方的免費(fèi)試用,創(chuàng)造了上線三個(gè)月服務(wù)超260萬用戶的記錄。
這也是字節(jié)和快手在視頻領(lǐng)域的首次交手。“可靈”的發(fā)布,一度將字節(jié)置于追趕者的位置。直到2024年11月8日,字節(jié)才回到視頻領(lǐng)域第 一梯隊(duì):Seaweed和PixelDance上線了視頻生成平臺即夢AI。
不少業(yè)內(nèi)人給出的評價(jià)是:2024年,在視頻性能上,奮起猛追的字節(jié),最后與快手基本打平。
一年后的這次同臺較量,快手顯然也不肯讓出技術(shù)第 一的位置。
“全球大幅領(lǐng) 先?!薄俺掷m(xù)領(lǐng) 先?!薄罢?jiān)试S我把這兩句話再重復(fù)一遍?!?/p>
交出新答卷時(shí),蓋坤的幾句話再次炒熱了場子。他宣布了快手在多模態(tài)領(lǐng)域的最新探索成果:圖像生成基座模型“可圖2.0”,視頻生成基座模型“可靈2.0”,以及多模態(tài)編輯功能MVL。
在視頻生成能力上,“可靈2.0”的文生視頻和圖生視頻能力,均超過了谷歌的視頻模型Veo2。在和老對手Sora的較量中,“可靈2.0”文生視頻模型的勝負(fù)比甚至達(dá)到了367%。

DeepSeek的掀桌,已經(jīng)讓行業(yè)意識到,模型決定了AI產(chǎn)品的上限。2025年,不少廠商的動(dòng)作都是:回歸模型。
字節(jié)和快手,當(dāng)下對AI視頻生成產(chǎn)品的野望并不相同。據(jù)了解,字節(jié)對“即夢”的期望,是AI時(shí)代的抖音,一個(gè)未來更ToC的產(chǎn)品。而快手,則將商業(yè)化的希望,主要押注在B端。
即便如此,2025年,兩家廠商的共識依然是:打磨視頻基座模型,搶灘第 一梯隊(duì)。
據(jù)《晚點(diǎn)》報(bào)道,字節(jié)圖像視頻創(chuàng)作平臺“即夢”負(fù)責(zé)人張楠的2025年OKR,其中一條為重點(diǎn)打磨模型效果。2025年“可靈”團(tuán)隊(duì)的目標(biāo),也濃縮在蓋坤說出的4個(gè)字中:“持續(xù)領(lǐng) 先”。
對于字節(jié)和快手而言,至少在技術(shù)層面,視頻生成領(lǐng)域的戰(zhàn)火只會(huì)愈燃愈旺。
01
拼性能,更拼落地
4月的這次“交手”,對字節(jié)快手來說,絕不僅僅是一次視頻模型性能的比拼。
視頻模型落地難,已經(jīng)是老生常談的困境。除了模型效果不及預(yù)期外,貴,是視頻模型的通病。一個(gè)典型的案例是,為了覆蓋高昂的推理成本,OpenAI Sora推出的訂閱費(fèi),高達(dá)200美元。
可見的是,相較于“炫技”的2024年,2025年的視頻模型競技場,更突出一個(gè)實(shí)用和實(shí)惠。
比如,字節(jié)的Seaweed-7B雖然在性能上略遜于快手的上一代模型“可靈1.6”,但勝在部署成本相當(dāng)?shù)停簝H40GB顯存的單GPU,就能實(shí)現(xiàn)高分辨率(1280x720)視頻的生成。
這意味著,中小團(tuán)隊(duì)和個(gè)人創(chuàng)作者,也能負(fù)擔(dān)得起AI視頻創(chuàng)作。
在實(shí)用性上,字節(jié)和快手的共識是:只有一個(gè)視頻生成模型,目前是無法滿足用戶的創(chuàng)作需求的。
“可靈2.0”的發(fā)布會(huì)上,快手同時(shí)發(fā)布了圖像生成模型“可圖2.0”。這個(gè)增強(qiáng)了指令遵循能力和審美能力的模型,在競技場上超越了Midjourney v7、Rave和FLUX1.1 pro三個(gè)主流模型。
在快手技術(shù)副總裁、可靈AI負(fù)責(zé)人張迪看來,圖像能力,是視頻模型落地中不可缺少的一步。
他舉了一組數(shù)據(jù):用“可靈”生成的視頻中,圖生視頻占到了85%。圖生視頻的高比例說明,在視頻創(chuàng)作的實(shí)際過程中,更多的用戶青睞于用圖片確定風(fēng)格、添加關(guān)鍵幀,以獲取更為穩(wěn)定的視頻生成效果。
“可靈”這次發(fā)布的“多模態(tài)編輯MVL功能”,據(jù)工作人員介紹,也是為了滿足創(chuàng)作者的實(shí)時(shí)視頻編輯需求。

多模態(tài)編輯MVL功能支持的不僅僅是文字prompt,還支持圖像和視頻模態(tài)的動(dòng)作描述文件。比如,用戶可以通過上傳一段新視頻,將新視頻中的人物,添加到原有視頻上。
快手注重圖像,字節(jié)則發(fā)揮了文本處理上的優(yōu)勢。Seaweed-7B結(jié)合了字節(jié)的“長上下文調(diào)優(yōu)技術(shù)”和長敘述視頻生成技術(shù)“VideoAuteur”,讓生成的視頻可以基于用戶的全局文本描述和分鏡描述,保持一致性。
02
“全村的希望”和“一個(gè)都不能落下”
字節(jié)和快手,在視頻領(lǐng)域登頂?shù)囊巴嗤?,但其折射出的業(yè)務(wù)處境,卻是不同的。
大眾耳熟能詳?shù)摹熬鲬?zhàn)”的故事之外,“可靈”從誕生到出圈,在快手的業(yè)務(wù)發(fā)展軌跡中,帶有一定的偶然性。
據(jù)《智能涌現(xiàn)》了解,直到2024年初,文生視頻的一項(xiàng)關(guān)鍵技術(shù),才被可靈團(tuán)隊(duì)攻破。2024年3月,蓋坤才第 一次見到“可靈”的demo。
公司對AI的商業(yè)化預(yù)期,本來也并不高。《智能涌現(xiàn)》獲悉,快手商業(yè)化業(yè)務(wù)負(fù)責(zé)人王劍偉(Thomas)在2024年Q4的OKR中,“AI商業(yè)化”并非“O(Objectives,目標(biāo))”,僅僅是“增長”下的一個(gè)“kr( Key Results,關(guān)鍵成果)”。
快手已經(jīng)很久沒有新故事了。作為同樣靠短視頻業(yè)務(wù)成長起來的互聯(lián)網(wǎng)公司,快手的業(yè)務(wù)版圖,相較于不斷開疆拓土的字節(jié),并不廣闊。直到2023年,快手營收的核心,還是圍繞短視頻平臺的線上營銷、直播和電商。
但“可靈”的出現(xiàn),讓快手看到了短視頻之外的新增長曲線。
快手財(cái)報(bào)顯示,從2024年9月開放API服務(wù),到2025年2月,可靈AI的累計(jì)營收已經(jīng)超過1億元。在用戶層面,蓋坤在這次發(fā)布會(huì)上透露,目前“可靈”已經(jīng)擁有2223萬用戶,月活用戶增長了25倍,全球的企業(yè)和開發(fā)者客戶數(shù)量,也已經(jīng)超過了15萬。
不僅自己造血,“可靈”也在撬動(dòng)快手的其他業(yè)務(wù)??焓稚虡I(yè)化營銷服務(wù)平臺“磁力引擎”的一名員工曾對《智能涌現(xiàn)》表示,“可靈”給快手的廣告業(yè)務(wù)帶來了明顯的增長:
“大客戶每個(gè)月花十幾萬做投流,廣告物料就可以用AI生成。一個(gè)剪輯師一天最多剪10條廣告物料,但是可靈可以生成幾千條,我們一天內(nèi)就能把幾千條廣告物料,用算法分發(fā)到用戶的推薦流里?!?/p>
“可靈2.0”的發(fā)布,對快手來說,是“全村希望”的延續(xù)。
比起單點(diǎn)奇襲的快手,字節(jié)在視頻生成賽道,有著更重的好學(xué)生包袱。
兩年來,從人、算力,到金錢,字節(jié)在AI領(lǐng)域的重兵投入有目共睹。但文本模型領(lǐng)域有DeepSeek,視頻模型領(lǐng)域有可靈,語音模型和MiniMax的海螺AI打得難舍難分——字節(jié)什么都抓了,但好像什么也沒抓牢。
痛定思痛,2025年開春以來,字節(jié)內(nèi)部已經(jīng)掀起了一場改革。2025年3月,AI部門“Seed”的新帥、原Google Fellow吳永輝在部門全員會(huì)上提到,要進(jìn)一步加強(qiáng)組織文化,打造開放、包容、自信的團(tuán)隊(duì)研究氛圍;要提高技術(shù)開放程度。
Seaweed-7B的發(fā)布,是字節(jié)AI改革后的一個(gè)注腳。
繼3月豆包首次公開文生圖技術(shù)報(bào)告后,Seaweed也成了字節(jié)在視頻領(lǐng)域首 個(gè)公開技術(shù)報(bào)告的模型。值得注意的是,曾被字節(jié)視作機(jī)密的研究團(tuán)隊(duì),蔣路、馮佳時(shí)、楊振恒、楊建超,這次也以技術(shù)報(bào)告署名的形式,首次集體走到臺前。
重振旗鼓后,雙方的較量,才剛剛開始。


190704/16








