導(dǎo)航菜單

激進(jìn)的可靈背后是一個(gè)內(nèi)斂的快手

導(dǎo)讀 2024年上半年的AI視頻生成賽道,快手毫無(wú)疑問(wèn)是最大的贏家。視頻生成大模型可靈在六月推出之后,憑借更高的可用性和更快的功能迭代,風(fēng)頭很...

2024年上半年的AI視頻生成賽道,快手毫無(wú)疑問(wèn)是最大的贏家。視頻生成大模型可靈在六月推出之后,憑借更高的可用性和更快的功能迭代,風(fēng)頭很快超過(guò)了將這個(gè)賽道推到舞臺(tái)中心的Sora,也讓快手在這一輪的大模型競(jìng)爭(zhēng)中找到了屬于自己的位置。

可靈在市場(chǎng)上受到的追捧,也成功點(diǎn)燃了更多人對(duì)AI視頻生成的熱情。C端,快手和抖音上有越來(lái)越多的創(chuàng)作者開(kāi)始采用AI視頻生成技術(shù)進(jìn)行創(chuàng)作,AI視頻生成與短劇的結(jié)合更是被寄予厚望。B端,可靈在7月迎來(lái)了更多具備可用性的同仁,有智譜AI的清影、生數(shù)科技正式上線的Vidu、愛(ài)詩(shī)科技的PixVerse V2。

但是,AI視頻生成賽道的火熱到目前為止還沒(méi)有呈現(xiàn)「百模大戰(zhàn)」那樣的盛況。一個(gè)很明顯的差異是,此前圍繞AI Agent和AI搜索熱情嘗試的互聯(lián)網(wǎng)大廠,在AI視頻生成領(lǐng)域卻沒(méi)有像快手一樣傾注企業(yè)的全力,甚至有一部分參與「百模大戰(zhàn)」的企業(yè)并沒(méi)有發(fā)布相應(yīng)的產(chǎn)品。

在可靈走紅之后,也只看到了阿里團(tuán)隊(duì)推出了面向軌跡的DiT框架Tora,字節(jié)在App Store上線了即夢(mèng)的移動(dòng)版。前者能夠看到的還僅是官網(wǎng)上公布的演示視頻和論文內(nèi)容??梢栽囉玫膁emo還沒(méi)有上線;后者并沒(méi)有對(duì)比可靈更早上線的AI視頻生成能力進(jìn)行更新,更像是一項(xiàng)常規(guī)動(dòng)作。

很明顯,AI視頻生成在不同企業(yè)內(nèi)部有著不同的優(yōu)先級(jí),決定先后順序的是企業(yè)有什么和想要成為什么。擁有云服務(wù)基礎(chǔ)且業(yè)務(wù)布局更廣泛的字節(jié)、阿里、騰訊會(huì)更側(cè)重布局未來(lái),讓自己成為AI時(shí)代的基礎(chǔ)設(shè)施提供者和獲取AI服務(wù)的最大入口;專(zhuān)注大模型研發(fā)的創(chuàng)業(yè)企業(yè)最需要將AI技術(shù)能力轉(zhuǎn)化為實(shí)際的業(yè)務(wù)和收入。

對(duì)于快手這種已經(jīng)在移動(dòng)互聯(lián)網(wǎng)時(shí)代圈占下一片領(lǐng)地,擁有一定規(guī)模用戶體量的企業(yè),當(dāng)務(wù)之急是要將AI技術(shù)融入到改在現(xiàn)有業(yè)務(wù)的進(jìn)程中,為自己的領(lǐng)地建立一堵可防御AI技術(shù)沖擊的堅(jiān)固城墻,讓自己在AI時(shí)代也能延續(xù)自己的領(lǐng)地。然后,可能才會(huì)考慮到向領(lǐng)域外拓展自己的AI能力。

快手在可靈的研發(fā)上拿出「大力出奇跡」的作風(fēng),力求以更快地速度拿出更具可用性的產(chǎn)品,一定程度上顯示出了追逐AI浪潮的急迫。在可靈上線之后,快手也通過(guò)上線AI短劇《山海奇鏡之劈波斬浪》、舉辦視頻創(chuàng)作大賽、推出創(chuàng)作者孵化計(jì)劃、給予流量扶持,積極地?cái)U(kuò)大AI視頻生成內(nèi)容的影響力和應(yīng)用范圍。

在快手的一系列動(dòng)作中,我們看到了可靈們影響和改變短視頻內(nèi)容生態(tài)的決心。這是一種實(shí)用主義的聚焦型/收斂型策略。同時(shí),在OpenAI對(duì)Sora的定義中,Sora是構(gòu)建物理世界通用模擬器的一條可行之路實(shí)現(xiàn)AGI的又一個(gè)里程碑。這看上去又賦予AI視頻生成一個(gè)發(fā)散拓展的可能性。

無(wú)論從現(xiàn)階段的實(shí)際技術(shù)能力上,還是企業(yè)的具體業(yè)務(wù)布局上,「世界模型」都還只是遙遠(yuǎn)而美妙的幻境??伸`們極難借此幫助快手們完成AI時(shí)代的站位躍遷,改變視頻創(chuàng)作可能是目前更有可能觸摸到的未來(lái)。

可靈必須大力出奇跡

與快手此前給人留下的慢企業(yè)印象不同,被逐漸還原的可靈開(kāi)發(fā)過(guò)程更像是一個(gè)字節(jié)式的「大力出奇跡」故事:受到Sora鼓舞,一個(gè)二十余人的小團(tuán)隊(duì)開(kāi)始進(jìn)行AI視頻生成技術(shù)的研發(fā),很快被確定為快手的戰(zhàn)略級(jí)項(xiàng)目,得到了企業(yè)資源的全力傾斜,不計(jì)投入,以最快速度實(shí)現(xiàn)可用,然后持續(xù)優(yōu)化迭代。

這個(gè)過(guò)程中,快手表現(xiàn)出了堅(jiān)定的戰(zhàn)略決心和執(zhí)行力??焓諧EO程一笑對(duì)可靈項(xiàng)目的表態(tài)是「一定要大做」??焓指呒?jí)副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤則承諾,企業(yè)的卡都給可靈項(xiàng)目用,企業(yè)全力支持。協(xié)作部門(mén)也紛紛給予可靈項(xiàng)目最積極地配合。

從3月到6月,可靈項(xiàng)目用了三個(gè)月時(shí)間就被推向了市場(chǎng),發(fā)布一個(gè)月后就已經(jīng)開(kāi)放給超30萬(wàn)用戶使用,生成超700萬(wàn)條短視頻,獲得了很好的反饋。上線之后,可靈依然保持了極快的更新頻率,通過(guò)幾次升級(jí)陸續(xù)增加了圖生視頻、視頻續(xù)寫(xiě)功能,以及PC端的網(wǎng)站。

快手在可靈項(xiàng)目上的這種少有的急迫感,可能源于緊跟AI的戰(zhàn)略判斷與沒(méi)站在大模型舞臺(tái)聚光燈下的矛盾。在大模型引爆新一輪AI熱炒的一年多時(shí)間里,快手雖然也跟隨潮流推出了大語(yǔ)言模型「快意」和文生圖大模型「可圖」,卻沒(méi)能借此在激烈的大模型競(jìng)爭(zhēng)中實(shí)現(xiàn)領(lǐng)跑。

其背后的原因是,快手對(duì)短視頻業(yè)務(wù)的專(zhuān)注,使其并不擅長(zhǎng)為AI Agent和AI搜索等大語(yǔ)言模型應(yīng)用,提供足夠豐富的面向未來(lái)應(yīng)用場(chǎng)景的接口。缺乏應(yīng)用前景的探索自然也無(wú)法快速建立從技術(shù)到應(yīng)用的產(chǎn)品延伸鏈條。當(dāng)然,快手并沒(méi)有放棄,依然在嘗試推出「飛船」這樣的智能助手APP。

Sora的出現(xiàn)為快手帶來(lái)了一個(gè)最有能力抓在手中的時(shí)代機(jī)遇。作為頭部短視頻平臺(tái),快手在算法技術(shù)的人才積累之外,還有大量標(biāo)注清晰地干凈視頻數(shù)據(jù),疊加上企業(yè)全力傾斜資源的BUFF,能夠打出一個(gè)時(shí)間差,通過(guò)快速上線高可用性的產(chǎn)品,讓雪球滾起來(lái),在AI視頻生成領(lǐng)域建立優(yōu)勢(shì)。

可靈在現(xiàn)一階段的表現(xiàn)已經(jīng)驗(yàn)證了快手這次戰(zhàn)略卡位的有效性。不同的測(cè)評(píng)結(jié)果驗(yàn)證了可靈在同類(lèi)產(chǎn)品中能夠?qū)崿F(xiàn)比較好的視頻生成效果,特別是在生成視頻的局部細(xì)節(jié)和畫(huà)面質(zhì)感上的優(yōu)勢(shì)。相較而言,一部分測(cè)評(píng)都認(rèn)為缺少足夠的高質(zhì)量視頻訓(xùn)練數(shù)據(jù),導(dǎo)致智譜AI的清影生成了太多動(dòng)畫(huà)內(nèi)容與模糊畫(huà)質(zhì)的視頻,影響了使用體驗(yàn)。

內(nèi)斂型的AI策略選擇

通過(guò)可靈快速上線搶占先機(jī)之后,快手將先機(jī)轉(zhuǎn)換為長(zhǎng)久的賽道競(jìng)爭(zhēng)優(yōu)勢(shì),需要技術(shù)快速融入與改變視頻場(chǎng)景。這也符合快手在2023年初確定的新AI戰(zhàn)略的指向,即讓AI技術(shù)賦能現(xiàn)有的業(yè)務(wù)場(chǎng)景,探索AI如何圍繞短視頻落地應(yīng)用。這也意味著,快手會(huì)更傾向于利用AI技術(shù)強(qiáng)化現(xiàn)有的護(hù)城河,而不是越過(guò)河去擴(kuò)張新的領(lǐng)地。

在2024世界人工智能大會(huì)舉辦期間,蓋坤和快手副總裁、大模型團(tuán)隊(duì)負(fù)責(zé)人張迪的演講,也體現(xiàn)了快手讓AI服務(wù)于短視頻的聚焦型戰(zhàn)略選擇。蓋坤表示,快手的大模型矩陣深度服務(wù)快手的商業(yè)生態(tài)場(chǎng)景。張迪則認(rèn)為,將用大模型技術(shù)重塑快手業(yè)務(wù),能夠提升創(chuàng)作者的內(nèi)容生產(chǎn)體驗(yàn)和用戶的內(nèi)容消費(fèi)體驗(yàn)。

在可靈上線PC端應(yīng)用的同時(shí),主打AI圖像生成的可圖平臺(tái)也被融入進(jìn)了可靈中。整合后,快手的可靈與字節(jié)的即夢(mèng)一樣,不再局限于AI視頻生成,而成為了一個(gè)瞄準(zhǔn)AI創(chuàng)意內(nèi)容生成的綜合平臺(tái)。這是快手快影和字節(jié)剪映之間圍繞視頻創(chuàng)作工具的競(jìng)爭(zhēng)在AI時(shí)代的延續(xù)。

在融合AI視頻生成內(nèi)容的動(dòng)作上,快手要顯得更為激進(jìn)。首先,快手舉辦了「靈」感迸發(fā)——首屆「可靈」AIx快影視頻創(chuàng)作大賽,總獎(jiǎng)金額度達(dá)到30萬(wàn)元;其次,快手公布了「可靈AIx星芒短劇」創(chuàng)作者孵化計(jì)劃,為AI短劇創(chuàng)作者提供千萬(wàn)級(jí)流量扶持,且不限參與賬號(hào)的粉絲數(shù)量。

可靈融入快手短視頻生態(tài)可以幫助快手實(shí)現(xiàn)兩個(gè)目標(biāo):一個(gè)是從內(nèi)容側(cè)考量,補(bǔ)充快手原創(chuàng)內(nèi)容生態(tài)的同時(shí),探索AIGC時(shí)代下的短視頻產(chǎn)品形態(tài);另一個(gè)是從商業(yè)化上考慮,利用大模型矩陣的能力降低品牌生成高品質(zhì)短視頻和直播內(nèi)容的成本,提升線索轉(zhuǎn)化率。

快手的AI戰(zhàn)略代表了一類(lèi)企業(yè)面對(duì)AI時(shí)代的心態(tài)。這類(lèi)企業(yè)的特點(diǎn)是在PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代在某一個(gè)垂直賽道站穩(wěn)了腳跟,擁有一定規(guī)模的用戶,較難參與到底層基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)中,增速放緩但業(yè)務(wù)相對(duì)穩(wěn)定。快手之外,Soul、360、小紅書(shū)等都屬于這類(lèi)企業(yè)。

Soul在內(nèi)部達(dá)成了一個(gè)共識(shí)——單純的技術(shù)并不能夠去構(gòu)建壁壘,其實(shí)說(shuō)端內(nèi)發(fā)展給用戶帶來(lái)價(jià)值,這才是各行各業(yè)的護(hù)城河。因此,Soul更多是針對(duì)滿足用戶的社交訴求,利用AI的手段來(lái)解決問(wèn)題,而沒(méi)有去追求AGI。在Soul APP CTO陶明看來(lái),這種AI強(qiáng)化業(yè)務(wù)的邏輯,會(huì)給企業(yè)建立一條更具差異化的發(fā)展路徑。

快手高級(jí)副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤

這種邏輯本質(zhì)上就是將AI作為放大器,達(dá)到持續(xù)放大業(yè)務(wù)已有勢(shì)能的目的。提出要走CoE(協(xié)同)專(zhuān)家模型的360也是如此。這是一種大模型時(shí)代的入口邏輯,充分利用360原有產(chǎn)品的流量積累,將360和第三方的AI能力整合到一起,通過(guò)360的意圖識(shí)別模型和任務(wù)分解調(diào)度模型進(jìn)行需求與模型能力的匹配。

因其擁有一定的業(yè)務(wù)積累和用戶基礎(chǔ),所以在制定自己的AI戰(zhàn)略時(shí)不能像智譜AI、月之暗面那樣丟下包袱輕裝上陣,講一個(gè)直指AGI的、重投資高風(fēng)險(xiǎn)的宏大故事。又因?yàn)樗麄兊臉I(yè)務(wù)相對(duì)垂直,沒(méi)有面向其他場(chǎng)景的豐富觸點(diǎn),也很難像騰訊、阿里、字節(jié)、百度那樣在AI時(shí)代繼續(xù)橫向拓展,爭(zhēng)取成為基礎(chǔ)設(shè)施提供者的機(jī)會(huì)。

可靈們的機(jī)會(huì)在哪里

就可靈而言,它能夠帶給快手三個(gè)不同層級(jí)的可能性:

第一個(gè)是可靈真的成為OpenAI預(yù)想中的「世界模擬器」,快手借此獲得一個(gè)沖出短視頻行業(yè)的機(jī)會(huì);第二是可靈成為新一代的內(nèi)容創(chuàng)作工具,大大降低短劇等專(zhuān)業(yè)影視內(nèi)容的創(chuàng)作門(mén)檻,讓快手沿著視頻產(chǎn)業(yè)鏈條向上繼續(xù)延伸;第三是可靈降低用戶創(chuàng)作短視頻的門(mén)檻,極大豐富快手的短視頻供給。

從遲遲未能上線應(yīng)用的Sora,以及目前已經(jīng)上線的可靈、清影、Gen-3、luma等視頻生成大模型的使用體驗(yàn)來(lái)看,AI視頻生成技術(shù)還處在非常初級(jí)的發(fā)展階段。世界模型有可能像大語(yǔ)言模型一樣,在經(jīng)歷過(guò)算法框架創(chuàng)新帶來(lái)的初期發(fā)展紅利之后,受限于訓(xùn)練數(shù)據(jù)、訓(xùn)練算力等條件的制約,在較長(zhǎng)時(shí)間內(nèi)停滯不前。

對(duì)于快手來(lái)說(shuō),AI+短劇可能是比世界模擬器更有幾率實(shí)現(xiàn)的目標(biāo)。在可靈開(kāi)始研發(fā)的3月,快手就公布了短劇+的短劇戰(zhàn)略布局,短劇+AIGC是這個(gè)布局中的一個(gè)環(huán)節(jié)。AI短劇《山海奇鏡之劈波斬浪》的制作計(jì)劃也是在同一階段宣布,并原定于4月底上線。

最終隨著可靈的快速上線,利用可靈重新打磨的《山海奇鏡之劈波斬浪》于7月發(fā)布,并在上線十天后收獲了超過(guò)5000萬(wàn)觀看量。此外,抖音推出了與博納合作的AI短劇《三星堆:未來(lái)啟示錄》,央視頻發(fā)布了《英雄》《愛(ài)永無(wú)終止》《奇幻專(zhuān)賣(mài)店》三部短劇。

在可靈們的加持下,隨著這些打樣作品的上線,理論上能降低創(chuàng)作門(mén)檻的AI與賺錢(qián)的短劇相融合,快速勾勒出了一個(gè)低成本、高回報(bào)的AI短劇遠(yuǎn)景。博納影業(yè)集團(tuán)影視制作副總經(jīng)理曲吉小江還提出了「從短劇走向長(zhǎng)劇再走向游戲」的AI短劇三步走計(jì)劃。市場(chǎng)也對(duì)于短劇的重要生態(tài)平臺(tái)快手給予了厚望。

但是,從創(chuàng)作者的分享來(lái)看,可靈們可能降低了制作一部短劇的整體成本,但并沒(méi)有將制作門(mén)檻降低太多。大模型雖然能根據(jù)提示詞生成視頻內(nèi)容,并且在生成的視頻時(shí)長(zhǎng)和效果上也比半年前都有很大的提升。但是,大模型對(duì)提示詞的理解、對(duì)畫(huà)面的生成還存在很大的迭代空間。

一個(gè)很直接的例子是,在《山海奇鏡之劈波斬浪》導(dǎo)演陳坤的介紹中,團(tuán)隊(duì)針對(duì)一個(gè)火神和水神打架鏡頭抽卡100次,也沒(méi)能抽到特別滿意的過(guò)程,「實(shí)際用的畫(huà)面其實(shí)也是帶了一定畸變的」。AI短劇的創(chuàng)作者需要的不僅是講故事的能力,還要強(qiáng)化與AI溝通的能力。這并不是一個(gè)一蹴而就的過(guò)程。

目前來(lái)看,AI視頻生成融合短視頻生態(tài)最有可能在短時(shí)間內(nèi)大規(guī)模鋪開(kāi)的,是第三種可能,讓現(xiàn)在正在創(chuàng)作短視頻的用戶能更好地豐富自己的視頻內(nèi)容。一種已經(jīng)能看到的趨勢(shì)是,在快手和抖音上的一些口播創(chuàng)作者開(kāi)始利用AI生成的視頻匹配自己的口播內(nèi)容,為觀看者提供更生動(dòng)的內(nèi)容體驗(yàn)。

從原有內(nèi)容的優(yōu)化到AI原生短劇的規(guī)模化,再到內(nèi)容創(chuàng)作者與內(nèi)容消費(fèi)者之間的界限模糊更有可能是快手在AI時(shí)代的三步走計(jì)劃。對(duì)于同樣在AI時(shí)代秉持聚焦型戰(zhàn)略的企業(yè)而言,這三步走計(jì)劃可以概括為優(yōu)化已有功能、探索AI原生功能、實(shí)現(xiàn)用戶的AI化。這是可靈們更能抓住的機(jī)會(huì)。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

猜你喜歡:

最新文章: