導(dǎo)航菜單

豆包vs可靈,抖快AI之爭背后的產(chǎn)品路徑

導(dǎo)讀 智能涌現(xiàn)的浪濤,還在翻涌。以今年5月為節(jié)點(diǎn),全球科技巨頭在AI領(lǐng)域的成功與部署以更為密集的狀態(tài)呈現(xiàn)。其中一條步履鮮明的主線,是普遍在...

智能涌現(xiàn)的浪濤,還在翻涌。以今年5月為節(jié)點(diǎn),全球科技巨頭在AI領(lǐng)域的成功與部署以更為密集的狀態(tài)呈現(xiàn)。

其中一條步履鮮明的主線,是普遍在追求AI落地。硬件端,蘋果在全球開發(fā)者大會(huì)上發(fā)布蘋果智能,宣布將ChatGPT融入Siri,三星宣布GalaxyAI融入手機(jī)、平板、穿戴式設(shè)備;軟件端,谷歌在Chrome瀏覽器集成Gemini AI助手……

圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney

一個(gè)公認(rèn)的現(xiàn)況,AI應(yīng)用即是國內(nèi)AI產(chǎn)業(yè)當(dāng)下的弱點(diǎn)環(huán)節(jié),又是國內(nèi)能夠追趕甚至超越的機(jī)會(huì)所在。

有趣的是,拋開尚處于初級(jí)階段的“百模大戰(zhàn)”,僅從AI應(yīng)用場(chǎng)景出發(fā),抖音與快手這兩大先天占據(jù)優(yōu)勢(shì)的短視頻內(nèi)容平臺(tái),各自大熱的AI應(yīng)用,又提供了兩種截然不同的落地路徑。

01

豆包,文生圖文基底的AI Agent

AIGC相關(guān)的App中,豆包繞不過。據(jù)Questmobile數(shù)據(jù)顯示,截至2024年6月,在國內(nèi)AIGC App中,豆包、天工、Kimi智能助手、貓箱增長亮眼——其中豆包流量排名第一。

豆包并不嚴(yán)格“歸屬”于抖音,更確切來說歸屬于字節(jié)跳動(dòng)。坊間流傳的消息是,這個(gè)名字很接地氣的AI產(chǎn)品,最開始的定位是抖音內(nèi)的AI工具包,或者是抖音內(nèi)的所有AI應(yīng)用都包了,所以叫豆包。

在2023年8月上線以來,豆包本身的產(chǎn)品定位和能力也在不斷迭代,直至跳脫出抖音本身的框架,單獨(dú)成為一個(gè)App。與ChatGPT和文心一言等ChatBot產(chǎn)品形態(tài)類似但不同的是,盡管交互形態(tài)相似,但豆包的定位更傾向于一個(gè)綜合性的AI Agent(AI智能體)平臺(tái)。

通用場(chǎng)景下,用戶可以和“豆包”默認(rèn)智能體聊天對(duì)話,也可以尋找其他垂直應(yīng)用的智能體對(duì)話解決垂直場(chǎng)景的問題,其中包含官方與第三方創(chuàng)建的智能體應(yīng)用。

在不斷迭代之下,其功能也愈發(fā)繁復(fù)?,F(xiàn)在的豆包,不僅有App更有PC端,應(yīng)用內(nèi)的場(chǎng)景也擴(kuò)展到了虛擬社交聊天、AI搜索、文檔對(duì)話、文生圖、內(nèi)容創(chuàng)作等多種使用場(chǎng)景。而且AI能力的應(yīng)用也開始擴(kuò)展到了字節(jié)旗下的不同產(chǎn)品。

以抖音為例,一邊是抖音應(yīng)用內(nèi)上線AI搜索功能,一邊是用戶在和豆包進(jìn)行吃喝玩樂等特定類目內(nèi)容交互時(shí),豆包除了生成文字回復(fù),還會(huì)推流一個(gè)抖音短視頻來填補(bǔ)AI回復(fù)的準(zhǔn)確性和及時(shí)性。

在今年上半年相對(duì)熱門的AI應(yīng)用中,字節(jié)基本都有入局,虛擬社交領(lǐng)域的貓箱,智能臺(tái)開發(fā)平臺(tái)領(lǐng)域的扣子,為主文生視頻的即夢(mèng)等等。然而,豆包之于字節(jié)的定位重要性毋庸置疑,先是持續(xù)在增長方面的投入并公布商業(yè)化路徑,后是干脆將原來的大模型名稱從云雀大模型改成豆包大模型等一系列動(dòng)作,都足夠驗(yàn)證。

集成、聚合、綜合……豆包代表的產(chǎn)品路徑,依舊保持著“超級(jí)App”或者說“超級(jí)入口”的思路,在市場(chǎng)相對(duì)空白階段階段,先通過應(yīng)用端占領(lǐng)用戶市場(chǎng),并且在小步快跑中不斷迭代,最終聚合成一個(gè)超級(jí)應(yīng)用,來獲取AI應(yīng)用時(shí)代的優(yōu)先船票。

與此同時(shí),不同場(chǎng)景和不同產(chǎn)品的貫穿,又讓字節(jié)生態(tài)內(nèi)的用戶數(shù)據(jù)進(jìn)一步被累積,成為自身AI能力增長的數(shù)據(jù)養(yǎng)料。

02

可靈,視頻世界的AI入口

對(duì)AI領(lǐng)域有關(guān)注的人們,或許還會(huì)記得2月Sora推出時(shí)引起的震動(dòng)。這是堪比ChatGPT式的信標(biāo)。絲滑的文生視頻體驗(yàn),代表著人機(jī)交互、內(nèi)容創(chuàng)意之間的某個(gè)隔閡被消磨殆盡,轉(zhuǎn)向通途。

很多人會(huì)以為,中國版“Sora”,會(huì)誕生在BAT和所謂“大模型五虎”上。作出這種判斷并不令人意外,技術(shù)基底延伸產(chǎn)品應(yīng)用的鏈路總是更短。但出乎意料的是,真正在用戶層引起爆發(fā)式普及的文生視頻產(chǎn)品,卻是快手推出的可靈。

與還處于內(nèi)測(cè)階段的Sora相比,在6月公布的可靈直接對(duì)外開放。比較吸引人的點(diǎn)在于,可靈支持生成長達(dá)2分鐘的30幀視頻,分辨率最高1080p,并且可以自由定制寬高比。這樣的產(chǎn)出能力,甚至遠(yuǎn)超還Sora和其余競品(包括在可靈公布前一個(gè)月字節(jié)上線測(cè)試的文生視頻應(yīng)用“即夢(mèng)”)。

在發(fā)布后不久,其又上線了圖片生成視頻功能。視頻生成的效果,也符合其宣稱的大幅度合理運(yùn)動(dòng)、物理世界特性模擬、具備概念組合能力和想象力等優(yōu)勢(shì)。這一度成為許多“內(nèi)容創(chuàng)作者”們吸睛的利器,讓老照片、手繪圖片變成視頻的“獨(dú)家秘笈”甚至被許多人做成課程銷售。

快手的AI產(chǎn)品路徑,也值得思考。在可靈之前,快手先后發(fā)布了通用大語言模型“快意”、文生圖大模型產(chǎn)品“可圖”,均未有太大火花,反而是更符合自身內(nèi)容生態(tài)的可靈迅速火爆。

而在可靈爆火后,在移動(dòng)端唯一能使用的渠道依舊只有快手創(chuàng)作工具快影 App。但快手專門打造了Web端,并發(fā)布公告稱此前的可圖平臺(tái)將在8月關(guān)閉,產(chǎn)品功能融入“可靈AI”中。從Web端入口可以看到,快手對(duì)可靈的官方定位是新一代AI創(chuàng)意生產(chǎn)力平臺(tái),突破了文生視頻局限,集中在AI內(nèi)容/創(chuàng)意生成方面,并且還有AI視頻剪輯等功能方面的想象力留白。

這似乎又是一個(gè)方向:圍繞自身核心業(yè)務(wù)場(chǎng)景,提供AI助力來實(shí)現(xiàn)揚(yáng)長避短。而快手本身的內(nèi)容生態(tài),AI能力的喂養(yǎng)、AI產(chǎn)品的落地、用戶的反饋,形成了一個(gè)完整閉環(huán),用第三方平臺(tái)、工具的形式,從創(chuàng)作到體驗(yàn)到生態(tài)提升了整體主站App的體驗(yàn)。

03

Agent和工具集,被動(dòng)與主動(dòng)

不難發(fā)現(xiàn),盡管目前交互的形態(tài)還屬于一問一答、一入一出的階段,但豆包和可靈之間的差異,已經(jīng)有了被動(dòng)與主動(dòng)的差別。

豆包嘗試的AI Agent作為通往AGI(通用人工)的必經(jīng)之路,發(fā)展方向無疑是能夠獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的獨(dú)立助手。終極的發(fā)展目標(biāo),是用戶只需要給出一個(gè)需求,就能根據(jù)需求拆解步驟并提供解法。用戶被動(dòng)享受著AI的主動(dòng)響應(yīng)。

可靈AI作為垂類平臺(tái),集成了對(duì)應(yīng)的分類能力。用戶依舊要為進(jìn)行文字、圖片和素材的輸入,并且進(jìn)行調(diào)試。產(chǎn)品用被動(dòng)式的交互保持了用戶的部分主動(dòng)性。

無關(guān)優(yōu)劣,這本就是非常有意思的階段性發(fā)展。人機(jī)交互關(guān)系究竟應(yīng)該是什么形態(tài),人們需要一個(gè)萬能的智能體助手,還是更垂直有效的工具,又是一個(gè)事關(guān)倫理的新命題。

而可以確認(rèn)的是,至少在未來的一段時(shí)間內(nèi),我們不用擔(dān)心AI產(chǎn)品的無趣了。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

猜你喜歡:

最新文章: