OpenAI文生視頻大模型Sora發(fā)布后,國內(nèi)企業(yè)爭(zhēng)相入局,國產(chǎn)文生視頻大模型邁入加速階段。日前,快手“可靈”視頻生成大模型官網(wǎng)正式上線,官網(wǎng)放出數(shù)段展示視頻,并稱已開放邀測(cè)體驗(yàn)。
以下是可靈官網(wǎng)展示的一段“一只手將牛奶從鋼制打奶壺倒入桌上一杯咖啡中,背景為模糊的廚房”的視頻片段。

動(dòng)圖截取有壓縮,畫質(zhì)遜于展示視頻,效果以官網(wǎng)為準(zhǔn),下同
官網(wǎng)展示的一段小男孩吃漢堡的生成視頻,可以看到視頻細(xì)節(jié)較全面,包括漢堡咬下去的齒印、小男孩面部肌肉的運(yùn)動(dòng)、粘在嘴邊的殘?jiān)取?/p>

提示詞:一個(gè)戴眼鏡的中國男孩在快餐店內(nèi)閉眼享受美味的芝士漢堡
除了吃漢堡,還有吃面的。

提示詞:一個(gè)中國男人坐在桌前,用筷子吃面條
一段非專業(yè)人士難以區(qū)分是生成還是實(shí)拍的延時(shí)攝影。

官網(wǎng)展示了真實(shí)世界物理交互的視頻外,也展示了一些“想象力場(chǎng)景”,如一只戴著眼鏡,喝咖啡看報(bào)紙的兔子。

據(jù)介紹,可靈大模型為快手AI團(tuán)隊(duì)自研,采用類Sora的技術(shù)路線并結(jié)合多項(xiàng)自研創(chuàng)新技術(shù)。具備的能力包括:
能夠生成大幅度的合理運(yùn)動(dòng);
能夠模擬物理世界特性;
具備強(qiáng)大的概念組合能力和想象力;
生成的視頻分辨率高達(dá)1080p,時(shí)長(zhǎng)高達(dá)2分鐘(幀率30fps),且支持自由的寬高比。
目前官網(wǎng)顯示,快影App的AI創(chuàng)作功能中已正式開放文生視頻功能的邀測(cè),支持創(chuàng)作者申請(qǐng)并體驗(yàn)可靈大模型最新的文生視頻功能。圖生視頻功能也將于近期開放。
隨著AI大模型時(shí)代來臨,快手也動(dòng)作頻頻。快手已先后發(fā)布通用大語言模型“快意”、文生圖大模型產(chǎn)品“可圖”,還推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等視頻關(guān)鍵技術(shù)。據(jù)悉,伴隨此次可靈大模型的發(fā)布,快手將持續(xù)加速大模型的研發(fā)與應(yīng)用。