久草久草欧美看看日毛片|亚洲色情电影在线观看|中国一极毛片爱爱欧美一区|国产精品丝袜美腿|干人人操人人干人人|av黄色无码亚洲v视频|全国一级黄片在哪里看|国产精品av影院|特级一级黄色视频|亚洲黄色导航网站在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 熱點(diǎn) ? 正文

效果炸裂!OpenAI 發(fā)布視頻生成模型

作者:關(guān)注前沿科技 來(lái)源: 量子位 290803/17

剛剛,奧特曼發(fā)布OpenAI*視頻生成模型Sora。*繼承DALL·E 3的畫(huà)質(zhì)和遵循指令能力,能生成長(zhǎng)達(dá)1分鐘的高清視頻。AI想象中的龍年春節(jié),紅旗招展人山人海。有緊跟舞龍隊(duì)伍抬頭好奇官網(wǎng)的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各

標(biāo)簽: AI 視頻 文本生成

剛剛,奧特曼發(fā)布OpenAI*視頻生成模型Sora。

*繼承DALL·E 3的畫(huà)質(zhì)和遵循指令能力,能生成長(zhǎng)達(dá)1分鐘的高清視頻。

AI想象中的龍年春節(jié),紅旗招展人山人海。

有緊跟舞龍隊(duì)伍抬頭好奇官網(wǎng)的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各有各的行為。

雨后東京街頭,潮濕地面反射霓虹燈光影效果堪比RTX ON。

行駛中的列車(chē)窗外偶遇遮擋,車(chē)內(nèi)人物倒影短暫出現(xiàn)非常驚艷。

也可以來(lái)一段好萊塢大片質(zhì)感的電影預(yù)告片:

豎屏超近景視角下,這只蜥蜴細(xì)節(jié)拉滿:

網(wǎng)友直呼game over,工作要丟了:

甚至有人已經(jīng)開(kāi)始“悼念”一整個(gè)行業(yè):

AI理解運(yùn)動(dòng)中的物理世界

OpenAI表示,正在教AI理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來(lái)幫助人們解決需要現(xiàn)實(shí)世界交互的問(wèn)題

根據(jù)文本提示生成視頻,僅僅是整個(gè)計(jì)劃其中的一步。

目前Sora已經(jīng)能生成具有多個(gè)角色、包含特定運(yùn)動(dòng)的復(fù)雜場(chǎng)景,不僅能理解用戶在提示中提出的要求,還了解這些物體在物理世界中的存在方式。

比如一大群紙飛機(jī)在樹(shù)林中飛過(guò),Sora知道碰撞后會(huì)發(fā)生什么,并表現(xiàn)其中的光影變化。

一群紙飛機(jī)在茂密的叢林中翩翩起舞,在樹(shù)林中穿梭,就像候鳥(niǎo)一樣。

Sora還可以在單個(gè)視頻中創(chuàng)建多個(gè)鏡頭,并依靠對(duì)語(yǔ)言的深入理解準(zhǔn)確地解釋提示詞,保留角色和視覺(jué)風(fēng)格。

美麗、白雪皚皚的東京熙熙攘攘。鏡頭穿過(guò)熙熙攘攘的城市街道,跟隨幾個(gè)人享受美麗的雪天并在附近的攤位購(gòu)物。絢麗的櫻花花瓣隨著雪花隨風(fēng)飄揚(yáng)。

對(duì)于Sora當(dāng)前存在的弱點(diǎn),OpenAI也不避諱,指出它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理原理,并且可能無(wú)法理解因果關(guān)系

例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,狼的數(shù)量會(huì)變化,一些憑空出現(xiàn)或消失。

該模型還可能混淆提示的空間細(xì)節(jié),例如混淆左右,并且可能難以精確描述隨著時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。

如提示詞“籃球穿過(guò)籃筐然后爆炸”中,籃球沒(méi)有正確被籃筐阻擋。

技術(shù)方面,目前OpenAI透露的不多,簡(jiǎn)單介紹如下:

Sora是一種擴(kuò)散模型,從噪聲開(kāi)始,能夠一次生成整個(gè)視頻或擴(kuò)展視頻的長(zhǎng)度,

關(guān)鍵之處在于一次生成多幀的預(yù)測(cè),確保畫(huà)面主體即使暫時(shí)離開(kāi)視野也能保持不變

與GPT模型類(lèi)似,Sora使用了Transformer架構(gòu),有很強(qiáng)的擴(kuò)展性。

在數(shù)據(jù)方面,OpenAI將視頻和圖像表示為patch,類(lèi)似于GPT中的token。

通過(guò)這種統(tǒng)一的數(shù)據(jù)表示方式,可以在比以前更廣泛的視覺(jué)數(shù)據(jù)上訓(xùn)練模型,涵蓋不同的持續(xù)時(shí)間、分辨率和縱橫比。

Sora建立在過(guò)去對(duì)DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示詞技術(shù),為視覺(jué)訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)注,因此能夠更忠實(shí)地遵循用戶的文本指令。

除了能夠僅根據(jù)文本指令生成視頻之外,該模型還能夠獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻,準(zhǔn)確地讓圖像內(nèi)容動(dòng)起來(lái)并關(guān)注小細(xì)節(jié)。

該模型還可以獲取現(xiàn)有視頻并對(duì)其進(jìn)行擴(kuò)展或填充缺失的幀,請(qǐng)參閱技術(shù)論文了解更多信息(晚些時(shí)候發(fā)布)。

Sora 是能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),OpenAI相信這一功能將成為實(shí)現(xiàn)AGI的重要里程碑。

奧特曼在線接單

目前已有一些視覺(jué)藝術(shù)家、設(shè)計(jì)師和電影制作人(以及OpenAI員工)獲得了Sora訪問(wèn)權(quán)限。

他們開(kāi)始不斷po出新的作品,奧特曼也開(kāi)始了在線接單模式。

帶上你的提示詞@sama,就有可能收到生成好的視頻回復(fù)。

參考鏈接:[1]https://openai.com/sora

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開(kāi)信息,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問(wèn)題請(qǐng)及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

熱門(mén)推薦

2023年中國(guó)經(jīng)濟(jì)面臨巨大挑戰(zhàn),只有知道如何破局,才能縱橫股市

來(lái)源:量子位 作者:關(guān)注前沿科技06/14 21:14

財(cái)中網(wǎng)合作