中國西藏網 > 即時新聞 > 時政

寥寥數語生成60秒視頻,Sora能否改變影視行業?

發布時間:2024-02-20 09:46:00來源: 解放日報

  作者:俞陶然

  近期,OpenAI公司發布的文生視頻大模型Sora引發全球關注。只要輸入一句或寥寥幾句描述畫面情節的提示詞,它就能生成一段時長60秒的視頻。這些視頻的質量和準確性達到了令人驚艷的程度。

  Sora的技術原理是什么?其應用價值有多大?記者采訪了上海交通大學計算機科學與工程系教授趙海。

  趙海教授介紹,Sora屬于多模態混合模型,由大語言模型和文圖生成器拼接而成。純文圖生成模型對提示詞的理解能力很弱。比如,用戶輸入“世界和平”,它往往無法生成準確的圖片。如果把文圖生成器與大語言模型拼接在一起,后者就能把“世界和平”轉化為和平鴿、橄欖枝等文圖生成器“看得懂”的提示詞,從而生成切題的作品。

  文圖生成器經改造后,也能生成視頻。因此,從文圖生成器過渡到文生視頻大模型,不需要很大的技術突破,研發團隊主要依靠的是大算力、大模型、大樣本訓練數據等“先天條件”?!斑@些條件都是OpenAI所具備的,所以Sora的問世不能算技術革命,而是工程實踐的成功。”趙海說。

  Sora展示的一批文生視頻案例令人驚艷。比如,輸入這樣一段提示詞:“一位時尚女性走在充滿霓虹燈和城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去?!盨ora根據這段話生成的60秒視頻效果頗佳,頭發、服裝等細節都沒問題,并實現了連貫的場景轉換,達到以假亂真的水平。

  Sora與同類產品相比,具有三大優勢——60秒時長、單視頻包含多角度鏡頭、遵循部分物理規律。

  Sora問世前,同類產品只能根據提示詞生成5秒以內的短視頻。Sora的作品不僅長達1分鐘,而且有多角度鏡頭,這些鏡頭里的人和物還能保持前后一致性,不會因角度變換而出現問題。在對物理規律的掌握方面,Sora也有不俗表現,比如在其生成的一段SUV(運動型多用途汽車)行駛視頻中,汽車影子與車身始終契合。

  不過,Sora的作品也存在不少瑕疵。如輸入“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,視頻中狼的數量會莫名改變,幾只狼憑空出現或消失。趙海分析:“目前的文圖生成器對數字不夠敏感,比如生成的一些手會有6根手指,今后要加強這方面的訓練?!?/p>

  在他看來,視頻大模型將改變影視行業的游戲規則。以技術含量最高的科幻電影為例,目前拍攝一部科幻大片往往需要數年時間,視頻大模型用于這個領域后,特效畫面的制作時間有望縮短到幾天,從而大幅降低科幻電影拍攝的時間成本和技術門檻。視頻攝制成本的降低,也將給傳媒行業帶來變革。今后,部分視頻的攝制也許只要在電腦前輸入一些提示詞,省去了現場拍攝、后期剪輯等耗時費力的過程。(俞陶然)

(責編:李雨潼)

版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。

无码专区永久免费AV网站| 少妇人妻88久久中文字幕| 天堂√在线中文资源网| 精品视频无码一区二区三区| 日韩欧美中文字幕一字不卡 | 色欲狠狠躁天天躁无码中文字幕| 色AV永久无码影院AV| 亚洲日韩在线中文字幕第一页| 亚洲一区无码精品色| 国产精品99精品无码视亚| 中文精品无码中文字幕无码专区| 日韩乱码人妻无码中文字幕久久 | 国产v亚洲v天堂无码网站| 一本大道东京热无码一区| 亚洲欧美日韩中文字幕二区| 婷婷综合久久中文字幕蜜桃三电影| 无码专区一va亚洲v专区在线 | 人妻无码精品久久亚瑟影视| 久久久久久无码Av成人影院| 亚洲精品无码鲁网中文电影| 日韩综合无码一区二区| 亚洲中文字幕无码爆乳av中文| 日本精品中文字幕| 亚洲中文字幕在线第六区| 午夜无码中文字幕在线播放| 精品久久久久久无码免费| 91久久九九无码成人网站| 99精品人妻无码专区在线视频区| 久久99精品久久久久久hb无码| 亚洲AV无码久久| 日韩精品无码一本二本三本| 日韩精品人妻系列无码专区免费| 亚洲日韩乱码中文无码蜜桃臀网站 | 日韩精品无码人妻一区二区三区| 国内精品久久久久久中文字幕| 亚欧成人中文字幕一区| 中文字幕手机在线视频| 日韩三级中文字幕| 制服中文字幕一区二区| 久久久久av无码免费网| 成人午夜精品无码区久久|