作為OpenAI發(fā)布的首個(gè)AI文(圖)生視頻模型,Sora帶給人們的感受是炸裂級(jí)的——根據(jù)輸入的文字提示,能生成效果逼真的60秒視頻,而且是可以一鏡到底那種。
這意味著,繼文本、圖像之后,OpenAI將其先進(jìn)的AI技術(shù)拓展到了視頻領(lǐng)域。雖然Sora模型尚未面向公眾開放,但是已經(jīng)有人感嘆:視頻生產(chǎn)顛覆性革命來了……
也有人預(yù)測(cè):一大批視頻從業(yè)人員要失業(yè)了……
然而,事情就這么簡(jiǎn)單嗎?
01
Sora能做什么?OpenAI在官網(wǎng)陸續(xù)公布了幾十段長(zhǎng)短不一的視頻,均根據(jù)文字提示生成。其中第一段視頻的文字提示為:
一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子,拎著黑色錢包。她戴著太陽(yáng)鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。
Sora根據(jù)提示生成的一分鐘視頻如下:
這一分鐘視頻在網(wǎng)上廣為流傳,可以視為Sora的代表作。其展示的信息量極大,從主要人物到背景人物、遠(yuǎn)處的街景以及地面,看起來十分逼真,鏡頭切換也非常流暢自然。從這張全景畫面截圖可以看到,和主人公同時(shí)走動(dòng)的路人、濕漉漉的地面、眼花繚亂的霓虹燈和招牌。
再看后面幾個(gè)特寫鏡頭:女主臉上斑點(diǎn)、脖紋清晰可見,顯得非常真實(shí),還有墨鏡里的反射的街景,這些細(xì)節(jié)都沒放過。
官網(wǎng)還展示了一條電影預(yù)告片,文字提示為:
電影預(yù)告片,講述了 30 歲的太空人戴著紅色羊毛針織摩托車頭盔的冒險(xiǎn)經(jīng)歷,藍(lán)天,鹽沙漠,電影風(fēng)格,用 35 毫米膠片拍攝,色彩鮮艷。
Sora根據(jù)提示生成的視頻如下:
馬斯克在X上兩次轉(zhuǎn)發(fā)網(wǎng)友評(píng)論時(shí)寫道:“AI增強(qiáng)的人類將創(chuàng)造出最好的作品。”“人類認(rèn)賭服輸?!?/span>
02
Sora牛在什么地方?這些看上去足可以假亂真的視頻,Sora是怎么做到的?
根據(jù)OpenAI官方介紹,用戶可以通過使用自然語(yǔ)言提示詞(Prompt),生成長(zhǎng)達(dá)1分鐘的視頻。
Sora模型對(duì)語(yǔ)言有深刻的理解,因而能夠準(zhǔn)確地理解提示詞,并生成令人信服的人物,而且可以在一個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,在這些鏡頭中準(zhǔn)確地保持角色和視覺風(fēng)格的一致性。
360創(chuàng)始人周鴻祎對(duì)Sora給予了極高的評(píng)價(jià),他在社交平臺(tái)發(fā)文:Sora的誕生意味著AGI(通用人工智能)實(shí)現(xiàn)可能從10年縮短至一兩年。
在他看來,Sora只是小試牛刀,它展現(xiàn)的不僅僅是視頻制作能力,而是大模型對(duì)真實(shí)世界有了理解和模擬之后,可能會(huì)帶來的新的成果和突破。他認(rèn)為,AI不一定那么快顛覆所有行業(yè),但它能激發(fā)更多人的創(chuàng)作力。
中央民族大學(xué)新聞與傳播學(xué)院教授郭全中在接受新京報(bào)傳媒研究采訪時(shí)說,相比ChatGPT,Sora有了質(zhì)的飛躍:
一是Sora具備推理能力,人類長(zhǎng)期以來孜孜以求的AGI(通用人工智能)成為可能,估計(jì)不久之后就會(huì)到來,而ChatGPT只是讓我們看到了曙光。
二是在當(dāng)今視頻時(shí)代,Sora作為圖生視頻的利器將助力傳媒業(yè)降本增效,極大地?cái)U(kuò)大能力范圍和能力邊界,給傳媒業(yè)帶來的影響遠(yuǎn)遠(yuǎn)超過ChatGPT。
DCCI互聯(lián)網(wǎng)研究院院長(zhǎng)劉興亮在接受新京報(bào)貝殼財(cái)經(jīng)記者采訪時(shí)表示,Sora模型的發(fā)布標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個(gè)新紀(jì)元,“通過簡(jiǎn)短的文本提示或一張靜態(tài)圖片,Sora能夠生成持續(xù)一分鐘左右的1080P高清視頻,涵蓋多個(gè)角色、不同類型的動(dòng)作和背景細(xì)節(jié)等,幾乎達(dá)到了電影級(jí)別的逼真場(chǎng)景?!?/span>
他認(rèn)為,這種能力不僅為內(nèi)容創(chuàng)作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度將創(chuàng)意變?yōu)楝F(xiàn)實(shí),而且為觀眾帶來了更豐富和多樣化的視覺體驗(yàn)。技術(shù)創(chuàng)新的這一巨大飛躍,預(yù)示著AI在未來人類生活的各個(gè)方面都將發(fā)揮更加重要的作用。
中國(guó)人民大學(xué)吳玉章講席教授、國(guó)家發(fā)展與戰(zhàn)略研究院研究員劉永謀在新京報(bào)評(píng)論撰文認(rèn)為,Sora的AI視頻效果幾乎和人工拍攝不相上下。也因此,雖不是從0到1的原始創(chuàng)新,卻已足夠令人震驚。
他預(yù)測(cè),未來,各種不同用途的Sora短視頻或許會(huì)很快充斥各種視頻社交平臺(tái),其對(duì)現(xiàn)實(shí)的影響與改變,不可不謂之巨大。
從業(yè)界到學(xué)界,幾乎是異口同聲認(rèn)為,Sora將會(huì)深度改變視頻相關(guān)領(lǐng)域,從影視、傳媒到社交平臺(tái),內(nèi)容生產(chǎn)將會(huì)發(fā)生巨變。
03
Sora帶來的兩大挑戰(zhàn)當(dāng)然,Sora并非完美,畢竟才剛剛誕生。
OpenAI在官網(wǎng)表示,目前Sora模型也有弱點(diǎn):
它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理特性,并且可能無(wú)法理解因果關(guān)系的具體實(shí)例。例如,一個(gè)人可能會(huì)咬一口餅干,但之后,餅干可能沒有咬痕。
同時(shí),該模型還可能混淆提示的空間細(xì)節(jié),例如,左右混淆,并且可能難以精確描述隨時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。
比如在一個(gè)樣片中,提示詞為“考古學(xué)家在沙漠中發(fā)現(xiàn)了一把普通的塑料椅子,正小心翼翼地挖掘和除塵”,Sora生成的視頻出現(xiàn)了椅子變形、自動(dòng)行走等詭異的場(chǎng)景。
另外,OpenAI還需要花更多精力檢查、攔截違反使用政策的文本輸入提示,例如極端暴力、色情內(nèi)容、名人肖像等。
對(duì)于傳媒從業(yè)者來說,則有兩大挑戰(zhàn)值得思考——
一是對(duì)視頻內(nèi)容生產(chǎn)的顛覆,或?qū)е麓罅咳藛T失業(yè);
二是對(duì)新聞傳播倫理的挑戰(zhàn),模糊了真實(shí)與虛擬的邊界。
-
又有一批人要失業(yè)?
“這可能導(dǎo)致大量的影視等相關(guān)行業(yè)從業(yè)者失業(yè),更是不可忽視的重大社會(huì)風(fēng)險(xiǎn)?!?/span>
劉永謀在文中提醒,關(guān)于AI大規(guī)模應(yīng)用可能引發(fā)的失業(yè)問題,已經(jīng)有汗牛充棟的深入研究,也提出了很多應(yīng)對(duì)方案,包括延緩AI技術(shù)的應(yīng)用速度,幫助再就業(yè),征收AI稅等。
“現(xiàn)在,Sora一夜刷屏提醒我們,要將這些措施穩(wěn)步細(xì)化實(shí)施,而不能再僅僅停留在刷屏上了?!?/span>
對(duì)于可能導(dǎo)致的部分人員失業(yè),中央民族大學(xué)新聞與傳播學(xué)院教授郭全中在接受新京報(bào)傳媒研究采訪時(shí)說:任何創(chuàng)新事物出現(xiàn),肯定會(huì)帶來結(jié)構(gòu)性失業(yè),即不能適應(yīng)創(chuàng)新的人要失業(yè)。但是,創(chuàng)新事物也會(huì)帶來大量新就業(yè)機(jī)會(huì),關(guān)鍵是看自己能否通過自我提升,與新事物共生共成長(zhǎng)。
-
新聞傳播倫理再面臨挑戰(zhàn)
劉永謀認(rèn)為,在AI短視頻建構(gòu)的世界中,顯然不能將眼睛看到的東西作為判斷依據(jù)了。Sora的應(yīng)用,無(wú)疑將進(jìn)一步加劇當(dāng)代社會(huì)的后真相狀況,真實(shí)與虛擬的邊界進(jìn)一步模糊,甚至完全被消解,“這需要我們高度警惕”。
“不管Sora是否'理解'世界,也不管Sora視頻多么逼真,始終仍是數(shù)字模擬,而不是真實(shí)拍攝的現(xiàn)實(shí)。”
郭全中也認(rèn)為,Sora的出現(xiàn),會(huì)導(dǎo)致視頻生產(chǎn)門檻大大降底,新聞倫理肯定會(huì)受到很大沖擊。
他說,Sora不但會(huì)大規(guī)模應(yīng)用于娛樂內(nèi)容的生產(chǎn)和傳播,同樣也必然會(huì)給新聞生產(chǎn)帶來巨大挑戰(zhàn),我們之前的新聞生產(chǎn)方式和流程會(huì)被顛覆,新聞的定義也會(huì)發(fā)生變化,如大量的技術(shù)手段應(yīng)用等。
從新聞傳播發(fā)展來看,圖文時(shí)代,都說“有圖有真相”,結(jié)果發(fā)現(xiàn)圖可以P;再到視頻時(shí)代,又有人說“有視頻有真相”,結(jié)果現(xiàn)在視頻也可以AI生成。
郭全中預(yù)計(jì),Sora未來更重大的挑戰(zhàn)在于會(huì)導(dǎo)致假新聞的泛濫,給新聞倫理和新聞治理帶來巨大挑戰(zhàn)。
此外,劉興亮還認(rèn)為,“隨著AI生成內(nèi)容與現(xiàn)實(shí)之間的界限變得越來越模糊,如何確保內(nèi)容的真實(shí)性和透明性成為了一個(gè)重要問題。此外,版權(quán)、隱私和數(shù)據(jù)安全等問題也需要得到妥善解決。社會(huì)必須面對(duì)這些挑戰(zhàn),通過制定相關(guān)政策、法律和倫理準(zhǔn)則來確保技術(shù)的健康發(fā)展,同時(shí)保護(hù)個(gè)人和社會(huì)的利益不受侵害?!?/span>
科技尤其是人工智能,還會(huì)以什么樣的速度改變傳媒行業(yè)和人類?身處其中,我們既有期待,也有些許忐忑。

返回列表