Sora2發布兩周后,百度的蒸汽機AI視頻模型,和谷歌Veo3.1撞了檔期。
兩家公司選擇同期發布并非有多默契,而是Sora2帶來的壓迫感促使它們不得不加快腳步。
奧爾特曼將形容Sora2為“創意領域的ChatGPT3.5時刻”,不僅在物理邏輯、畫面連貫性、真實感和音畫同步等方面實現了質的飛躍,還把Sora從一個“文本到視頻”的工具進化成一個“創意到生態”的平臺。
這無疑是扔在AI視頻生成領域的一顆重磅炸彈,它揭示了另一種可能,按照OpenAI的邏輯,通過Cameo(客串)、Remix(二創)和社交化產品設計這三大支柱,足以徹底重構內容創作的商業邏輯。
這是Google、Meta、TikTok不愿意看到的,卻是百度、阿里、360們期待的。百度蒸汽機團隊在最近的一次采訪中就坦承,Sora2的產品化和社交裂變方面帶來了重要啟發。
通過Cameo等功能,Sora巧妙地解決了AI+社交的難題,將重點放在熟人關系的低成本Remix共創上,而非單純追求視頻質量。更重要的是,大模型廠商之間的競爭也從過往簡單的模型SOAT比拼升級至產品落地、商業變現等價值維度層面。
這意味著,定義應用與產品能力的重要性正變得與構建模型同樣重要。而在大洋彼岸,這也是Sora的同類型產品正在尋求的一條出路。
理性看待Sora2的進步
Sora2的技術有多厲害,看發布后快手和百度的態度就知道了:前者號稱AI團隊假期8天無休,后者副總裁出面接受采訪,直言“50多天高強度推進工作”,還不忘替公司美言——“國慶中秋期間屬于合法加班”。
相較早期Sora文生視頻模型,Sora2的核心升級主要體現在生成質量和交互能力上:
1)物理一致性顯著優化,對剛體、流體、遮擋及碰撞等動力學建模更為精確;
2)可控性增強,鏡頭運動與敘事節奏能更好響應用戶腳本指令;
3)新增原生音頻功能,可實現對白與環境音同步生成;
4)畫面風格覆蓋寫實、電影、動畫等多類型場景,整體表現更穩定。
在先前基礎上,Sora2實現以往視頻模型難及的功能(更精準物理效果、清晰真實感、同步音頻、強可控性、廣風格范圍),能精準遵指令創作兼具想象力與真實動態的視頻,既拓展敘事和創意表達工具庫,也向精準模擬物理世界復雜性的模型邁進。
總之,Sora2是一個更具攻擊性的迭代,修復了此前的短板再一次領先行業。但在視頻質量層面,Sora2也并非絕對領先。
華泰證券不久前通過在相同prompt下做對比測試,發現可靈與即夢的視頻生成質量整體仍優于Sora2,其中可靈2.5Turbo已登頂Artificial Analysis文生視頻榜首。
圖片
百度的蒸汽機AI視頻模型不僅是全球首個實現中文音視頻一體化的視頻生成模型,最新的版本還瞄著Sora2打——用戶可支持無限時長視頻生成,并能在生成過程中實時交互,隨時改寫內容或擴寫續集。
換句話說,在技術層面Sora2幾乎沒有斷代領先優勢,但在模式上這一次卻是一騎絕塵。
Sora App上線第四天拿下美區App Store免費應用榜第一名,超越OpenAI的ChatGPT和谷歌的Gemini。目前,Sora仍處于邀請制測試階段,僅在美國和加拿大地區的iOS設備上提供。盡管存在這些限制,Sora仍然登頂蘋果美服應用排行榜。
圖片
據應用情報提供商Appfigures的數據,在僅限美國和加拿大地區并采用邀請制的情況下,Sora的iOS應用程序于9月30日和10月1日上線后的頭兩天內,總計獲得了16.4萬次下載。
從首日下載量來看,Sora盡管不及ChatGPT,但已經和xAI推出的Grok持平,不過考慮到Sora并未全面開放,其市場潛力可能更為巨大。
這也是為何在發布最初的幾天后,山姆奧特曼的蹦迪視頻迅速在短視頻平臺消失,Sora APP本質上是OpenAI從“單一對話工具”(ChatGPT)向“生態化社交平臺”的核心戰略轉型。
更直白一點就是,Sora APP本就是來搶短視頻飯碗的,它大概率是下一代的短視頻平臺。
媒體和券商也將客串(Cameos)和混剪(Remix)視為兩大革命性功能,認為Sora2不是簡單的視頻生成創造工具,而是AI時代的TikTok。
客串(Cameos):用戶只需在應用內進行一次性的簡短音視頻錄制,以驗證身份并捕捉你的形象,Sora2模型就能以驚人的保真度將用戶上傳的形象復刻。之后,用戶進行形象授權,將用戶的虛擬形象置入任何AI場景中,創建帶有用戶個人形象的“客串視頻”。
混剪(Remix):內置的剪輯工具,只允許用戶輸入提示詞,對平臺上的任何視頻和潮流進行「二創」,生成屬于用戶自己的版本。
更重要的是,這一布局并非簡單的功能延伸,而是針對AI產品增長邏輯的深層優化,標志著OpenAI從“AI工具提供商”向“AI生態構建者”的轉變:
通過Sora APP串聯起“模型能力→用戶場景→商業變現”的完整鏈路,既避免了因單一工具屬性導致的增長乏力,更以“數據飛輪+社交網絡”的雙重護城河,鞏固了在AI生成式內容領域的領先地位。
AI視頻社交,想掀短視頻的桌
Sora App自10月4日起持續位居iOS免費榜首的原因,有人總結主要源于三點:
1)UGC玩法豐富。通過Cameo好友入境與Remix二創功能,用戶可生成沉浸式互動視頻,與好友或名人(如Altman)同框,AI亦使得偏離現實的創意劇情成為可能,兼具趣味性與社交屬性。
2)邀請制機制推動社交裂變。Sora采用邀請碼制,新用戶輸入邀請碼即可體驗,每位新用戶又可邀請4位好友參與,既保證了種子用戶與目標群體的一致性,也通過稀缺感提升了產品的心理價值。
3)ChatGPT在C端擁有深厚用戶基礎。ChatGPT網頁端與移動端9月 MAU 已分別達到7.9億(Similarweb)與2.7億(SensorTower),穩居大語言模型首位,流量基石穩固,同時,Sora網頁版與ChatGPT會員捆綁銷售,可促進用戶導流。
而這種策略后續極有可能會被國內本土化AI視頻跟進,尤其是那些具備技術但無社交的產品,比如百度、360、阿里等。畢竟國內產品更強調視頻內容創作,類似Cameo與Remix的互動玩法尚未落地,C端社區文化仍處于早期階段。
對于字節、快手來說,在國內推出一個獨立于主平臺的AI視頻App也并非不可能,畢竟也有導流。
Sora App雖然在國內構不成威脅,但在海外市場仍有殺傷力。Sora App之所被稱為 “AI版TikTok”,正是因為界面及首頁推薦邏輯與之相似——App主頁為垂直視頻流,用戶可上下滑動瀏覽其他用戶發布的內容。
圖片
但這還不是最關鍵的,OpenAI正在急速構建一個圍繞視頻生成的、由IP驅動的新生態系統。
其核心就兩點:“ granular control(精細化控制)” 和 “ revenue share(收入分成)”。這意味著,Sora將不再是簡單的工具,而是一個連接IP方與全球億萬創作者的經濟平臺。
所謂精細化控制,是指OpenAI將為版權方提供更細粒度的控制權,允許他們對角色生成進行更精確的管理,類似于“肖像同意”模型,但將加入更多控制選項。
而收入分成則表示,OpenAI計劃嘗試將一部分收入分享給那些希望用戶生成自己角色的版權方。
由此一來,Sora有望由APP平臺主導,形成“IP+創作者”的收入分成商業模型。
對IP方(好萊塢、游戲大廠、日漫出版社)來說,沉睡的IP資產庫變成了可24小時開采的“油井”。不僅可以坐收授權費,更能借助全球創作者的腦洞,維持IP熱度和生命力,甚至通過數據反饋(哪個角色、哪種風格最火)指導后續創作。
對創作者而言,終于可以合法、合規、低成本地使用蝙蝠俠、皮卡丘,甚至《三體》中的角色來創作視頻。創作從“技術活”變成了“創意活”,核心能力從操作軟件變為提示詞工程和審美。更重要的是,你的爆款視頻將能帶來真金白銀的平臺分成。
尾聲
Sora2的社交屬性使其從“工具”變成了“平臺”,雖然定義應用與產品的能力被提升到了前所未有的高度,但同時也為其同類產品打開了新的思路。
以往,AI視頻產品更多投入用在視頻生成質量,對于應用則是盡可能指向B端的廣告、教育、自媒體等少數行業,至于C端則很少涉獵。
但在Sora App之后,形勢可能會有所改觀。
一方面,國內各家都極力追趕Sora2的技術進度;
另一方面,社交屬性的開發令百度等缺乏社交資源的公司嗅到了AI視頻的第二種可能。



