[db:作者] 发表于 2025-10-10 12:11

Open AI的Sora 2有多恐怖?会是下一个“抖音”吗?5点搞明白

引言
你刷着短视频,突然看到自己正在空漫步,或是与朋友出演一部科幻大片——而你从未真正拍摄过这些。这不再是科幻小说,而是OpenAI刚刚发布的Sora 2带来的现实。
“这不是下一个AI内容工具,而是新一代创作和连接的媒介。”OpenAI首席执行官Sam Altman在Sora 2的发布中这样宣告。
9月30日,OpenAI不仅推出了新一代视频大模型Sora 2,还同时发布了一款同名的社交应用,将AI视频生成从专业工具变成了普通用户的创意玩具。
这款被称作“视频的GPT-3.5时刻”的新模型,究竟有何魔力能够引发整个科技圈的震动?




01、Sora 2是怎样的“世界模型”?简单来说,世界模型就是让AI学会像人类一样理解这个世界的运作规律。
比如,你扔出一个篮球,知道它会沿着抛物线运动;打翻杯子,知道水会洒出来。这些都是我们从小到大在学习中形成的对物理世界的直觉。
早期的AI视频生成器就像个不懂事的孩子,为了达到目的会不顾现实规律。
比如,你让它生成“篮球运动员投篮”,如果球没进,它可能会让球“瞬移”进篮筐,或者直接跳过结果。
而Sora 2开始“懂事”了——如果球没进,它就没进。球会撞到篮板,弹回来-5。它开始理解重力、惯性和摩擦。
在发布会现场,OpenAI展示了一个例子:“一个花样滑冰运动员头顶一只猫,完成三周半跳。”
过去的AI可能会让猫消失、人物穿模或画面崩塌,但Sora 2生成的视频中,猫在挣扎保持平衡,选手完成跳跃后稳稳落地,一切都符合物理直觉。

02、Sora 2的三大突破1. 物理感:承认失败比假装完美更难能可贵
Sora 2最大的进步在于它不再只是为了满足用户的指令而扭曲现实。它能模拟失败,而不仅仅是成功。
这种对现实世界复杂性的理解,恰恰是它被称为“世界模拟器”而非“视频生成器”的原因。
2. 声画同步:视频终于有了“灵魂”
Sora 2现在能在生成画面的同时生成匹配的音频——包括背景环境音、物体交互声,甚至是符合语境的对话。
想象一下,生成“一只猫在键盘上走过”的视频,不仅有画面,还会同步产生猫的叫声和键盘被踩压的声音。这种声画一体的体验,让AI视频真正活了起来。
3. 多镜头叙事:从拍片段到讲故事
以前的AI视频生成需要用户“逐个镜头”拼接,而Sora 2能一次性生成多镜头的长场景,理解故事结构,用镜头语言讲清楚一个完整的情节。
这意味着普通用户也可以构建连贯的叙事,而不仅仅是生成一堆漂亮的碎片画面。

03、为什么是“视频的GPT-3.5时刻”?ChatGPT的出现让AI对话从玩具变成了工具,每个人都能够与AI进行自然交流。Sora 2的目标是在视频领域实现同样的飞跃。
Altman称之为“创意领域的ChatGPT时刻”,创意将迎来“寒武纪爆发”。
回想一下,在ChatGPT之前,AI对话生硬、机械;在Sora 2之前,AI视频也常常扭曲物理规律,让人一眼就能看出是假的。
Sora 2就像视频领域的ChatGPT,把原本只有专业人士才能使用的复杂技术,变成了普通人也能轻松操作的创意工具。
OpenAI将初代Sora比作“视频领域的GPT-1时刻”,而Sora 2直接跃升到了“GPT-3.5时刻”,标志着AI视频生成从“能看”进化到了“能用”的阶段。


04、Sora App:不只是工具,更是社交新玩法更令人惊喜的是,OpenAI没有将Sora 2仅仅作为一个技术模型发布,而是为它量身打造了一款社交应用——Sora App。
这款应用的核心是一个名为“Cameo”的功能:通过录制10秒视频,你可以将自己“上传”到模型中,然后在任意AI生成的场景中复现你的外貌、声音和表情。
想象一下,你可以和朋友一起出现在同一支广告片段里,或者把自己放入太空战斗中——完全不需要拍摄设备或剪辑技能。
Sora产品团队领导Rohan在发布会上展示了这一功能:他和OpenAI CEO Sam Altman出现在同一支广告片段里,说话唇形完美匹配,动作自然切换。
应用内还有一个“Remix”按钮,允许用户对他人的视频进行二次创作。
你可以修改提示词,更换场景,甚至把自己加入别人的视频中。这使得视频不再是创作的终点,而成为了下一次互动的邀请。

05、赛场竞逐:Sora 2与谷歌Veo的差异在AI视频生成的赛场上,OpenAI并非唯一选手。谷歌的Veo 2同样实力不俗,但两者的技术路线和定位有着明显差异。
Sora 2更强项在于世界建模和物理一致性,追求模拟真实的物理世界;而Veo 2则更侧重于艺术风格和电影质感,在镜头语言控制上更为成熟。
这就好比两个画家,一个追求极致的写实主义,另一个则擅长表现艺术风格。
在分辨率方面,Veo 2支持4K高清,而Sora 2目前支持1080p。但Sora 2在多镜头叙事和角色一致性上表现更佳。
更重要的是,OpenAI通过Sora App将技术包装成了一款社交产品,而谷歌则选择将Veo 2与YouTube等现有平台整合。
这两条路径各有千秋,Sora 2凭借其社交属性可能更快触及普通用户,而Veo 2则能借助谷歌生态更快实现商业化。

06、Sora 2会成为下一个“抖音”吗?Sora App看起来确实很像抖音——竖屏信息流、上下滑动切换、点赞评论功能一应俱全。但它有一个根本区别:平台上禁止上传任何实拍内容,所有视频都必须由AI生成。
这创造了一种全新的社交体验:你不再只是记录生活,而是直接创造你想生活的世界。
然而,Sora 2要成为真正的“抖音”还面临不少挑战:
网络效应:抖音的强大在于数十亿用户和成熟的内容生态,Sora 2作为新平台需要从头积累。
内容独特性:目前AI生成的内容仍有一定同质化风险,能否持续产出吸引人的内容尚待观察。
技术门槛:尽管操作简化了,但构思好的提示词本身仍需要一定的创造力和技巧。
不过,Sora 2的“Cameo”功能提供了抖音没有的社交维度——关系驱动的共创。你的朋友可以直接把你“拉进”他们的视频,这种基于人际授权的协作模式,可能会催生全新的社交互动方式。

07、量子引力:那片“未知大陆”尽管Sora 2表现出色,但它仍不完美。模型有时仍会犯错,对复杂物理过程的理解也有局限。
更严峻的是伦理和真实性问题。当AI生成的视频如此逼真,我们如何辨别真伪?如何防止恶意使用?
OpenAI为此设计了一套权限机制——用户完全控制谁可以使用自己的“数字分身”,可以随时撤销授权,甚至删除包含自己形象的内容。
针对青少年,应用默认限制观看时间,并对Cameo权限设置更严格的限制。所有生成内容都会添加水印以便识别。



总结:未来会发展成什么样子?展望未来,Sora 2的进化不仅仅是让视频生成更简单,更是向通用世界模拟器迈进的关键一步。
这种技术最终可能会应用于训练能深度理解物理世界的AI模型,甚至为未来的机器人技术奠定基础。
从技术层面看,Sora 2的物理模拟和一致性已经达到了新的高度;从产品层面看,Sora App的社交功能可能会重塑短视频的生态;从生态层面看,OpenAI正在构建一个从工具到平台的全新体系。
科技的终极目标不是取代人类,而是赋予每个人更大的创造力。
#sora##sora2##如何看待openai的sora视频模型##sora视频自动生成#
页: [1]
查看完整版本: Open AI的Sora 2有多恐怖?会是下一个“抖音”吗?5点搞明白