Open AI的Sora 2有多恐怖？会是下一个“抖音”吗？5点搞明白

[db:作者] 发表于 2025-10-10 12:11

引言
你刷着短视频，突然看到自己正在空漫步，或是与朋友出演一部科幻大片——而你从未真正拍摄过这些。这不再是科幻小说，而是OpenAI刚刚发布的Sora 2带来的现实。
“这不是下一个AI内容工具，而是新一代创作和连接的媒介。”OpenAI首席执行官Sam Altman在Sora 2的发布中这样宣告。
9月30日，OpenAI不仅推出了新一代视频大模型Sora 2，还同时发布了一款同名的社交应用，将AI视频生成从专业工具变成了普通用户的创意玩具。
这款被称作“视频的GPT-3.5时刻”的新模型，究竟有何魔力能够引发整个科技圈的震动？

01、Sora 2是怎样的“世界模型”？简单来说，世界模型就是让AI学会像人类一样理解这个世界的运作规律。
比如，你扔出一个篮球，知道它会沿着抛物线运动；打翻杯子，知道水会洒出来。这些都是我们从小到大在学习中形成的对物理世界的直觉。
早期的AI视频生成器就像个不懂事的孩子，为了达到目的会不顾现实规律。
比如，你让它生成“篮球运动员投篮”，如果球没进，它可能会让球“瞬移”进篮筐，或者直接跳过结果。
而Sora 2开始“懂事”了——如果球没进，它就没进。球会撞到篮板，弹回来-5。它开始理解重力、惯性和摩擦。
在发布会现场，OpenAI展示了一个例子：“一个花样滑冰运动员头顶一只猫，完成三周半跳。”
过去的AI可能会让猫消失、人物穿模或画面崩塌，但Sora 2生成的视频中，猫在挣扎保持平衡，选手完成跳跃后稳稳落地，一切都符合物理直觉。

02、Sora 2的三大突破1. 物理感：承认失败比假装完美更难能可贵
Sora 2最大的进步在于它不再只是为了满足用户的指令而扭曲现实。它能模拟失败，而不仅仅是成功。
这种对现实世界复杂性的理解，恰恰是它被称为“世界模拟器”而非“视频生成器”的原因。
2. 声画同步：视频终于有了“灵魂”
Sora 2现在能在生成画面的同时生成匹配的音频——包括背景环境音、物体交互声，甚至是符合语境的对话。
想象一下，生成“一只猫在键盘上走过”的视频，不仅有画面，还会同步产生猫的叫声和键盘被踩压的声音。这种声画一体的体验，让AI视频真正活了起来。
3. 多镜头叙事：从拍片段到讲故事
以前的AI视频生成需要用户“逐个镜头”拼接，而Sora 2能一次性生成多镜头的长场景，理解故事结构，用镜头语言讲清楚一个完整的情节。
这意味着普通用户也可以构建连贯的叙事，而不仅仅是生成一堆漂亮的碎片画面。

03、为什么是“视频的GPT-3.5时刻”？ChatGPT的出现让AI对话从玩具变成了工具，每个人都能够与AI进行自然交流。Sora 2的目标是在视频领域实现同样的飞跃。
Altman称之为“创意领域的ChatGPT时刻”，创意将迎来“寒武纪爆发”。
回想一下，在ChatGPT之前，AI对话生硬、机械；在Sora 2之前，AI视频也常常扭曲物理规律，让人一眼就能看出是假的。
Sora 2就像视频领域的ChatGPT，把原本只有专业人士才能使用的复杂技术，变成了普通人也能轻松操作的创意工具。
OpenAI将初代Sora比作“视频领域的GPT-1时刻”，而Sora 2直接跃升到了“GPT-3.5时刻”，标志着AI视频生成从“能看”进化到了“能用”的阶段。

04、Sora App：不只是工具，更是社交新玩法更令人惊喜的是，OpenAI没有将Sora 2仅仅作为一个技术模型发布，而是为它量身打造了一款社交应用——Sora App。
这款应用的核心是一个名为“Cameo”的功能：通过录制10秒视频，你可以将自己“上传”到模型中，然后在任意AI生成的场景中复现你的外貌、声音和表情。
想象一下，你可以和朋友一起出现在同一支广告片段里，或者把自己放入太空战斗中——完全不需要拍摄设备或剪辑技能。
Sora产品团队领导Rohan在发布会上展示了这一功能：他和OpenAI CEO Sam Altman出现在同一支广告片段里，说话唇形完美匹配，动作自然切换。
应用内还有一个“Remix”按钮，允许用户对他人的视频进行二次创作。
你可以修改提示词，更换场景，甚至把自己加入别人的视频中。这使得视频不再是创作的终点，而成为了下一次互动的邀请。

05、赛场竞逐：Sora 2与谷歌Veo的差异在AI视频生成的赛场上，OpenAI并非唯一选手。谷歌的Veo 2同样实力不俗，但两者的技术路线和定位有着明显差异。
Sora 2更强项在于世界建模和物理一致性，追求模拟真实的物理世界；而Veo 2则更侧重于艺术风格和电影质感，在镜头语言控制上更为成熟。
这就好比两个画家，一个追求极致的写实主义，另一个则擅长表现艺术风格。
在分辨率方面，Veo 2支持4K高清，而Sora 2目前支持1080p。但Sora 2在多镜头叙事和角色一致性上表现更佳。
更重要的是，OpenAI通过Sora App将技术包装成了一款社交产品，而谷歌则选择将Veo 2与YouTube等现有平台整合。
这两条路径各有千秋，Sora 2凭借其社交属性可能更快触及普通用户，而Veo 2则能借助谷歌生态更快实现商业化。

06、Sora 2会成为下一个“抖音”吗？Sora App看起来确实很像抖音——竖屏信息流、上下滑动切换、点赞评论功能一应俱全。但它有一个根本区别：平台上禁止上传任何实拍内容，所有视频都必须由AI生成。
这创造了一种全新的社交体验：你不再只是记录生活，而是直接创造你想生活的世界。
然而，Sora 2要成为真正的“抖音”还面临不少挑战：
网络效应：抖音的强大在于数十亿用户和成熟的内容生态，Sora 2作为新平台需要从头积累。
内容独特性：目前AI生成的内容仍有一定同质化风险，能否持续产出吸引人的内容尚待观察。
技术门槛：尽管操作简化了，但构思好的提示词本身仍需要一定的创造力和技巧。
不过，Sora 2的“Cameo”功能提供了抖音没有的社交维度——关系驱动的共创。你的朋友可以直接把你“拉进”他们的视频，这种基于人际授权的协作模式，可能会催生全新的社交互动方式。

07、量子引力：那片“未知大陆”尽管Sora 2表现出色，但它仍不完美。模型有时仍会犯错，对复杂物理过程的理解也有局限。
更严峻的是伦理和真实性问题。当AI生成的视频如此逼真，我们如何辨别真伪？如何防止恶意使用？
OpenAI为此设计了一套权限机制——用户完全控制谁可以使用自己的“数字分身”，可以随时撤销授权，甚至删除包含自己形象的内容。
针对青少年，应用默认限制观看时间，并对Cameo权限设置更严格的限制。所有生成内容都会添加水印以便识别。

总结：未来会发展成什么样子?展望未来，Sora 2的进化不仅仅是让视频生成更简单，更是向通用世界模拟器迈进的关键一步。
这种技术最终可能会应用于训练能深度理解物理世界的AI模型，甚至为未来的机器人技术奠定基础。
从技术层面看，Sora 2的物理模拟和一致性已经达到了新的高度；从产品层面看，Sora App的社交功能可能会重塑短视频的生态；从生态层面看，OpenAI正在构建一个从工具到平台的全新体系。
科技的终极目标不是取代人类，而是赋予每个人更大的创造力。
#sora##sora2##如何看待openai的sora视频模型##sora视频自动生成#

页: [1]

天涯论坛_华人最大的社区论坛_新天涯社区's Archiver

Open AI的Sora 2有多恐怖？会是下一个“抖音”吗？5点搞明白