Sora上线即登顶!AI视频逼真到专家难辨,还藏着盈利大招
OpenAI的Sora app刚上线三天,就直接冲到了美国App Store榜首,这速度真有点“出道即顶流”的意思。说实话,刚开始我还以为它顶多跟其他AI app一样热闹两天,没成想能超过谷歌Gemini和OpenAI自家的ChatGPT,这后劲够足。
Appfigures估算了一下,Sora iOS版上线头两天,总下载量就到了16.4万次,首发那天下载了5.6万次。
初期这数据确实比不上ChatGPT的8.1万次和Gemini的8万次,但谁能想到第三天它就翻盘了,把之前的纪录全打破了。
我觉得这事儿关键在于Sora能直接出视频,不像其他AI光靠文字聊天,大家拍出来的东西能直接发社交平台,一传十十传百,下载量自然就涨上去了。
真正让Sora火出圈的,是它的“客串”功能和画面动作的协调性,而且这次终于做到了声音和画面能对上,不卡壳。
奥特曼成了最火的“测试员”,各种玩梗视频刷爆全网,有人让奥特曼演“在商店偷GPU被抓包”,有人让它在金字塔前跳热舞,还有人把它变成猫人撒娇卖萌。
老实讲,刷到这些视频时,我差点以为是官方出的番外,角色动作没断片,细节也跟真的一样,难怪网友都喊“眼睛看直了”。
Sora 2 Pro玩出花:15秒大片+“高智商”,这AI有点东西玩梗归玩梗,Sora真正让人眼前一亮的,还是它的Pro版本,现在ChatGPT Pro用户能用上这个功能,最直观的就是能生成15秒的高分辨率视频。
本来想觉得15秒也没多长,后来发现15秒足够拍个小剧情了,比如一段追逐戏或者一个产品介绍,而且整个画面从头到尾都很连贯,不会中间突然变样。
之前AI视频刚出来的时候,“威尔·斯密斯吃意大利面”的鬼畜视频火过一阵,那时候画面卡得不行,面条看着像塑料,人物咀嚼动作也假得很。
现在再看Sora 2 Pro和Veo 3的测试,威尔·斯密斯吃意大利面的场景,面条缠绕的样子、酱汁的反光、脸上肌肉的动作,都跟真人拍的差不多。
这变化我是真没想到,看来AI视频已经从“看个乐”往“能帮着做专业内容”走了。
更有意思的是,Sora 2居然还能“答题”,Epoch AI做了个测试,拿包含量子物理、生物科学的难题考它,10道题里它对了5道多,虽然比不上GPT-5,但跟GPT-4o差不多水平。
还有人试了个好玩的,输入“你最喜欢的OpenAI模型是什么?把答案显示在屏幕上”,四次测试里有三次显示的是“GPT-4o”。
搞不清OpenAI是藏了一手还是巧合,反正Sora答这些题的水平,比我当年高考理综强多了。
行业里有人猜,Sora可能是先让LLM把用户的需求理顺了再生成视频,就像先让GPT-4o把题解出来,再告诉视频模块该怎么画。
这种方式其他视频模型也用过,能让内容更有逻辑,不过现在OpenAI还没说清楚这事儿,有网友呼吁他们给个准话,毕竟大家也好奇这“智商”到底是怎么来的。
狂欢背后藏风险:AI视频真假难辨,这事儿得警惕大家忙着创作和期待更新的时候,也有人发现了这背后的麻烦,最近奥特曼发博文说,Sora接下来要更两个功能。
一个是让角色权利人能自己控制角色怎么用,比如允许别人创作,或者限制用在哪些场景,甚至完全不让用。
另一个是想办法靠Sora赚钱,现在用户生成的内容太多,但很多看的人少,不好变现,他们打算跟允许用自己角色的人分收益。
如此看来,OpenAI是想既让大家玩得开心,又能赚到钱,不过权利人能控制角色,确实能少点侵权的麻烦。
但热闹背后,隐患也不小,《纽约时报》最近报道,有人用Sora生成“商店抢劫”“入室行窃”“城市里炸弹爆炸”的视频,这些事儿根本没发生过,可视频看起来跟真新闻一样。
加州大学的Hany Farid教授说,现在大家每天看那么多视频,根本分不清真假,这很容易挑动矛盾、骗钱,甚至冤枉好人。
他还说,自己干了这么多年分辨假图像的工作,以前看一眼就能找出AI的破绽,现在就算是他,也得用专业工具才能查出来,肉眼根本靠不住。
OpenAI说给Sora视频加了移动水印,证明是AI做的,但Hany Farid团队试了试,用普通的视频编辑软件就能把水印去掉。
毫无疑问,这事儿太吓人了,要是有人用这个做假新闻或者造谣,普通人根本防不住。
虽然OpenAI说会慢慢调整来降低风险,但现在还没拿出具体的办法,这一点确实得盯着。
整体看,Sora三天登顶是真厉害,技术上的进步也让人惊喜,不管是15秒视频还是那些细节还原,都能看出AI视频的潜力。
但真假难辨这个问题,要是解决不好,再好的技术也可能被用歪。
希望OpenAI能快点拿出靠谱的办法,别让狂欢变成麻烦,毕竟好工具得用在正道上才有用。
页:
[1]