AGI的曙光初现?GPT5?王炸级AI视频技术Sora技术解析和展望

GPT4充值2024-02-21 23:05:3165
和AI圈子讨论了一整天,今天SORA的发布基本上是王炸级别的。

先说结论:

  • sora是openAI技术力秀肌肉的一个环节;

  • 电影和动画行业彻底颠覆。

  • 连带的内容产业也会颠覆。

  • 视频击破了很多领域的防火墙。

欢迎关注我们的视频号:

这里面的一些基础逻辑是,之前手工业生产的视频现在进入AI工业化时代。

和去年的GPT4和图片一样,后面SORA或者同规模的AIGC能力,会好像GPT4一样赢得超强的颠覆力;同时,剥夺相当一部分人的就业机会。

首先颠覆的大概率就是电影工业的干活了。在传统的特效花费面前,哪怕SORA定价比GPT4贵上1000倍那都是小case。

而和目前的所有AI视频对手比,其实也没啥好比的。要知道,PIKA、SVD、RUNWAY三家,都最多只能在1280*720这个规格跑4-5秒;而且动作幅度不大,人物和场景的一致性也都无法长时间坚持。

上面这图,很贴切。根本都谈不上对手,SORA领先不止一个代际。

可以讲,在通往AGI之路上,openAI现在处于寂寞冲刺的状态。谷歌和META还在追赶,但它们得拿出真正追得上的证据。而这几天才隐隐约约说gemini要追上来的GPT4,其实已经发布将近1年了。

用上面这段视频来描述我们对SORA的前景评价,挺贴切。

而更值得看的,是OPENAI对SORA的技术报告。

在这段报告的开头,openAI明确表示了,视频生成模型作为世界模拟器。

目前,SORA其实还很神秘。能比较详细的了解它的,其实就是这份技术报告。

首先,是关于提示词的处理,这里借用一下agent的概念,基本上,对视频的提示词是需要拓展的,在传统的AI视频里面,我们是通过每多少帧写一段提示词的方式来实现分段提示。

但是,SORA把这个活内置在模型里面了,我们看到的提示词,都被它自己自动改写优化了,我们无需关注更多细节。

这里面,一个是数据的处理,把一段数据打包成patch;另一个是训练集的选择,传统是做法是把视频切割成256*256或者512*512然后打标,这样比较方便训练;但在SORA这个层面,openAI直接就把1920*1080级别的素材拿来训练了。

能这样干,很有点力大砖飞的意思。

其实,这种做法并不陌生,还记得GPT4传闻的MOE架构和万亿级别参数规模么?

利用超大规模的算力资源优势,再叠加算法上的经验和优势,openAI得以做一些很多人想都不敢想的超大规模训练。

加上本来就理解能力超强的GPT4,SORA很可能并不是单纯的AIGC模型。

SORA的图生视频:在一个华丽的历史大厅里,一个巨大的潮汐达到顶峰并开始崩溃。两名冲浪者抓住时机,熟练地驾驭海浪。

这个图生视频其实并不容易,因为参考图里面的两个冲浪者比例非常小,如果SORA无法识别参考图里面的冲浪者,就无法进行后续。

所以,它可能证明了sora同时具备很好的图片识别能力。

另外,在技术报告中也一笔带过提到了SORA可以模拟数字世界比如游戏。

这验证了一个猜想,也就是sora一部分的训练数据是直接通过游戏来获得的。

而基于以上图像识别能力和仿真能力的判断基础,我们对SORA的猜想是,有鉴于它的训练和提示词生成都和大模型密不可分,因此:

它很可能就是GPT5的一部分!也很可能被作为关键部分加入GPT5。

谁说大模型一定要用文本回答你?视频也可以是它的反应!

在openAI的报告最后,他们展露了愿景和野心:

我们相信,Sora今天所拥有的能力表明,视频模型的持续扩展是一条有前途的道路,可以开发物理和数字世界以及生活在其中的物体、动物和人的模拟器。

而一个完整体的模拟器是什么概念?是AI在自己的内部通过模拟的方式重建并推理,这对人类的决策又会带来什么呢?

举个例子,我们现在看到大量的汽车出厂要做碰撞实验,那么在具备AGI能力的AI里面,通过模拟仿真,是不是能大规模减少碰撞测试的成本?

又或者,这种模拟能够拓展到更多的领域?

20年前我读大学的时候,曾经机缘巧合的参与了暨南大学经济学实验室的设立,当时引入的实验经济学,就是想用实验的方式去验证经济学理论,当然,那时候无论硬件还是方法论,都还非常的具有局限性;如今,如果GPT5或者哪家实现的AGI,真的能在将来对经济决策、社会改革等领域做超大规模的仿真呢?

综合来看,sora的发布,很奥特曼。之前就传出他在谈7万亿级别的GPU,还有数千亿美刀级别的融资。sora的发布,无非就是秀一秀技术肌肉,告诉大家,我行,选我。

也正因为SORA,我们可以看到,领跑者优势加速,差距拉大这回事是真实存在的;国内的大模型也好、AIGC也好,还是得实事求是一点,不要上来就赶上GPT4;你刷的是哪几个题库,咱也是一清二楚的。

本文链接:https://www.daichong.cc/gpt4_gpt5_57.html

chatgpt设置中文人工智能chatgpt介绍chatgptplus一天能用几次chatgptplus版怎么付款chatgptplus和gpt4chatgptplus一个月多少钱充值chatgptplus方法chatgptplus更新功能chatgptplus如何退订订阅chatgptplus如何支付

相关文章

网友评论