为何大家普遍认为Sora是首个视频生成大模型?国产模型早已上线,SD模型又何以被视为全球先锋?

共计 1934 个字符,预计需要花费 5 分钟才能阅读完成。

震撼人心的消息,NB,

尽管央视并非科研机构,然而它与众多顶尖 AI 专家的合作让人瞩目,这一观点或许源于专业人士的洞见。

我认为 Sora 的潜力远不止于此,甚至可以称之为矩阵原型,它为我们提供了一个世界模型,而视频仅仅是这个模型的表象。


即便 Altman 的举动似乎只是为了回应黄教主推出的 RTX 本地 GPT 的挑战,

并不打算立即让大众使用,

但这依然令人震惊。


国外学术界的部分专家已经察觉到 Sora 的巨大潜力,

取代短视频制作者和部分电影行业工作者只是表面现象,

更深层的真相是,Sora 确实在理解地球物理世界的规律,并且取得了显著的进展。

这与短视频制作和图像插帧并不是同等的成就。


我原本在准备课程,主要涉及计算机图形学和游戏方向,去年讲得相当不错。

第 8 节课 - 计算机图形学游戏方向 - 谭剑 -2023 年春季 20230316_单机游戏热门视频

但在看完 Sora 的表现后,我甚至有些不想再讲了,

二维图像原理、透视、碰撞、骨骼、光追等图形学基础技术和公式模型,

实际上都是为了生成符合物理世界或人类感知规律的图像。

在光线追踪的层面上,计算机图形学的物理计算本质与真实世界的视觉原理几乎相同(实际上与数值仿真、材料设计、风洞和水洞模拟原理也类似)。


然而,真正懂编程的人都知道,

实现光追涉及了许多技巧,需要根据不同环境和需求来简化、合并和近似光线,

没有任何一款游戏或图形软件能够追踪与真实事件相同数量的光子。

而这些技巧或许就是我在计算机图形学领域的最高成就了。


但是,Sora 的做法却完全打破常规,它采取了突袭的方式。

它不依赖物理公式的计算,也不畏惧高密度计算,

我甚至了解到它的底层系统大多是基于概率模型的蒙特卡洛网络,但由于其维度极高,抽象机制复杂,我难以理解或描述它如何解析粒子系统、物体碰撞、透视等问题,

然而,

它的连续图像效果已经达到了惊人的水平,

无论是《我的世界》的渲染视频还是类似《极品飞车》的渲染效果,

都展现了光线追踪的顶尖品质。

更为惊人的是,它甚至无需场景构建和交互调试,

一句话便能生成连续的视频。


我之前的课程提纲不仅体现了相当高的专业水平,甚至还显得非常生动有趣。

  1. 《超级马里奥兄弟》与 2D 图形渲染 :介绍基本的 2D 图形绘制技术,包括像素、颜色和图层。
  2. 《俄罗斯方块》与图形变换 :探讨图形的平移、旋转和缩放等基本变换。
  3. 《雷曼》系列与 2D 动画技术 :学习 2D 关键帧动画和精灵动画的制作。
  4. 《我的世界》与 3D 建模基础 :介绍三维坐标系、基本几何形状和建模技巧。
  5. 《塞尔达传说》系列与 3D 世界导航 :探索三维世界中的摄像机控制和视角变换。
  6. 《辐射》系列与纹理映射 :学习纹理映射技术,如 UV 映射和纹理过滤。
  7. 《半条命 2》与光照模型 :介绍光照的基本原理,包括环境光、漫反射和镜面反射。
  8. 《地铁》系列与高级光照技术 :探讨全局光照、阴影映射和 HDR 渲染。
  9. 《荒野大镖客 2》与实时渲染技术 :学习游戏引擎中的实时渲染技术,如着色器编程和后处理效果。
  10. 《最后的生还者》与 3D 动画技术 :探索骨骼动画、蒙皮和动作捕捉的应用。
  11. 《刺客信条》系列与物理模拟 :介绍刚体动力学、布料模拟和碰撞检测等物理模拟技术。
  12. 《古墓丽影》系列与场景管理 :学习如何组织和管理复杂的三维场景,包括场景图和遮挡剔除。
  13. 《战地》系列与粒子系统 :探讨粒子系统的原理和应用,如烟雾、火焰和爆炸效果。
  14. 《光环》系列与后处理效果 :介绍后处理技术,如景深、运动模糊和色彩校正。
  15. 《生化奇兵》系列与水面模拟 :学习水面的渲染技术,包括反射、折射和波纹效果。
  16. 《星际争霸》系列与实时策略游戏图形 :探讨实时策略游戏中的图形渲染需求和技术。
  17. 《模拟城市》系列与城市建模 :学习如何创建和渲染复杂的城市景观和建筑。
  18. 《孤岛惊魂》系列与自然环境渲染 :探讨如何模拟和渲染自然环境,包括植被、土壤和环境效果。

然而,看到 Sora 的表现后,我不禁感慨……

计算机图形学,毁灭吧

游戏引擎,毁灭吧

游戏相关岗位,毁灭吧,包括地编、特效、动作、动物、测试等。


学术界的震动更为剧烈,

SIGGRAPH 一直在发表 AI 渲染方面的论文,通常 AI 小模型被用于替代基于概率或特定环境的光线积分方法,

但在 Sora 面前,

一切都显得毫无意义,

问题在于,尽管我们对 Sora 的原理大致了解,

但却无法进行操作,

缺乏设备、数据、办公环境、电力和衡量标准……

真的是量级差异巨大,

就像邹市明面对泰森的感觉。

来源:知乎
原文标题: 为什么普遍认为 Sora 是首个视频生成大模型?很多国产模型明明上线更早啊?SD 模型不是全球最早的吗?– 知乎
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-07发表,共计1934字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!