OpenAI揭秘：Sora是如何生成视频的？

时间:2024-02-20 作者: 来源:数据观

　　当地时间2月15日，OpenAI 在其官网发布文生视频模型 Sora。根据官网的演示，用户在 Sora 上输入一段文字指令，瞬间可以生成一段60秒、有电影质感的视频。

　　OpenAI 在其官网上展示了由 Sora 生成的48个视频，这些视频对人物、动物或是其他物品的特写纤毫毕现，背景丰富、细节生动、运镜流畅，从一些画面中能感受到丰富的情感。

01、文生视频的GPT-3时刻！Sora技术报告揭秘6大核心优势

　　据外媒报道，Sora的推出标志着AI研究的一个重要里程碑。凭借其模拟和理解现实世界的能力，Sora为未来实现通用人工智能（AGI）奠定了基础。从本质上讲，Sora不仅仅是生成视频，而是在突破AI所能完成的极限。

　　OpenAI CEO阿尔特曼在X平台上透露，Sora目前已向红队成员（red teamers，指的是误导信息、仇恨内容和偏见内容等方面的专家）和部分创意人士开放。

　　英伟达人工智能研究院首席研究科学家Jim Fan则在X平台发文表示，“如果你还是把Sora看成DALLE那样的生成式玩具，还是好好想想吧，这是一个数据驱动的物理引擎。他是对许多世界的模拟，无论是真实的还是幻想的。”他认为，Sora是一个可学习的模拟器，或“世界模型”。

　　在他看来，Sora代表了文本生成视频的GPT-3 时刻。而针对部分称“Sora并没有学习物理，仅仅是在二维空间里对像素进行操作”的声音，他表示，Sora所展现的软物理仿真实际上是一种随着规模扩大而出现的特性。Sora 必须学习一些隐式的文本到 3D、3D 变换、光线追踪渲染和物理规则，才有可能精确地模拟视频像素。它必须理解游戏引擎的概念，才有可能生成视频。

免责声明：本网站部分文章和信息来源于互联网，本网转载出于传递更多信息和学习之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请立即联系管理员，我们会予以更改或删除相关文章，保证您的权利。对使用本网站信息和服务所引起的后果，本网站不作任何承诺。