当地时间2月15日,OpenAI 在其官网发布文生视频模型 Sora。根据官网的演示,用户在 Sora 上输入一段文字指令,瞬间可以生成一段60秒、有电影质感的视频。
OpenAI 在其官网上展示了由 Sora 生成的48个视频,这些视频对人物、动物或是其他物品的特写纤毫毕现,背景丰富、细节生动、运镜流畅,从一些画面中能感受到丰富的情感。
01、文生视频的GPT-3时刻!Sora技术报告揭秘6大核心优势
据外媒报道,Sora的推出标志着AI研究的一个重要里程碑。凭借其模拟和理解现实世界的能力,Sora为未来实现通用人工智能(AGI)奠定了基础。从本质上讲,Sora不仅仅是生成视频,而是在突破AI所能完成的极限。
OpenAI CEO阿尔特曼在X平台上透露,Sora目前已向红队成员(red teamers,指的是误导信息、仇恨内容和偏见内容等方面的专家)和部分创意人士开放。
英伟达人工智能研究院首席研究科学家Jim Fan则在X平台发文表示,“如果你还是把Sora看成DALLE那样的生成式玩具,还是好好想想吧,这是一个数据驱动的物理引擎。他是对许多世界的模拟,无论是真实的还是幻想的。”他认为,Sora是一个可学习的模拟器,或“世界模型”。
在他看来,Sora代表了文本生成视频的GPT-3 时刻。而针对部分称“Sora并没有学习物理,仅仅是在二维空间里对像素进行操作”的声音,他表示,Sora所展现的软物理仿真实际上是一种随着规模扩大而出现的特性。Sora 必须学习一些隐式的文本到 3D、3D 变换、光线追踪渲染和物理规则,才有可能精确地模拟视频像素。它必须理解游戏引擎的概念,才有可能生成视频。
免责声明:本网站部 分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系管理
员,我们会予以更改或删除相关文章,保证您的权利。对使用本网站信息和服务所引起的后果,本网站不作任何承诺。