位置:科技大田大数据产业专题>>资讯>>市场>>内容阅读
Sora与“我”

  这两天,Sora的横空出世,让很多人陷入科技狂欢,至今热度依然不减。

  “炸裂”“颠覆”“断层式领先”“降维打击”……众网友初见文生视频大模型Sora时,纷纷发出惊叹和赞扬。不少科技圈大佬也啧啧称赞,马斯克直接在社交平台感慨“gg humans”(人类输了),360公司董事长周鸿祎甚至预测,一旦AI能够接上摄像头,把所有电影和互联网上的视频都看一遍,就离AGI(通用人工智能)真的不远了,这一天可能在一两年内就会到来,而不是十年或二十年。就连春节后股市首个交易日也给出积极反馈——Sora大模型概念股多只涨停。

  Sora是谁?为何能掀起巨浪?

  如果你还不知道Sora,那它的母公司OpenAI发布的上一个AI产品,你一定听说过:人工智能ChatGPT。而Sora是OpenAI发布的一个AI文生视频大模型,它可将文字描述转化为长达60秒的高清视频。

  在此之前,其实已有一些文生视频大模型,比如Pika、Runway等,为何Sora还能在各行各业引起如此之大的震撼呢?

  工信部信息通信经济专家委员会委员刘兴亮认为Sora“震撼有三”:

  一是大大降低了视频制作门槛。“过去的文生视频模型,需要一定专业能力才能完成,而Sora把这个门槛降到了最低:一段话、一张图就能生成一段高质量视频。”刘兴亮表示,Sora把专业剥离开来,让普通人可以轻松做到文生视频,门槛之低令人震撼。

  二是生成视频是个全新世界。刘兴亮说,过去的文生视频还是对已有素材的加工整合,而Sora生成视频中的人物、事物可以是现实生活中完全没有的,过去并不存在的。“这太不可思议了”。

  三是生成视频质量堪比大片,为观众带来更丰富和多样化的视觉体验。“视频中有角色,有表演,尽管目前还有一些bug,但人物表情非常细腻,视频运镜和场景转化十分丝滑,还可以自行分镜、切换景别。”

  刘兴亮表示,此前的文生视频模型,只能生成单镜头,时间也非常短,只有3~4秒时间,且一旦输入新词语,就会生成新镜头,主角就会变换,而Sora不但将时间延长到了60秒,还能自主进行视角转换、镜头景别切换,而且保持主体一致性。“无论是视频长度、清晰度,还是镜头景别的切换,都需要在技术上达到量级的飞跃”。

  之所以能达到上面的效果,得益于Sora一个具颠覆性的特质——世界模型特质。何为世界模型特质?即对真实的物理世界进行建模,让机器能够像人一样,对世界中的各种事物、关系和事件有理解和认知。这一特性也使得其视频生成得更流畅、更合逻辑。

  据OpenAI官网介绍,“Sora能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅能理解用户在提示词中提出的要求,还能理解这些东西在现实世界中的存在方式。”也就是说,Sora能通过视频、图片等多模态数据(即多种不同类型或模式的数据,包括文本、图像、音频、视频等多种形式的信息)来理解世界。

  可以说,Sora是机器模拟现实世界的一个里程碑,AGI(通用人工智能:就像是一台万能机器人或电脑大脑,能够做人能做的几乎所有事情。跟现在我们接触到的大多数人工智能不一样,现在的人工智能做得好的事情很单一,比如自动驾驶的就很会开车,但是你让它去下棋或者做饭,就可能一窍不通。但通用人工智能就不同了,你可以把它想象成一个“超级聪明”的电脑大脑,不仅能开车,还能做饭、教书、下棋,乃至创作音乐和艺术作品,而且还能在遇到新问题时自我学习,找到解决问题的方法。打个比方,就好比一个全才的“小明”,不仅学习成绩优异,各门学科样样精通,而且还擅长体育、音乐、美术,几乎什么都会。并且,小明还能够迅速地学习和适应全新的技能或是学科。)时代或将加速到来。

  Sora将给“我”带来什么?

  Sora将给我们普通人的生活带来什么影响?

  刘兴亮认为,老百姓最直观的感受主要有四方面。

  一是进入真正全民短视频时代,短视频行业或将迎来另一个高峰。目前短视频创作者数量和直播并没有想象中那么大,因为一段制作精良的短视频,需要一定拍摄、剪辑等技能。未来,只要输入一段文字、一张照片,每个人都可以在西瓜地里吃瓜、在卢浮宫里游览、在镜头面前口吐莲花。“只要你拥有好的审美、创造力和想象力,就可以收获颇丰。”

  二是获取更多高质量视频信息的效率或将大大提高。目前,一段高质量视频的制作周期较长,从策划、拍摄到剪辑耗时耗力,未来,一旦Sora技术成熟,短视频数量很可能再次迎来爆发。毕竟,不管要做一只蚂蚁从地球潜入马里亚纳海沟,还是做出机器人在人体中探索等多么不可思议的画面,都仅仅需要一句指令而已。

  另外,或将在更大程度上促进教育资源分配不公等问题的解决。“像北京这样的大城市,为什么好的学区房那么贵,为什么三甲医院的号那么难挂,其实很重要的一个原因是,资源有限,人数众多,优质资源不可能惠及每一个人。”刘兴亮表示,随着像Sora这种人工智能技术的发展,AGI时代的到来,一系列问题或将得到缓解。AI打破了时间和空间的界限,在山区的孩子,通过视频课程、在线作业和虚拟实验,增加了教育机会均等化。孩子们还可以便捷地享受名师课堂的魅力,AI辅导系统和智能助教,甚至是名师数字人,能够提供教师难以解决的关键资源和辅导,缓和优质师资短缺问题。孩子们还可以不离家乡,通过AI技术,就可以身临其境般地在世界各地游学。“相信通过这种方式,能很大程度上缩小教育差距,解决教育资源的不公平,这是一个非常积极的影响。然而,实现这些目标也面临挑战,如基础设施投入、数据隐私保护等问题。”

  此外,刘兴亮还表达了担心——真假将越发难辨,假作真时真亦假,人们辨别信息真实性的成本将大大提高。以前,都说有图有真相,如今,有图也无真相,“耳听+眼见”都不一定为真。“10分钟骗走400万”“9秒被骗245万”……如今AI诈骗已屡见不鲜。当AI生成视频进入寻常百姓家,AI工具造成的负面影响将再度扩大。

  刘兴亮说,由于我们普通人在日常生活中通常不会逐帧分辨视频真伪,越发以假乱真的AI视频生成,足以化为欺诈者和诋毁者手里的利刃,刺向毫无防备的人。“AI内容制作,让现实和虚拟界线变得模糊,内容真实性、版权、隐私、数据安全等问题纷至沓来,除了自己要时刻多一分小心,社会也需要一系列政策、法律和伦理规范来应对,才能确保技术发展不脱轨,保护好每个人的利益。”

  Sora等AI会夺走“我”的饭碗吗?

  Sora如此之厉害,以至于让很多行业从业者感到瑟瑟发抖,对未来“饭碗”能否保住感到担忧。

  这种担心并非空穴来风。

  近些年,人工智能已在影视行业中开始应用。比如电影《流浪地球2》中已经应用了人工智能去做包括面部的增龄、减龄等方面的呈现,以及声音的处理。郭帆曾在去年透露,《流浪地球3》预计现场拍摄团队可能会从《流浪地球2》时的2000多人,减少到只剩几百人。

免责声明:本网站部 分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系管理 员,我们会予以更改或删除相关文章,保证您的权利。对使用本网站信息和服务所引起的后果,本网站不作任何承诺。

Copyright 版权所有 Copyright 2013-2014 福建省云创集成科技服务有限公司
All Rights Reserved. 运营维护:三明市明网网络信息技术有限公司 业务咨询:0598-8233595 0598-5831286 技术咨询:0598-8915168