Sora冲击下中国汽车该何去何从?未来10年世界需要什么样的人才?

       

最近火爆全网的Sora到底是个啥?

 

一句话解释:用一段文字生成60秒视频的工具。

 

就在今年2月16日,Open AI发布了首个文生视频模型Sora,用户可以输入一段文字指令,瞬间生成长达1分钟的有电影质感的逼真视频,引爆网络。

 

        

而这距离ChatGPT问世(2022年11月30日)不过只有一年多的时间。

在OpenAI发布了Sora并展示出几段文生视频的演示短片后,马斯克当天在自己的社交媒体X上表示:人类愿赌服输。360周鸿祎表示 “ Sora意味着AGI(通用人工智能)实现将从十年缩短到两三年。”

          

一、AGI可以帮助人类干什么事儿?AGI时代还需要汽车吗?

          

类似互联网催生了电商、云计算、视频会议等,Sora的出现接下来可能创造出一个个“云人”, 在虚拟场地面对面社交、商务等。

如果把人的活动分为两类:一类偏社会性和意识层面,比如“云人社交”(姑且这么叫)比如两人见面握手的感觉可以实时传递一切和真人见面社交无异。这个具有时间唯一性,即你在A场景社交不能同时出现在B场景,但是完成了A场景的社交告别退出后可以迅速切换至B场景。肉身本身不需要舟车劳顿去往A地,实际还在家里或办公室。云社交也不需要餐饮什么的辅助,肉身可以在家里或办公室喝点茶咖啡什么的。“云人”场景可能包括但不仅限于商务、教育、集会、演讲等等。

              

 

          

    1.如果云人A和云人B社交,则真人A和真人B分别戴上类似Vision Pro的设备即可实现如面对面社交。同时,真人A和真人B的脑部数据实时更新。

    2.如果真人A和云人B交往,则真人A和真人B分别戴上类似Vision Pro的设备即可实现如面对面社交。云人A无需生成。同理,真人B和云人A亦如此。

    3.真人和云人一一对应,数据同步更新。云人具有时间唯一性,即某个时间如果出现在某个场景,则无法出现在其他场景。

          

另一类为物质性层面。人形机器人帮助人类从事大量的日常生活和工作层面的活动。比如家居类、通勤类、工作类、防务类、太空生存类(如帮助人类开拓外星生存空间)等。一个人或者一个家庭可以有N个人形机器人服务,在火星或其他星球上可能需要更多。

          

          

当然,如果以上所列的社会性和物质性合二为一 ,那人类就被取代了,即常说的硅基取代碳基。目前的技术革命称之为AI革命主要是尽最大可能模仿人脑,下一步的革命估计发生在神经科学本身,有可能突破人脑和意识也有可能无限接近却达不到。

          

既然AGI时代进行云人社交了,还有真人需要乘车吗?出行还有意义吗?

   

虽然云场景能够实现空间的平移,并且增加嗅觉、触觉等体验,然而你永远无法传递两个人真实地近在咫尺面对面交流或者争论的感觉,也无法传递大家一起大快朵颐或者挥汗如雨的感觉。正应了那句“凡所有相,皆属虚妄,一切有为法,如梦幻泡影,如露亦如电,应作如是观。”

 

AGI技术创造的场景,可以模拟在逼真的空间里端起一杯水的温度,但无法模拟为了佯装平静地端起这杯水,一路上的惴惴不安与欢欣雀跃,就像特朗普在竞选集会上那样……

          

          

二、AI汽车是什么样的?

          

AGI将代替人类操控交通工具,包括驾驶汽车。从第一部分内容里面我们看到如果AGI帮助人类进行通勤类工作,即实现了自动驾驶。要实现真正的自动驾驶,就必须强化认知层面的工作,实现对世界的理解。Sora对物理世界的模拟,将会对AI驾驶汽车带来巨大影响。马斯克称,当特斯拉有空余算力时,FSD将在年内继续利用生成视频训练。目前,已经有不少国内公司都在积极运用大模型,增强系统认知能力,开发端到端自动驾驶方案。

          

Sora实现了对现实世界的理解和对世界的模拟两层能力,能够跳出二维的范围模拟真实的物理世界。这种模拟能力,还在于能够更准确地反映出现实世界的复杂性和多样性,像人一样理解事物。人们在开车的时候,很多判断是基于对这个世界的理解,例如对方的速度怎么样,是否会发生碰撞,两车的安全距离如何,碰撞后的严重程度是怎样的等等,以此来做出行车动作。而Sora很大程度也能够做出这样的反应。

          

视频生成能力有一个很重要的点:物理效果,也就是说生成的视频都能在物理世界找到对照,能准确反映道路驾驶状况,继而用这些视频数据来调试自动驾驶系统。AI汽车可以最大限度抹平物理世界和数据世界的差异,将真实场景复制于三维模型中,构筑一个真实的测试环境。这样不仅能提高数据处理效率,也能提高测试的准确率,对于解决智能驾驶最广受诟病的安全性难题大有裨益。

          

综上可以说,Sora的底层技术,已可以实现对真实世界的准确理解,包括自然规律、物理状态、化学变化等。Sora知道这个包子被人咬了一口会有残缺,也知道波运动的物理规律,还理解云层与闪电的关系……Sora的出现,让行业看到了AI汽车的全新曙光。

          

何小鹏在春节后开工第一天发布了一封内部公开信,说是要投入共计35亿元,发展以智驾为核心的AI技术。AI将重塑各行各业,尤其对于正攻关自动驾驶的汽车行业来说,AI的重要性比其他行业有过之而无不及。

              

2024年,或成为AI汽车元年。从功能手机到智能手机花了34年,而从功能汽车到AI汽车至今已经历了138年的长途跋涉。

                   

 

          

AGI时代,交通将会是什么样的呢?

长短途也许将会分离。短途或者说市内交通将会出现单人汽车,如同阿凡提骑小毛驴一样,骑上即走。社交时人和单人汽车也许将会同时存在(相对现在各商业综合体的人车分离),社交结束坐车就走了;如果需要喝一杯(也没有查酒驾)那“小毛驴”可能就安静地找个地方等待了。地球上很有可能再现清明上河图那样的繁华景象。因为本文第一部分所说的“云人社交”,长途将急剧减少(除了货物运输)。而货物运输也是人形机器人在协调控制。当然以上都是基于碳基没有被硅基取代,也即对人的社会性和物质性采取了分离主义原则的假设背景下。

          

三、未来10年世界需要什么样的人才?

          

在AGI时代,特别是未来10年世界更需要什么样的人才?

尼古拉斯·奥尔顿曾经总结:由劳动力从快速增长的制造业转移到缓慢增长的商用服务业,实际上加快了经济整体生产率的提高速度。为了简化,想象有这么一个经济体,它只生产两种产品:制成品和软件(分别由不同的企业生产)。假设制造业企业要使用两种投入品-软件和劳动;而软件的研制则只需要投入劳动。再假设在最初的时候,一半的劳动力从事制造业,另一半则从事软件开发。进一步假设软件研制的生产率每年提高1%,而制造业劳动的生产率每年提高3%。与此同时,通过将两个阶段结合起来,软件劳动的生产率获得了双重增长,因此,尽管目前软件开发是一个生产率增长缓慢的行业,但它的产品使整体生产率每年提高4%,稳步超过制造业劳动3%的年增长率。

现在再来考虑一下,如果员工持续从制造业转移到软件开发业,直到只有1/4的劳动力在制造业工作、其余的人都从事软件研发为止,那么又会发生什么情况?这种调整的效果应该是显而易见的,这时平均增长率将从3.5%增加到3.75%。

          

          

增长率的提高幅度看起来也许并不大,但是随着时间的推移,复利效应必将导致巨大的整体经济增长。 

   

以上这个是软件及互联网时代对制造业加持带来的增长,同理当下的AGI也主要仿生人脑,那我们完全有理由相信生物工程学尤其神经科学将一样可以以复利效应的形式加持AGI及软件业

          

          

美国于2013年启动了新一轮“脑计划(BRAIN Initiative)”。2021年9月,我国科技部发布了“科技创新2030-脑科学与类脑研究”重大项目申报指南,表明神经科学在我国已上升为国家战略。

 

生物学其实是一种工程学,人类在这方面的了解还非常不足。举个简单的例子,人类的眼睛相当于5.76亿像素的摄像头。这里有趣的是大脑能耗的65%是用在了眼睛上,也就是常说“人是视觉动物”。这么看来,其实眼睛是高像素的摄像头,视网膜是成像单元,大脑是处理器,将外部的光感色彩组装成图像并进行一定的加工处理。如此看来人体其实就是一个规模巨大而且极其复杂的“超级智能设备”。但是要真正全面理解人体的秘密,恐怕还需要很长的时间。最近英伟达CEO黄仁勋也说,虽然计算机在过去几十年取得了巨大的进步,但在模仿人类大脑的智能和复杂性方面仍然存在局限。与之相比,人类的生物学系统通过神经元网络的高度复杂性和适应性,使人类能够处理各种复杂的情境。因此,他认为掌握人类生物学的本质,将是未来科技发展的关键。

 

同时生命科学与计算科学跨学科合作的空间特别大计算科学在处理大数据、复杂算法和模式识别等方面已经取得了显著的成就。这些技术不仅推动了人工智能的发展,也为科学研究提供了强大的工具。然而,生命科学的复杂性远远超出了传统计算模型的处理范畴。生物系统的动态性、复杂性以及高度的适应性,要求我们采用更为先进和灵活的计算方法。利用计算科学的工具和方法,生命科学研究有可能实现质的飞跃。例如,通过高性能计算和AGI技术,我们可以更准确地模拟生物过程、预测疾病发展和设计新药。这不仅需要计算科学家和生物学家之间的紧密合作,也需要两个领域之间知识和技术的互相借鉴和融合。

          

综上我们可以回到最初提出的问题,未来10年世界需要什么样的人才?我们知道数学不是自然科学,而是形式科学数学超越了自然,也超越了以自然为研究对象的自然科学,所以数学不是自然科学。物理学、化学、生物学这些自然科学,他们的所有概念都来自于自然宇宙,不能超越自然宇宙。另外,我们也知道数学是科学,因为数学和其他科学一样,能提供确定性,是可重复的、可验证的。例如,同一个定理,所有人都可以重复验证其证明过程,得出相同的结论。所以把数学归类于形式科学。在社会科学里面,除了历史、哲学、法学这几大学科,还有金融、经济、工商管理等,这几项研究的都是人类经济活动、社会行为、市场变化的规律,可以统一到大商学中。下图就展示了形式科学和自然科学、社会科学等其他科学的关系。    

          

          

已经在路上的AGI时代需要的人才更多会来自以下领域:1. 毫无疑问,数学仍然是一切学科之母。2. 物理、化学及AGI 相关,特别是最近发展迅猛的人工智能、计算机、软件、材料等方面。据不完全统计,光是大模型相关的人才缺口已达上百万,更遑论加上已经在路上的AGI了。3. 生物工程包括神经科学、人体机能学、数字生物学等,正如上面所讨论的生物工程特别是神经科学对于AGI行业的生产率提升加持,呼之欲出的是下一轮技术革命(即意识革命)的突破口。4. 历史、哲学、商学等社会科学方面仍然需要符合时代发展的各方面人才,如山姆·奥特曼等(虽然奥特曼的大学专业是计算机科学,但后来更多转为投资和管理等领域)。社会科学最高的境界,也是最低的底线,是唤醒人尊重生命的良知、灵魂的觉醒、思想的自由、人格的独立。

 

              

   

 

顾问服务    技术    Sora冲击下中国汽车该何去何从?未来10年世界需要什么样的人才?