Aibee爱笔智能林元庆博士:空间智能2.0,物理世界AI大模型是通向 AGI的必由之路

关注
空间智能2.0是建立物理世界AI大模型,是具身智能的核心智能模块。具身智能的其中一个重要应用是物理 AI 分身(Physical AI Agent)。

8月22日,2024AGI商业趋势大会在深圳成功举办。活动由创业邦主办,南山区科技创新局、西丽湖国际科教城融合创新中心、深圳市“模力营”AI生态社区为支持单位,揽胜运动为大会制定用车,搜狐为战略合作媒体。

本届大会以“AI塑造未来市场”为主题,邀请人工智能领域的行业专家、上市公司、独角兽企业、创新企业、投资机构代表,分享研讨最新的技术、创投、治理热点话题,并围绕产品商业化、人工智能+行业解决方案进行深度交流,共同探寻更广泛的产业合作与创新机遇。围绕空间智能的发展,Aibee爱笔智能创始人&CEO林元庆博士进行了题为《空间智能2.0:物理世界AI大模型是通向AGI的必由之路》的演讲,其中精彩观点如下:

Aibee在空间智能1.0技术深度和落地广度都做到了市场领先,为进入空间2.0做了充分的准备,特别是数据上的准备。

智能空间1.0阶段积累起来的海量的 Environmental Camera View 的数据,有助于解决 Egocentric View 数据缺乏的困境,可以给物理世界AI大模型提供一个热启动的机会。

具身智能将是空间智能2.0的最主要应用。物理 AI 分身(Physical AI Agent),即通常所说的 AI 数字分身加上理解物理世界并与其互动的能力,这将是 AI 赋能人类的高级状态。

以下为现场演讲内容,由创业邦整理后发布。

林元庆 1.jpg

空间智能1.0:

从技术深度到落地广度,Aibee 爱笔智能做到了市场 No.1

创立至今近7年时间,Aibee 的核心技术一直围绕着实现线下空间的数字化&智能化。在这一阶段,即空间智能1.0,Aibee 展现了其在预定义物体(如人、车、飞机等)在超大空间(几十万平方米)超长时间(长达10小时级别)的「3D 连续定位追踪技术」上的卓越成就。值得一提的是,Aibee 的「3D 时空轨迹追踪技术」不收集任何生物特征识别信息包括人脸信息,并且已经通过了目前全球公认的关于个人数据与隐私保护最严格的欧盟 GDPR 合规评估(General Data Protection Regulation,通用数据保护条例)。

大空间的3D重建(以购物中心为例)

Aibee 不仅在技术精度上达到国际领先水平,还在成本优化方面不断追求极致,为空间智能1.0技术的平民化推广奠定了重要基础。以一座10万平米购物中心的 3D 重建为例,原本需要300万~500万元的高昂成本,Aibee 的技术革新将成本做到了10万元以下。而在人的数字化方面(依然以一座10万平米购物中心为例),完成一天数据的计算,在创业第一年 Aibee 需要150台8卡 GPU 服务器,到第二年就下降到仅需1台,并最终实现了对 GPU 服务器的零需求,把 GPU 有关的所有计算用摄像头端上的计算完成,极大地提高了效率,降低了成本。

林元庆图片2.pngAibee 在线下空间数字化与智能化的应用情况

加强技术深度的目的在于解决业务场景中之前解决不了的问题,使技术在赋能业务的过程中技术不再是个问题。而极致的成本压缩,使得技术落地的成本可控,推动技术平民化(AI Democracy)从而带来大规模的商业化落地。Aibee 的落地空间已经实现了从小型空间如品牌连锁店(20平米~2000平米)到中大型空间如停车场和购物中心(3~50万平米),再到超大型空间如机场和交通枢纽(10万~200万平米),最后扩展到城市级别的全覆盖。

而且,在城市级别以外的其他所有空间领域, Aibee均已确立了其在空间数字化&智能化的行业领军地位:在商业地产领域,Aibee 已与 TOP30 商业地产品牌中的26个品牌建立了合作关系,包括华润、SKP、万达、万科&印力、龙湖、K11、太古、恒隆、新鸿基、嘉里、香港置地等头部企业;在品牌连锁门店方面,Aibee 的技术已成为新能源车连锁门店的标配,超过一半的新能源车品牌已经采用了 Aibee 的智慧门店技术解决方案;在机场和交通枢纽领域,全国民用运输机场吞吐量 TOP22 中的19家已经与 Aibee 达成合作,共同推动智慧机场的建设;在智慧景区领域,全国1400家4A/5A景区中,有430家采用了 Aibee 的景区智慧入园系统,为游客提供了更加便捷和智能的入园体验。

在谈到公司的发展和业绩时,林元庆非常有信心:“我们非常专心的把核心技术做好,公司也到了一个非常好的增长阶段,2023年实现了30%的增长,今年上半年更是增长了66%,在这样快速的增长趋势下,Aibee 有望在今年实现年度盈亏平衡。”

空间智能2.0:

物理世界 AI 大模型是通向 AGI 的必由之路

林元庆在会上指出,空间智能发展已经进入2.0阶段,其核心在于「像素级的 3D 语意理解」,目的是建立「物理世界 AI 大模型」。这一阶段的 AI 技术不仅能够识别和定位物体,还能够理解物体所处的 3D 环境(像素级的),并具有类似人眼的语意理解能力。比如,一个人要过马路,但路上有一辆疾驶而来的车,对这个人行为状态的精准理解和预测是其大概率不会马上横穿马路。林元庆强调,对于物理世界中类似这样的千千万万的状态的理解,构成了物理世界运行的规律。这些规律需要从海量的视频数据中自学习出来,而非依赖人工标注数据的监督学习。他指出,纯依赖人工标注数据的监督学习,无论数据量再大,都无法满足 AI 模型对复杂状态理解的深度需求。

林元庆表示,Aibee 在空间智能1.0的发展,为空间智能2.0的推进做了非常好的准备。“Aibee 目前视频处理量80亿帧/天,120Pops 分布式算力,并且覆盖了非常丰富的线下场景,包括室内和室外。这个数据单独看可能没有感觉,我给大家分享一下特斯拉的数据,特斯拉每天处理1600亿帧(是 Aibee 的20倍),但场景主要是以路上为主。”因此,空间智能1.0为 Aibee 进入空间智能2.0准备了海量的数据,并且随着空间智能1.0业务的快速增长,数据的量也在快速增长中。

林元庆图片3.png

Aibee 在空间智能1.0阶段积累了丰富的数据

自学习的框架是建立物理世界 AI 大模型的必要途径,而目前业界普遍认可的自学习框架是通过与物理世界的互动来学习。林元庆在会上提出,除了互动,还可以利用环境静态摄像头与预先扫描的 3D 模型相结合来实现自学习,他以形象的语言描述,这样的摄像头如同“一辈子只盯着一个角落看”,而我们可以通过研发算法,使其具备强大的自学习能力。尽管这样的 Environmental Camera View (环境相机视觉)与通常的 Egocentric View (第一人称视觉)存在一定区别,但它们在底层物理世界 AI 大模型的能力上是一致的,包括检测、跟踪、分割、识别、事件理解、世界运行规律等。林元庆还提到,在智能空间1.0阶段积累起来的海量的 Environmental Camera View 的数据,有助于解决 Egocentric View 数据缺乏的困境,至少,可以给物理世界 AI 大模型提供一个热启动的机会,而无需经历冷启动所需的时间和失败风险。

具身智能将是空间智能2.0的最主要应用,林元庆认为“物理 AI 分身(Physical AI Agent),即通常所说的 AI 数字分身加上理解物理世界并与其互动的能力,这将是 AI 赋能人类的高级状态。”

图片

9月19-20日,更多的创业者将登上2024 DEMO CHINA的舞台,在AI纪元绽放自己的创新力量。

让我们相约·成都,一起见证更多超能勇士的崛起。

图片

反馈
联系我们
推荐订阅