NVIDIA和淡马锡都投了它Field AI打制能顺应非布局化
这家名为Field AI的公司,开辟“实地根本模子”(Field Foundation Models,FFMs),整合文本、图像、语音和激光雷达传感器数据,能够支撑机械人处置非布局化、未绘制地图的,不依赖先前的模子、GPS某人工干涉。近日,外媒报道称,Field AI正正在商谈以20亿美元的估值筹集数亿美元资金,这一估值较客岁炎天投资者对其5亿美元的估值超出跨越四倍。正在那一次融资中,包罗Khosla Ventures、淡马锡以及NVIDIA向它投资了跨越1亿美元。Field AI素质是一家软件公司,它的模子能够通过一个外部硬件单位运转,该单位可附着正在Boston Dynamics和Unitree Robotics(宇树)等公司出产的机械人上,让这些机械人具有更强大的顺应性和通用机械智能。对于下一代的AI是什么,NVIDIA的CEO黄仁勋暗示:“下一代AI需要基于物理世界,现在的大大都AI并不睬解物理定律。为了生成图像、视频、3D图形及很多物理现象,我们需要基于物理定律并理解这些定律的AI。”这个概念也取“AI教母”李飞飞不约而合。正在机械人行业中,保守机械人手艺对于一些简单的使命,例如“拿起罐子,拧紧罐子的盖子”,也需要多台机械别离编程来取罐子、放置盖子并拧紧。若是盖子、罐子或放置呈现问题,机械人可能无法完成使命。正在具身智能时代,人们用天然言语而非代码间接告诉一台机械人拧上罐子盖。它就会理解这一指令,通过察看人类、视频或其他机械人自学若何拧盖子,然后完成使命——并对用户提出的其他请求反复这一过程。Field AI打制的“实地根本模子”(Field Foundation Models,FFMs),其奇特的处所就正在“Field”(实地),这个模子能支撑机械人处置非布局化、未绘制地图的,不依赖先前的模子、GPS某人工干涉。所谓非布局化,例如矿井、天然洞窟和城市地下空间,这些都对机械人(以至人类)极具挑和性。这些非布局化,特别是建建中的另一难点正在于,环境正在不竭变化,地面上的建建材料、脚手架、叉车和沉型机械四周挪动,毫无可预测性。这对保守的,依赖静态地图的机械人来说是个大问题。Field AI的FFM模子,能够帮帮机械人正在没有事后地图的环境下完成这些使命。没有漫长的设置过程,无需人工监视,机械人还能顺应变化和新。FFM模子整合文本、图像、语音和激光雷达传感器数据,它可以或许帮帮机械人理解若何界中挪动,而不只仅是挪动到哪里。打制具身智能根本模子,次要挑和正在于若何获取脚够的实正在物理世界数据,取狂言语模子分歧,物理世界没有互联网。Field AI的做法是取它的付费客户合做,正在全球的工业和建建工地收集这些数据。Field AI只需要让机械人正在实正在中本人运转,就能解锁很多客户以至不曾考虑过的利用场景,逐步处理corner case问题。除了建制这一实正在物理世界的数据飞轮,Field AI还取NVIDIA合做,它们利用机械人进修的仿实框架NVIDIA Isaac Lab来生成合成数据,运转数千个并行实例,每个实例设置装备摆设分歧的使命方针,这有帮于进一步提拔FFM模子的泛化能力。正在这个过程中,Field AI也能够操纵Isaac Lab的强化进修功能高效锻炼稳健且顺应性强的活动策略。Field AI的模子,其焦点的劣势正在于泛用性和兼容性。它的利用场景不只限于建建、平安查抄或其他已有的从动化机械人系统所正在的范畴,还包罗测绘,石油勘察,工业制制,采矿,农业等更丰硕的场景。并且它几乎可以或许顺应任何机械人硬件形态,例如四脚机械人、人形机械人、从动驾驶出租车、飞翔汽车等。Field AI的模子能够通过一个外部硬件单位运转,该单位可附着正在Boston Dynamics和Unitree Robotics(宇树)等公司出产的机械人上,让这些机械人具有更强大的顺应性和通用机械智能。Field AI的创始人Ali Agha暗示,通过节制完整的软件仓库,将挪动性取高级规划、决策和使命施行相连系,操纵相对廉价的机械人将是Field AI贸易成功的环节差别所正在。目前,Field AI曾经获得了各个行业的贸易客户,它的贸易模式就是出售其专业AI模子的拜候权限,很雷同OpenAI售卖根本模子,曾经实现数百万美元的收入。无论是中国仍是美国,具身智能取生成式AI一样成为最热的创业和投资赛道。仅从2024年起头看,就有Physical Intelligence获得了杰夫·贝索斯、Lux Capital和Thrive Capital领投的4亿美元融资,估值20亿美元;Figure AI正在2025年2月启动C轮融资,打算募集10亿至20亿美元,使它的估值从A轮的15亿美元提拔到40亿美元。能够看到,获得巨额融资的公司次要集中正在具身智能根本模子范畴,也就是机械人的大脑。虽然正在机械人范畴,小脑,工致手等也都很主要,但大脑才是环节,才能泛化,和狂言语模子一样,具身智能根本模子的智能也来自于数据,但正如前文所述,具身智能根本模子次要挑和是,很难像狂言语模子一样获得互联网规模的数据。目前正在具身智能行业有两种支流体例来处理这类问题,一种是让必然数量的机械人正在现实世界中以成本效益高的体例收集数据,构成一个飞轮效应;另一种是仿实的体例来合成数据。对于中国的创业者,正在数据问题该当相对具有劣势,中国具有复杂的市场,机械人也曾经进入了上百个细分行业,特别是工业范畴和办事范畴;如许一方面表白机械人正在细分场景的高渗入率,另一方面会发生丰硕的现实数据。和AI的逻辑一样,具身智能的环节正在使用。当有了高质量的通用“大脑”和“小脑”后,连系中国的机械人供应链劣势,创业者能够相对低成本,低摩擦地正在各个细分范畴找到机械人的最佳形态和最佳使用体例。阿尔法曾经正在具身智能的数据和使用范畴有所结构,我们也但愿发觉更多具身智能范畴的不凡创业者,但愿帮帮下一个世界级的机械人公司成长强大。 |