多家企业布局具身智能数据平台 夯实产业发展底座

作者:拓荒牛 分类:默认分类 时间:2026-06-23 04:49
中关村国际人才会客厅 - 运营部

本报记者 李雯珊

6月22日,出行科技与服务上市公司广州宸祺出行科技有限公司(以下简称“如祺出行”)旗下数据业务板块正式发布具身智能数据平台。官方信息显示,该平台是一套面向第一人称视角(Ego-centric)操作视频的自动化处理流水线,覆盖数据导入、AI预处理、动作标注、多级质检到标准化格式导出全流程。

据介绍,该自动化处理流水线在接收Ego-centric视频输入后,先将原始视频进行手部检测、相机位姿估计和手部3D姿态优化三阶段AI预处理,这一过程打破了传统“数据工具链零散、标准不一”的局面,提升数据处理流程的标准化、自动化和可追溯水平,降低从原始视频到训练就绪数据之间的工程门槛,实现高质量数据开箱即用,显著优化模型训练团队的数据使用效率。

“我公司此次发布的具身智能数据平台,核心目标是降低Ego-centric数据从采集到训练的边际成本,进而突破‘最后一公里’困境。我们将持续围绕自动驾驶、具身智能、世界模型等方向拓展数据服务能力。”如祺出行相关人士向《证券日报》记者表示。

当下,具身智能产业进入规模化落地关键期,高质量多模态交互数据成为行业突破的瓶颈。近期,除如祺出行外,多家上市公集中推出标准化身智能数据平台,打通数据采集、标注、仿真训练、质检流通全链路,补齐产业底层数据基建短板。

4月下旬,德马科技集团股份有限公司联合北京麦擎智能科技有限公司正式发布Ego-centric具身智能数据采集全管线——OmniEgo,旨在突破数据采集低效、成本高、通用性差等障碍,打通具身智能规模化数据供给瓶颈。

仿真软件龙头上海索辰信息科技股份有限公司(以下简称“索辰科技”)在今年3月发布《关于部分募投项目变更并将剩余募集资金用于新项目的公告》,拟投资建设物理合成数据核心技术基座构建与多领域场景示范应用项目。

“当前工业AI高质量训练数据极度匮乏。尤其是机器人、航空航天等领域,采集成本极高、风险极大、样本极少,直接导致AI模型泛化能力差、落地难度大。我公司上述募投项目的目标就是解决客户数据采集的痛点。”索辰科技副总经理谢蓉对外表示。

与大语言模型依托海量互联网文本数据不同,人形机器人、自动驾驶、移动具身设备依赖第一视角视觉、力觉、触觉等物理交互数据,真实场景采集成本高、标注流程复杂、行业标准缺失,国内可用于模型训练的高质量数据仅百万小时量级,远不足以支撑通用具身大模型迭代需求。

公开数据显示,全球高质量真实物理交互数据总量仅约50万小时,而具身智能通用模型训练则需要千万小时起步的数据量级。国泰海通证券在近期研报中直言,“数据饥荒”已成为具身智能泛化能力突破的主要瓶颈。

“具身智能的竞争重心正从本体硬件转向可供训练用的高质量物理数据。数据平台属于产业链‘卖铲子’环节,不受下游相关行业出货周期限制,可向全行业提供标准化数据服务,商业模式稳定性更强。短期来看,物流、汽车、工业制造垂直场景数据需求率先爆发;中长期,随着家用服务机器人、特种作业设备放量,通用型具身数据平台市场规模将持续扩容。”深圳市湾众管理咨询有限公司首席经济学家邱思甥在接受《证券日报》记者采访时表示。

(编辑 孙倩)

当前用户暂时关闭评论 或尚未登录,请先 登录注册
暂无留言
版权所有:拓荒族 晋ICP备17002471号-6