京东在具身智能领域持续发力,继宣布建设全球最大具身数据采集中心后,于近日举办具身智能生态发布会,推出覆盖数据全生命周期的基础设施全景图,涵盖采集、存储、标注、训练、评估、仿真、测试等环节,并发布自研超高清采集终端JoyEgoCam、具身大模型JoyAI-RA及数据交易平台等核心产品,为具身智能的规模化应用奠定基础。
当前,具身智能发展面临关键瓶颈:真实场景下的高质量交互数据稀缺,硬件标准不统一导致采集流程分散,数据难以直接用于模型训练。京东集团副总裁龚义成指出,数据采集需兼顾“有用性、可定义性和规模化”,同时需解决大规模数据处理的技术挑战与成本控制问题,并确保数据对模型迭代的有效性。他强调,京东希望通过全流程闭环打通数据价值链条,将原始数据转化为驱动模型进化的“高价值燃料”。
为突破数据困境,京东计划发动60万人参与数据采集行动,包括10万京东员工及50万外部协作人员,覆盖线下零售店员、物流快递员、家政保洁等群体。目标是在两年内积累1000万小时人类真实场景视频数据,并通过采集设备与报酬机制保障数据质量。京东透露,除头部设备采集外,未来将扩展至手部、肢体及动态轨迹的全维度数据采集。
此次发布的可穿戴式超高清采集终端JoyEgoCam成为焦点。该设备配备4K高清摄像头,支持60帧帧率与130度超广角拍摄,可精准捕捉毫秒级动作细节,重投影误差小于0.2像素。整机仅重220克,内置车规级6轴IMU与多传感器融合单元,实现“即戴即采”,使非专业人员也能完成高质量数据采集。京东表示,这一设计大幅降低了数据采集门槛,为大规模真实场景数据获取提供了技术支撑。
在数据处理环节,京东构建了高效闭环流程:采集数据上传至AI数据湖平台后,通过PB级吞吐能力自动完成清洗、对齐、转换与预标注,转化为标准训练集;JoyBuilder仿真平台批量生成高逼真仿真数据,实现人类操作数据向仿真与真机操作数据的增值转换;治理后的数据汇聚至模型开发平台,通过自研AI算子矩阵完成去畸变、语义描述等环节。目前,京东日处理数据量达数十万条,数据有效率达95%,整体处理成本降低60%。
模型与数据的双向优化成效显著。以自采数据训练的京东具身大模型JoyAI-RA在真机实验中成功率达73.5%,验证了高质量数据对模型迭代的推动作用。同步上线的京东具身智能数据交易平台则聚焦生态协同,汇聚多模态数据资源,支持数据方、开发者与应用方多方协作,首批定向开放2000小时高精标注数据集,技术社区即将上线,进一步激活数据要素市场活力。
















