杭州影身智能技术有限公司,一家专注于具身智能技术的新锐企业,近期在资本市场取得了显著进展,连续完成了种子轮与种子+轮的融资,总额达数千万元。这两轮融资分别由卓源亚洲投资和卓源亚洲联合杭州西湖科创投共同完成,资金将主要用于推动机器人“右脑”技术的研发、商业化应用以及团队建设。
影身智能成立于2024年,致力于具身智能技术的深度研发与应用。该公司凭借其自主研发的空间大模型与工业场景机器人,为企业提供了一套低成本、高可靠性且模块化的软硬件协同解决方案。该方案旨在从轻工业柔性工序入手,逐步拓展至服务业及多种C端应用场景。
影身智能的创始人兼CEO闵伟,曾在阿里巴巴机器人团队担任技术负责人,从零开始打造了阿里本地生活配送机器人,并在楼宇、医院、酒店等多个场景成功落地运营。公司的核心团队汇聚了多位来自清华大学的精英,他们在人工智能与机器人领域拥有深厚的技术积累与丰富的产品应用经验。
在具身智能技术的发展中,进阶与泛化对于技术落地至关重要。进阶意味着智能体需在复杂物理环境中展现出更高级的行为,从简单动作执行到复杂任务的协同处理,增强环境感知、决策规划与执行能力。例如,在工业生产中,机器人不仅要精准完成重复性组装,还需根据零部件差异或生产流程调整做出适应性改变。泛化则是指机器人能将特定场景学到的技能应用于新场景,如家庭清洁机器人在不同环境中均能高效工作。
然而,要实现机器人在复杂环境中的可靠表现,需对物理世界有深入、全面且精准的理解,物理世界大模型在此过程中发挥着关键作用。通过整合海量多模态数据,特别是视觉信息,模型能捕捉真实环境下的内在规律与复杂特征,模拟运动、相互作用及环境变化,帮助机器人学习物理世界规律,快速推理决策并预测动作结果。
影身智能自主研发的时空智能大模型,通过Real to Real技术构建四维真实世界大模型,利用大规模无标签数据预训练,具备了理解与映射物理世界的基础能力。为了克服语言模型在机器人领域的局限性,影身智能在时空智能大模型中直接对视频数据建模,将视频语言化,从视频数据中提取最真实的信息来理解物理世界,最大限度减少人为干预,提高模型的精确性与效率。
在数据端,影身智能利用国内海量视频数据,将数据训练成本控制在极低水平。公司在多种工作场景中合理布置摄像头,从不同角度捕捉工人工作画面,充分利用这些视频数据进行机器人的三维空间建模、动作捕捉和动作生成模型训练。这种训练方式无需购置额外复杂设备,简化了训练流程,同时避免了对工厂正常生产秩序的干扰。
时空智能大模型生成的数据包括通过动捕技术捕捉的工人关节位置与姿态,以及模拟工人视角的视频数据。这些数据用于训练端上的小模型,再部署到统一的硬件本体上,应用于具体场景的作业机器人中。目前,影身智能已发布了“影身”系列工业机器人,能在不同工况下持续稳定操作,并具备泛化性。
闵伟表示,得益于在阿里巴巴的工作经验,影身智能正与多个行业客户进行合作需求沟通,并已获得千万级产业订单。公司首先将聚焦于工厂等场景,持续拓展至快递、酒店等行业,预计2025年将累计交付上百台机器人。影身智能今年将着力开发机器人大脑,提升机器人理解外部世界并执行任务的能力,以加速L4级别具身智能在日常生产和生活中的普及。
投资方卓源亚洲的创始合伙人及董事长林海卓对影身智能团队给予了高度评价。他表示,这是一支源自阿里和清华的产学研结合团队,既能从底层技术入手,让机器人通过视频语言化理解物理世界,又能稳步推进机器人在工业场景的落地应用。卓源亚洲坚定看好影身智能开辟技术领域新赛道,推动具身智能技术的普惠化落地。