7月27日,在2025世界人工智能大会(WAIC)大模型论坛上,商汤科技推出“悟能”具身智能平台:以商汤具身世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能为机器人、智能设备提供感知、视觉导航及多模态交互能力;同时,该平台支持嵌入到端侧芯片和机器人等终端硬件。 商汤“悟能”具身智能平台的核心引擎是具身世界模型,这是一套复杂动态系统:非简单静态复制物理世界,而是通过持续学习和整合海量数据,构建一个能实时反映物理世界变化的数字化镜像,类似于物理世界的数字化入口。 人类通过眼耳鼻等感官获取信息,在大脑中形成对世界的理解并指导行动,而具身世界模型则通过传感器等设备收集环境数据,经过算法处理形成对世界的“认知”,进而为智能设备提供决策依据。 依靠商汤大装置提供的端侧和云侧算力支撑,“悟能”具身智能平台能为机器人及智能设备提供感知、视觉导航和多模态交互等基础能力。 比如在家庭场景,搭载“悟能”具身智能平台的机器人,有能力识别家具布局、家庭成员及温湿度等;在办公环境,也能区分办公设备和文件资料。 这种感知受光线、遮挡等环境因素影响明显,“悟能”平台的感知能力正是通过设备与环境的持续交互逐步完善;在常规环境条件下,能稳定输出环境信息。 在仓库等结构化环境中,物流机器人可借此平台完成货物转运;室内走廊场景,服务机器人能沿设定路线行进,在预设场景内可实现精准的点对点移动。 技术哲学家刘易斯?芒福德在《技术与文明》中强调,技术并非是外在于人类生活的存在,而是深度嵌入并塑造了人类生活的方方面面。 从技术体验角度看,平台支持嵌入端侧芯片,实际应用价值显著:能减少对云端算力依赖,设备在网络不稳定时仍能维持基本功能;端侧处理加快响应速度,降低数据传输延迟。 以智能家居设备为例,智能门锁嵌入平台后,本地处理人脸信息速度提升,减少数据上传云端需求,时延降低,在家庭安防场景中体验更好,功能表现更稳定。 应用场景包括家庭、办公和工业领域:家庭机器人可协助做清洁、搬运等简单家务;办公场景,智能设备辅助文件分类、会议室预约;工业环境,机器人参与零部件搬运、基础质检。 商汤科技董事长兼CEO徐立,在现场展示了搭载具身世界引擎的人形机器人讲解《长安的荔枝》PPT的效果,该机器人语言自然幽默,可自动翻页并回答各类问题,还能做阶段性小结。 在技术发展方面,“悟能”平台的感知全面性、导航适应性和交互深度,都有明确优化方向。未来,商汤将通过收集应用数据迭代具身世界模型,提升平台稳定性和适用性。 此过程中,行业合作至关重要,具身智能领域,公司合作汇聚优势能将有效推动技术进步。具身智能作为人工智能发展方向,进步依赖技术积累和场景验证。 总体而言,“悟能”具身智能平台是人工智能在具身领域的具体实践,具备一定技术特点和应用潜力,同时面临技术完善、场景适配、成本控制等现实课题。


