- 机器人“大展拳脚”背后:建行全方位赋能具身智能产业发展
- 他山科技联手图灵奖得主、强化学习之父萨顿为具身智能开创“启蒙时代”
- 以边缘智能驱动万物智联网宿科技获评AIoT“创新小巨人”
- SiFive发布新一代高性能RISC-V内核P570Gen3专为AI与边缘计算优化设计
联系人: 张生
手机: 13845690023
电话: 0512-50135789
邮箱: 520233699@qq.com
地址: 江苏省苏州市姑苏区白洋湾街道朱家湾街8号2幢B座406区01室
他山科技联手图灵奖得主、强化学习之父萨顿为具身智能开创“启蒙时代”

将在触觉感知的关键底座之上,结合强化学习的前沿技术路径,共同加速机器人在持续学习等训练范式的突破,并围绕具身智能生态建设、人才培养等方面展开长远合作。
作为2024年图灵奖的获得者,萨顿教授和他的导师安德鲁·巴托(Andrew Barto)被公认是强化学习的奠基人。这对师徒在20世纪80年代就提出并系统构建了强化学习的核心思想、数学基础与关键算法,推动人Kaiyun科技有限公司工智能研究从感知走向决策。
强化学习理论区别于大语言模型(LLM)的路径,当前大语言模型的发展主要关注语言模仿与安全对齐,但强化学习理论认为,AGI的核心在于“目标”,这一目标不应被限定为“更好地模仿人类”,而应着眼于主体通过与环境互动积累经验,进而习得关于世界的通用知识。
这与他山科技的核心理念不谋而合。作为机器人触觉感知领域的全球领军企业,他山科技凭借自研技术,已经形成了在AI触觉感知领域软硬一体的解决方案,多年来他山科技实现了高速成长。如今,他山不仅能提供基础触觉硬件,更为全球80%的机器人企业提供完整的多模态交互解决方案。
他山科技CEO马扬表示,他山科技不只是一家触觉感知企业,真正的目标是希望能赋能具身智能行业,让机器人真正会工作、会干活。
2025年,萨顿教授团队到访他山Kaiyun科技有限公司科技,双方进行了深度交流。马扬在签约仪式现场回忆,“萨顿教授让我们更深刻地认识到:智能体与智能体之间的交互、智能体与人类之间的交互,才是智能体构建自身经验与奖赏体系的核心——是机器人突破边界、超越人类的必由之路。”
建设“机器人幼儿园”的构想在交流中萌芽,双方基于共同的理念,快速推进合作项目,向一致的目标迈进:为具身智能探索出一个行业通用的训练范式。
被誉为“强化学习之父”的萨顿教授,不仅是该领域的学术开创者,更以深厚的学术影响力培育了大批AI领域的核心人才。谷歌收购DeepMind时,其团队中几位核心成员都是萨顿的学生。2017年至2023年间,萨顿教授曾担任DeepMind杰出研究科学家,持续推动强化学习从学术理论走向应用,为人工智能的发展带来了全新思路。
强化学习的核心,就是确保人工智能“从经验中学习”,或者理解反馈并从错误中学习。
RLHF使用以人为中心的强化学习实现了前所未有的行为广度,但它也对智能体的性能施加了新的上限:智能体无法超越现有的人类知识。未来AI范式的转折,是从“人类数据时代”跨入“经验时代”,通过智能体与其环境互动产生数据,让智能体不断从自身经验和“奖励”中学习。
具身智能的目标,是通过将智能算法与物理实体深度融合,实现机器对真实世界的主动感知、自主决策与灵巧操作。但当前,由于真实物理交互数据匮乏、仿真与现实存在鸿沟等问题,机器人普遍缺乏因果推理能力和泛化能力,难以迈向自主决策和应用落地。
对真实机器人而言,经验不是抽象文本,⽽是每次接触、移动、抓取、滑移、失败和修正留下的多模态记录。其中,精准的物理反馈至关重要。触觉作为机器人与物理世界交互的“最后一厘米”信息通道,直接决定了机器人能否真正理解接触、力度、材质与形变等本质属性。
可以说,触觉是智能体理解物理世界“因果关系”的关键感知通道——而这正是强化学习从“模仿”走向“真正认知”的核心突破口。
“触觉是让智能机器人感知世界、与之交互、并最终改变世界的那把钥匙。触觉不只是感知,它更是一种“奖赏”——是智能体通过持续的触觉交互,生长出自我经验的种子。”马扬总结。
他山科技自主研发的触觉感知技术与硬件,正是为机器人提供这一核心能力的基石——通过对三维力、摩擦力、材质形变、软硬程度等全维度物理信息的高保真采集与实时反馈,保障机器人在每一次抓取、碰撞、操作中都能获得精准的物理反馈,为模型训练提供真实、可信的交互数据。
此次萨顿教授与他山科技的战略携手,正是源于双方对强化学习在具身智能领域应用的期待,以及对触觉感知技术核心地位的高度认可。
萨顿教授在观看搭载他山触觉解决方案的灵巧手演示后,曾发出这样的感慨:“我原以为,这么高精度的触觉感知技术至少还要5年才能落地。”他认为,触觉感知是机器人持续学习的基础,基于触觉的持续学习会彻底改写机器人的未来。
他山科技与萨顿教授在技术理念上的一拍即合,为本次战略签约奠定了坚实基础。此次合作第一个落脚点,是一座“机器人幼儿园”。
正如人类或动物的幼年时期,必须在真实环境中不断碰撞、试错,才能积累进化的经验。机器人幼儿园的核心,是为机器人建立⼀个能够持续产生交互经验的训练环境。在这里,机器人不只是读取静态数据,是在环境中行动、感知后果,并根据反馈持续调整行为。
在这座“机器人幼儿园”内,将放置各类工具、食物、植物等真实世界存在的物品。机器人将在其中自由穿梭、主动探索,碰撞与跌倒在所难免,而这个过程,正是“进化”的核心。
根据不同学习阶段,“机器人幼儿园”还将划分为多个“年级”,使智能体能够有序完成从身体自我认知,到具备简单任务的初步规划能力,再到理解复杂任务并运用工具能力的迭代进化。
在多模态数据采集能力的基础上,“机器人幼儿园”将进一步补齐机器人“自主训练+持续学习”方向的能力。
这一“以世界级科学家为核心、以领军企业为依托、以产业需求为导向”的合作模式,不仅在具身智能技术攻关层面形成合力,更在产业生态培育与高端人才培养层面,埋下了一颗长期主义的种子。
当触觉感知遇上持续学习,真实场景验证规范逐步沉淀为行业可复用的基础设施,受益的将是整个具身智能产业的创新土壤,一个开放、协同、可持续的产业生态将随之生长,为整个行业搭建一条通向未来的道路。
他山科技是人工智能触觉传感芯片及应用解决方案研发商,触觉感知赛道引领者。公司已完成全球领先的数模混合AI触感芯片并结合触觉感知技术,解决了触觉多维感知信号同时解析的全球技术难题。公司在人形机器人领域主要提供触觉传感器、电子皮肤,另外在汽车、家电、消费电子等领域也有广泛应用。

