Kaiyun(凯云)中国·官方网站

行业动态
NEWS
行业动态
NEWS
联系我们
Contact us

联系人: 张生

手机: 13845690023

电话: 0512-50135789

邮箱: 520233699@qq.com

地址: 江苏省苏州市姑苏区白洋湾街道朱家湾街8号2幢B座406区01室

行业资讯

物理智能推出通用AI模型Pi-Zero开启机器人智能新时代

作者:小编 点击: 发布时间:2026-01-19 10:45:31

  

物理智能推出通用AI模型Pi-Zero开启机器人智能新时代(图1)

  近日,物理智能(Physical Intelligence)正式发布了其全新的机器人通用AI基础模型——Pi-Zero(π0),为机器人技术的发展注入了新的动力。Pi-Zero基于先进的视觉语言模型(VLM),在五项机器人任务的评估中表现出色,超越了当前的多项基线模型,标志着机器人智能向更高水平的飞跃。

  Pi-Zero的研发采用了PaliGemma VLM作为基础,并通过自定义数据集与OpenX-Embodiment数据集进行进一步训练。此举使得Pi-Zero能够理解自然语言命令,并以较高水平的熟练程度来执行相应的任务。这种模型的强大之处在于它能够处理复杂的机器人操作,例如折叠衣物和整理桌子等日常任务,展现了其在机器人领域的广泛应用潜力。

  在与OpenVLA和Octo这两个基线模型的比较中,Pi-Zero显示了显著的性能提升。研发团队的实验结果显示,Pi-Zero在五项不同的任务上的表现均优于其他模型,尤其是在执行细致的物品整理任务时,其准确度和效率均得到了极大的增强。这一成果不仅反映了算法的优化,也为未来的自主机器人技术奠定了基础。

  根据物理智能的说法,当前的机器人研究方向将重点关注长期推理、自主自我改进、稳健性及安全性等领域。这些方向预计将在明年取得重大突破,更加丰富了机器人智能的应用场景。Pi-Zero的成功推出,也为我们描绘了一个更为光明的未来:通用的策略融入了互联网规模的预训练语义理解,同时整合了多种不同任务与机器人平台的数据,使得机器人能够在更多实际场景中灵活应对。

  在架构设计上,Pi-Zero受到了Meta与Waymo共同开发的Transfusion模型的启发,特别是在处理离散与连续数据方面的能力得到了有效提升。其独特的“动作专家”模块专门为机器人提供高效的动作输入/输出处理,使得输入可以包括视觉图像、机器人关节角度及语言指令,而输出则为一系列机器人动作标记。在某些复杂的任务中,Pi-Zero能够将高级语言命令分解为更简单的操作步骤,大幅提升任务的执行质量。

  物理智能的联合创始人Karol Hausman在社交平台上回答了多项关于Pi-Zero的问题。他强调,团队展示的视频并非脚本或遥控,而是Kaiyun真实操作的记录。此外,他还阐述了选择折叠衣物作为评估任务的理由,认为这是一个易于理解且适用广泛的典型任务,能够有效生成多样化的数据。

  技术专家Andrew Ng的团队将Pi-Zero与早期领域的GPT-1进行比较,说明大型机器人基础模型的新时代即将来临。目前,不仅物理智能,一些大型企业如NVIDIA和Google等也在积极研发各类多模态基础模型,例如NVIDIA的GR00T、Google的PaLM-E以及Google DeepMind的Robotics Transformer 2(RT-2)。这些模型在视频、文本及真实机器人演示等方面的训练,将推动机器人智能的进一步发展。

  总的来看,Pi-Zero的推出不仅为机器人行业带来了新的技术变革,也为用户提供了更多灵活、高效的机器操作选择。在商业、服务以及家庭等多个领域,这种智能模型的运用将提升整体的生活质量与工作效率。未来,随着更多研究的深入和技术的完善,我们期待机器人在各行各业中大显身手,开创更加智能化的未来。

  解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → →


相关标签:
热门产品