- 安波福亮相CES2026赋能从汽车到机器人领域的智能边缘应用
- 12亿台机器连上AI:不是噱头是下一个十年的财富风口
- 你的机器人还不会呼吸?帝国理工首提“物理AI”概念为机器人注入“物理智能”!
- 黄仁勋力捧的“物理AI”高盛梳理了上市公司
联系人: 张生
手机: 13845690023
电话: 0512-50135789
邮箱: 520233699@qq.com
地址: 江苏省苏州市姑苏区白洋湾街道朱家湾街8号2幢B座406区01室
物理智能推出通用AI模型Pi-Zero开启机器人智能新时代

近日,物理智能(Physical Intelligence)正式发布了其全新的机器人通用AI基础模型——Pi-Zero(π0),为机器人技术的发展注入了新的动力。Pi-Zero基于先进的视觉语言模型(VLM),在五项机器人任务的评估中表现出色,超越了当前的多项基线模型,标志着机器人智能向更高水平的飞跃。
Pi-Zero的研发采用了PaliGemma VLM作为基础,并通过自定义数据集与OpenX-Embodiment数据集进行进一步训练。此举使得Pi-Zero能够理解自然语言命令,并以较高水平的熟练程度来执行相应的任务。这种模型的强大之处在于它能够处理复杂的机器人操作,例如折叠衣物和整理桌子等日常任务,展现了其在机器人领域的广泛应用潜力。
在与OpenVLA和Octo这两个基线模型的比较中,Pi-Zero显示了显著的性能提升。研发团队的实验结果显示,Pi-Zero在五项不同的任务上的表现均优于其他模型,尤其是在执行细致的物品整理任务时,其准确度和效率均得到了极大的增强。这一成果不仅反映了算法的优化,也为未来的自主机器人技术奠定了基础。
根据物理智能的说法,当前的机器人研究方向将重点关注长期推理、自主自我改进、稳健性及安全性等领域。这些方向预计将在明年取得重大突破,更加丰富了机器人智能的应用场景。Pi-Zero的成功推出,也为我们描绘了一个更为光明的未来:通用的策略融入了互联网规模的预训练语义理解,同时整合了多种不同任务与机器人平台的数据,使得机器人能够在更多实际场景中灵活应对。
在架构设计上,Pi-Zero受到了Meta与Waymo共同开发的Transfusion模型的启发,特别是在处理离散与连续数据方面的能力得到了有效提升。其独特的“动作专家”模块专门为机器人提供高效的动作输入/输出处理,使得输入可以包括视觉图像、机器人关节角度及语言指令,而输出则为一系列机器人动作标记。在某些复杂的任务中,Pi-Zero能够将高级语言命令分解为更简单的操作步骤,大幅提升任务的执行质量。
物理智能的联合创始人Karol Hausman在社交平台上回答了多项关于Pi-Zero的问题。他强调,团队展示的视频并非脚本或遥控,而是Kaiyun真实操作的记录。此外,他还阐述了选择折叠衣物作为评估任务的理由,认为这是一个易于理解且适用广泛的典型任务,能够有效生成多样化的数据。
技术专家Andrew Ng的团队将Pi-Zero与早期领域的GPT-1进行比较,说明大型机器人基础模型的新时代即将来临。目前,不仅物理智能,一些大型企业如NVIDIA和Google等也在积极研发各类多模态基础模型,例如NVIDIA的GR00T、Google的PaLM-E以及Google DeepMind的Robotics Transformer 2(RT-2)。这些模型在视频、文本及真实机器人演示等方面的训练,将推动机器人智能的进一步发展。
总的来看,Pi-Zero的推出不仅为机器人行业带来了新的技术变革,也为用户提供了更多灵活、高效的机器操作选择。在商业、服务以及家庭等多个领域,这种智能模型的运用将提升整体的生活质量与工作效率。未来,随着更多研究的深入和技术的完善,我们期待机器人在各行各业中大显身手,开创更加智能化的未来。
解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → →

