- 安波福亮相CES2026赋能从汽车到机器人领域的智能边缘应用
- 12亿台机器连上AI:不是噱头是下一个十年的财富风口
- 你的机器人还不会呼吸?帝国理工首提“物理AI”概念为机器人注入“物理智能”!
- 黄仁勋力捧的“物理AI”高盛梳理了上市公司
联系人: 张生
手机: 13845690023
电话: 0512-50135789
邮箱: 520233699@qq.com
地址: 江苏省苏州市姑苏区白洋湾街道朱家湾街8号2幢B座406区01室
DeepMind新型AI模型可帮助机器人执行物理任务甚至无需训练
Google DeepMind 正在推出两个新的人工智能模型,旨在帮助执行比以往更广泛的现实世界任务。 第一个模型名为双子座机器人(Gemini Robotics),它是一个视觉-语言-动作模型,能够理解新的情况,即使没有经过训练。
![]()
双子座机器人基于双子座 2.0(Google旗舰人工智能模型的最新版本)构建。 在一次新闻发布会上,Google DeepMind 高级总监兼机器人技术主管卡罗琳娜-帕拉达(Carolina Parada)说,Gemini Robotics借鉴了 Gemini 对多模态世界的理解,并通过添加物理动作作为一种新的模态,将其转移到现实世界中。
新模型在三个关键领域取得了进步,Google DeepMind称,这三个领域对于打造有用的机器人至关重要:通用性、交互性和灵巧性。 除了概括新场景的能力外,双子座机器人还能更好地与人和环境互动。 它还能执行更精确的物理任务,如折叠一张纸或取下一个瓶盖。
Google DeepMind 的新型双子座机器人模型让机器人更加灵巧。
帕拉达说:过去,我们在这些领域中的每一个领域都单独取得了进展,而现在,我们正在用一个单一的模型[大幅]提高所有三个领域的性能。这使我们能够制造出能力更强、反应更灵敏、对环境变化更稳健的机器人。
Google DeepMind 还推出了双子座机器人-ER(即具身推理),该公司将其描述为一种先进的视觉语言模型,能够理解我们复杂多变的世界。
正如帕拉达解释的那样,当你在打包午餐盒时,面前的桌子上摆放着各种物品,你需要知道所有东西的位置,以及如何打开午餐盒、如何拿取物品、放在哪里。 这正是双子座机器人-ER 需要完成的推理工作。 它的设计目的是让机器人专家与现有的底层控制器(控制机器人运动的系统)连接,使他们能够启用由 Gemini Robotics-ER 支持的新功能。
Kaiyun科技有限公司/dingyue.ws.126.net/2025/0313/b5851c6fg00st14nx0a5vd000hs00a0g.gif />
在安全性方面,Google DeepMind研究员维卡斯-辛德瓦尼(Vikas Sindhwani)告诉记者,该公司正在开发一种分层方法,并补充说,双子座机器人-ER模型经过训练,可以评估在特定场景下执行潜在动作是否安全。 该公司还发布了新的基准和框架,以帮助人工智能行业进一步开展安全研究。 去年,Google DeepMind 推出了机器人宪法,这是一套受艾萨克-阿西莫夫(Isaac Asimov)启发而制定的机器人规则。

