家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

2025-07-12 15:32:57 - 独趣

斯坦福大学的家务机器将再键变 Chelsea Finn 团队又出新成果了。

Chelsea Finn 团队一直是人或斯坦福走在具身智能研究前沿的团队之一,之前火遍全网的更新 ALOHA 炒菜机器人就是出自这个团队之手。团队领头人 Chelsea Finn 的队推创业公司 Pi 更是创立不到一个月就拿下来自红杉资本、OpenAI 等公司的出B聪明7000万美元融资。雷峰网雷峰网(公众号:雷峰网)

最近,新运杭州理工大学爆料评论Chelsea Finn 团队在研究中发现,算规虽然延长动作块能够提升策略捕捉时间依赖性的则机能力,但这样做会减少对机器人近期状态的器人观察,导致在随机环境中更容易出错。家务机器将再键变

为了克服这个难题,人或他们开发了一种双向解码(Bidirectional Decoding,更新 BID)新型运算规则。BID 能将动作块化与闭环操作相结合,队推通过在每个时间步采样多个预测并寻找最优化的出B聪明一个,增强扩展序列的新运时间一致性,同时在随机环境中实现自适应重新规划。

为了验证 BID 运算规则的效果,他们在 Franka Kitchen 信息集上进行了模拟测试,郑州学院门事件体验发现机器人在家庭环境中的表现还不错。他们还用 Franka Panda 机器人做了真实实验,结果显示 BID 显著提高了机器人在目标移动时的放置成功率。

这些测试不由得让人联想到了他们之前做的炒菜机器人,也许这个团队正计划把 BID 应用在 ALOHA 上,准备给家务机器人来个全面的工艺升级。

值得一提的是,这个团队中有一半都是华人面孔,之前开发 ALOHA 的也全是华人学生。

目前,论文已在arXiv公开,相关代码也已开源。

论文标题:Bidirectional Decoding:Improving Action Chunking via Closed-Loop Resampling

论文地址:https://bid-robot.github.io/static/BID_paper.pdf

项目网站:https://bid-robot.github.io/

代码地址:https://github.com/YuejiangLIU/bid_diffusion

                 https://github.com/Jubayer-Hamid/bid_lerobot


论文概览

研究问题

本文旨在解决机器人学习中的挑战,特别关注动作分块,即在没有中间重新规划的情况下预测和执行动作序列的过程,这些序列通常来源于人类示范。面临的挑战包括在捕捉时间依赖性与对随机环境中意外变化的反应之间的权衡,以及不同示范之间的风格变异性较大。

该研究的动机在于通过对动作分块进行更深入的分析和提供实用的解码运算规则,来增强机器人系统的学习和执行过程。所要解决的问题包括:

动作分块中时间依赖性与反应性之间的权衡

不同示范之间的风格变异性较大

需要一种实用的解码运算规则以提升机器人行为克隆的性能。

提出的方法

本文提出了双向解码(BID)方法。

BID 是一种推理运算规则,将动作分块与机器人学习中的闭环操作相结合。它在每个时间步采样多个预测,并基于向后一致性(与先前决策的对齐)和向前对比(与更强策略的结果的接近度)来优化选择。

这种综合方法增强了长动作序列的时间一致性,同时保持了适应动态环境变化的灵活性。BID在各种机器人任务中显著优于现有的闭环方法,代表了机器人系统学习和执行过程的重大改进。


实验与结果

信息集

本文在三个信息集上进行了实验:Push-T、RoboMimic 和 Franka Kitchen。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

对于Push-T信息集,本文在七个任务上评估了所提出的双向解码(BID)运算规则,包括将物体放入人类手持的杯子中。实验中使用的机器人是Franka Panda,配备了两台相机,提供256 x 256像素分辨率的视觉观察。本文还评估了BID在大批量和现有推理方法下的可扩展性和兼容性。

对于RoboMimic信息集,本文使用了五个任务,即Lift、Can、Square、Transport和Tool Hang。每个任务的训练信息集包含300个从多个人类演示中收集的回合。

对于Franka Kitchen信息集,本文在涉及四个或更多物体的测试案例上评估了学习到的策略,这是一个具有挑战性但在家庭环境中实际应用的机器人操作任务。


真实世界实验

本文还通过两项现实世界实验进一步评估了提出的 BID。


动态放置实验

他们共收集了150个演示回合,包括50个干净且一致的演示和100个嘈杂且多样的演示。实验中使用的机器人是 Franka Panda,并采用基于视觉的扩散策略进行操作。

机器人的任务是将其抓手中的物体送入人类手中的杯子中。每次演示包括四个主要阶段:(a) 随机初始化机器人位置,(b) 接近目标杯子,(c) 在目标杯子附近减速,(d) 释放物品。目标杯子的位置可能会在演示过程中发生变化。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

值得注意的是,BID 在动态设置中的成功率与静态设置相似,这表明它有可能将动作块扩展到不确定环境中。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明


动态拾取实验

本文评估了不同方法的性能,包括普通的开环和闭环采样、BID 的开环和闭环采样,以及 EMA 的闭环采样。

机器人的任务是拿起一个杯子,并将其放在附近的碟子上。四个主要阶段是:(a) 初始化机器人,(b) 接近目标杯子,(c) 抓住目标杯子,(d) 拿起杯子,(e) 将杯子放到目标碟子上。目标杯子的位置可能会在一个过程中发生变化。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

结果表明,在动态环境中,相比其他方法,BID 的成功率至少提高了2倍,同时在静态环境中保持了其性能。


BID工艺解读

动作分块有利于对演示中的时间依赖性建模,但却牺牲了对随机环境中意外状态的反应能力。他们选择通过闭环操作衔接长的动作块来解决这一问题。

他们的主要假设是,虽然任何一对样本共享相同潜在策略的概率很低,但从大量样本中找到一致的一对样本的可能性要高得多。这种直觉促使他们将闭环动作分块问题理解为在每个时间步采样的一批计划中寻找最优动作。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

其中 ? 是动作块集合,ℒ? 和 ℒ? (B和F都是下标,飞书文档打不出来)是两个衡量时间依赖性的标准,接下来将会详细描述这两个标准。

B指的是逆向一致性。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

这里,ρ 是一个衰减超参数,用于解释不确定性随时间增长而增加的情况。这种后向损失鼓励相邻步骤之间采用类似的潜在策略,同时允许逐步适应不可预见的过渡动态。

 指的是正向对比度。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

其中 ?+=?∖{?} 是强策略 ? 预测的正集合,?− 是弱策略 ?′ 预测的负集合,而 ? 是样本大小。

下图展示了逆向一致性和正向对比度标准对样本选择的作用。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

由于 BID 中的所有步骤都可以并行计算,因此在现代 GPU 设备上,总体计算成本仍然适中。


团队介绍

Chelsea Finn

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Chelsea Finn 博士毕业于加州大学伯克利分校,师从Sergey Levine。她曾在 Google DeepMind 工作过 6 年,现在担任斯坦福大学计算机科学与电子工程系的助理教授,也是 Pi 的联合创始人。

Chelsea Finn 的研究兴趣是机器人和其他代理通过学习和交互增长广泛智能行为的能力。她的实验室 IRIS 专注研究大规模机器人交互智能,隶属于 SAIL 和 ML Group。

团队其他三位华人学生包括:


Yuejiang Liu

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Yuejiang Liu 是 IRIS 实验室的博士后,博士毕业于瑞士洛桑联邦理工学院。他专注于研究自监督学习、因果表征学习和测试时间适应,并将其应用于计算机视觉和多代理系统。


Annie Xie

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Annie Xie 毕业于加州大学伯克利分校,曾在伯克利机器智能研究 (BAIR)实验室和 Sergey Levine 一起工作,现在是 Chelsea Finn 指导的博士生。她的研究重点是开发在最少人工监督下学习的机器人系统。


Maximilian Du

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

Maximilian Du 今年学士毕业于斯坦福大学,主修计算机科学、心理学(辅修)和创意写作(辅修),在 Chelsea Finn 的 IRIS 实验室从事机器人学习工作,现在是 Chelsea Finn 即将入学的博士生。雷峰网雷峰网


雷峰网版权文章,未经授权禁止转载。详情见转载须知。

家务机器人或将再更新?Chelsea Finn团队推出BID新运算规则,机器人一键变聪明

- END -

46

文泰一性侵案一审宣判 获刑3年半

文泰一性侵案一审宣判 获刑3年半

7月10日,据媒体援引韩媒报道,前NCT成员文泰一音译,Moon Tae-il)涉特殊准强奸案今日一审宣判。他被判3年6个月有期徒刑,被当庭拘留。此外,法院要求他完成40小时性暴力治疗课程、公开告知身

独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元

独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元

近日,关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情,坊间传得沸沸扬扬。雷峰网独家获悉,杨红霞已于 5 月下旬正式从字节跳动离职,开始筹备 AI 创业项目。不过,杨红霞不做“大”模型,而是将方

对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

当科学家把一些菟丝子移植到几株营养状态不同的山楂树上时,那些营养状况更好的山楂树会更容易获得菟丝子的「青睐」。这在以往被看作是植物内「被动」存在的东西,但据研究人员发现,植物也具备从过去的经验中学习区

实测:ChatGPT的翻译能力怎么样?

实测:ChatGPT的翻译能力怎么样?

在今天,狂热追捧ChatGPT,仿佛已经成为了一种“政治正确”。ChatGPT一出,学界、工业界无不惊为天人。一位研究机构的资深研究员就对AI科技评论说过:“ChatGPT出来,直接给我们整不会了——

问鼎「AI 之巅」,第四届全国人工智能大赛决赛在深举行

问鼎「AI 之巅」,第四届全国人工智能大赛决赛在深举行

近年来,中国人工智能产业的科技浪潮乘风渐起,从“技术研发”到“成果转化”再到“赋能应用”,众多行业因为AI的嵌入而焕发新的光彩。以赛事为牵引,为中国人工智能产业发现人才,挖掘创新是全国人工智能大赛一直

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业

11月22日,AI与数字经济领域一年一度的科创盛会,2023IDEA大会在深圳举行。IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在会上发表主旨演讲,发布IDEA研究院的重磅研产结晶与市场化成

埋头钻研一年后,阶跃星辰交出了第一份答卷

埋头钻研一年后,阶跃星辰交出了第一份答卷

历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面

Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?

Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?

AI呼啸而过,站在路边的Web3随风飞扬。AI的兴起是否会带来Web3的衰落?2023,ChatGPT爆火,AIGC一时风生水起。每一天,关于AI、大模型的消息不绝于耳,Capilot新版Office

冯德莱恩对中国提出三项要求,外交部回应

冯德莱恩对中国提出三项要求,外交部回应

【环球时报-环球网报道 记者李萌】在7月9日外交部例行记者会上,有记者提问称,欧盟委员会主席冯德莱恩昨天对中国提出了三项要求,其中包括与俄罗斯的合作。中方对此有何评论?对此,发言人毛宁表示, 中俄之间

GAIR 2023 正式开幕:AI 如此绽放之时,昭示着熙春已至

GAIR 2023 正式开幕:AI 如此绽放之时,昭示着熙春已至

8月14日,新加坡,大厦起伏如丘,树木葱茏,云卷云舒,风也是清新的。建立在大模型技术爆炸时代语境下的第七届GAIR全球人工智能与机器人大会,正式在新加坡乌节大酒店举办。大会共开设10个主题论坛,聚焦大

Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?

Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?

AI呼啸而过,站在路边的Web3随风飞扬。AI的兴起是否会带来Web3的衰落?2023,ChatGPT爆火,AIGC一时风生水起。每一天,关于AI、大模型的消息不绝于耳,Capilot新版Office

牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团

牵手五大顶尖高校教授   “云阙智能”打造AIGC智囊团

大模型竞争已进入白热化阶段,盲目卷资源已不再是长久之计,AI 创业公司的可持续性和科学性则是更重要的考量因素。在这一背景下,背靠强大高校,有科研能力、学术资源和充足的后备人才作为补充,变得愈发重要。2