查看原文
其他

擀面皮包饺子做披萨,MIT、CMU等的研究员让机器人自己学会了!

Robospeak 机器人大讲堂 2022-08-17
对于人类来说,把面团放到砧板上,然后用擀面杖把它压平成圆形。这看起来很容易,对吧?


 

那如果是由机器人来操作,会是怎样的效果?


对于机器人来说,面对像面团这样的可变形物体是很棘手的,因为面团的形状可以以多种方式变化,而这些变化很难用方程式来表示。



此外,从面团中创建新形状需要多个步骤并使用不同的工具。这就意味着机器人需要学习一系列长长的操作任务,然后还需要通过反复试验更多可能的选择。

现在,来自,麻省理工学院、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员创建了一个框架,可以让机器人快速有效地完成复杂的操作任务,例如揉面皮包饺子、做披萨。


▍一个机器人操纵系统的框架—— DiffSkill


研究人员为使用两阶段学习过程的机器人操作系统创建了一个框架,这可以使机器人能够在很长一段时间内执行复杂的面团操作任务。


这个算法会像“老师”一样解决机器人完成任务必须采取的每一步。然后训练一个“学生”机器学习在什么时间段以及如何执行任务期间所需的每项技能的抽象概念,例如使用擀面杖。


 

有了这些知识,系统就会推理出如何执行技能来完成整个任务。


一系列操作,堪称“手把手教学”。


研究人员表明,这种他们称之为 DiffSkill 的方法可以在模拟中执行复杂的操作任务,例如切割和摊开面团,或从砧板周围收集面团,同时优于其他机器学习方法。

 


当然,除了包饺子、做披萨之外,这种方法还可以应用于其他需要机器人操纵的可变形物体的环境。


例如为老年人或运动障碍者喂食、洗澡或穿衣的护理机器人。


“这种方法更接近我们人类计划行动的方式。当一个人执行一项长期任务时,我们并没有写下所有的细节。我们有一个更高级别的计划者,它大致告诉我们在此过程中需要实现哪些阶段以及一些中间目标,然后我们执行它们,”计算机科学与人工智能专业的研究生Li表示。


▍“学生”&“老师” 的工作流程


DiffSkill 框架中的“老师”是一种轨迹优化算法,可以解决物体初始状态和目标位置靠得很近的短视界任务。


轨迹优化器在模拟现实世界物理的模拟器中工作(称为可微物理模拟器,它将“Diff”放入“DiffSkill”中)。然后,“老师”算法使用模拟器中的信息来学习面团在每个阶段必须如何移动,一次一个,然后输出这些轨迹。


然后“学生”神经网络学会模仿老师的动作。作为输入,它使用两个摄像头图像,一个显示当前状态的面团,另一个显示任务结束时的面团。神经网络生成一个高级计划,以确定如何将不同的技能联系起来以达到目标。然后,它为每个技能生成特定的、短视界的轨迹,并将命令直接发送到工具。

 


接着,研究人员使用这种技术对三种不同的模拟面团操作任务进行了实验。


在一项任务中,机器人使用抹刀将面团举到砧板上,然后使用擀面杖将其压平。在另一个例子中,机器人使用抓手从柜台上收集面团,将其放在抹刀上,然后将其转移到砧板上。


在第三个任务中,机器人用刀将一堆面团切成两半,然后用夹具将每一块面团运送到不同的位置。

 


同时,研究人员开发了一种机器人操纵系统,可以在模拟中使用工具执行复杂的面团操作任务。



例如收集面团并将其放在砧板上(左),将一块面团切成两半并将两半分开(中),以及将面团抬到一块砧板,然后用擀面杖将其压平(右)。


实验结果证明,DiffSkill 框架能够胜过依赖强化学习的流行技术。在强化学习中,机器人通过反复试验来学习任务。


事实上,DiffSkill 是唯一能够成功完成所有三个面团操作任务的方法。有趣的是,研究人员发现“学生”神经网络甚至能够胜过“教师”算法,Lin 说。


“我们的框架为机器人获得新技能提供了一种新颖的方式。然后可以将这些技能链接起来,以解决更复杂的任务,这些任务超出了以前的机器人系统的能力,”Li说。


因为他们的方法侧重于控制工具(抹刀、刀、擀面杖等),所以它可以应用于不同的机器人,但前提是它们使用研究人员定义的特定工具。


未来,他们计划将工具的形状集成到“学生”网络的推理中,以便将其应用于其他设备。


该团队的研究人员们打算通过使用 3D 数据作为输入来提高 DiffSkill 的性能,同时,他们还希望使神经网络规划过程更高效,并收集更多样的训练数据,以增强 DiffSkill 对新情况的泛化能力。


从长远来看,他们希望将 DiffSkill 应用到更多样化的任务中,包括布料操作。


这项研究得到了美国国家科学基金会、LG电子、麻省理工学院-IBM 沃森人工智能实验室、美国海军研究办公室和国防高级研究计划局的部分支持。


文章及论文地址:

https://news.mit.edu/2022/robotic-deformable-object-0331


作者 | Robospeak

排版 | 耳朵


-----------------END-------------------




更多精彩

*14年,KUKA AMR厚积薄发,锋芒初现

*降本、增效、提速压力大,工业软件能否助推建筑行业走出困境?

*红海下,凭借精挖深度需求,这家企业分得一杯羹

*布局中部,埃斯顿业绩稳定增长,大客户战略持续,上半年订单或将超预期

*单批采购量超1000台,农业机器人发展,如何算一笔“经济账”?

*跨界顺风车!Science Robotics报道北航“跨介质吸附仿生机器人”

*超级厉害的仿生机器人都用了啥”秘密武器“?

*破解全场景清洁难题,及时性、智能性拉满,这家企业新品首发签单就破亿

*在机器人领域,这个万亿级市场仍有待开发...

*停产小米扫地机器人

*德国马克思普朗克智能系统(MPI-IS)研究所Dr. Hu实验组招聘全奖博士两名

*节卡硬核实力实现“小巨人”三级跳

*“工业场景革新者”xMate CR破局登场,七折钜惠重磅进行中

*极客创新大赛|微创®机器人号探索飞船即将启航

*视比特“AI+3D视觉”核心产品 | 智能下料分拣产线

*导入协作机器人,家电业迎来增长新亮点

*艾利特获2022年苏州市智能感知协作机器人工程技术研究中心认定!

*随谈:驱变中的SCARA

*衣来伸手?麻省理工研发新算法,机器人辅助人类穿“有袖”衣物!

*北理工团队给微型机器人上磁,模拟在血管里‘跑酷’,还能操纵微型物体



加入社群

欢迎加入【机器人大讲堂】读者讨论群, 共同探讨机器人相关领域话题,共享前沿科技及产业动态。


教育机器人、医疗机器人、腿足机器人、工业机器人、服务机器人、特种机器人、无人机、软体机器人等专业讨论群正在招募, 关注机器人大讲堂公众号,发送“ 交流群 ”获取入群方式!


招募作者

机器人大讲堂正在招募【兼职内容创作者】,如果您对撰写机器人【科技类】或【产业类】文章感兴趣,可将简历和原创作品投至邮箱: LDjqrdjt@163.com  


我们对职业、所在地等没有要求,欢迎朋友们的加入!






 
 

看累了吗?戳一下“在看”支持我们吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存