天涯论坛_华人最大的社区论坛_新天涯社区

查看: 18|回复: 0

波士顿动力狗gogo返来了,“五条腿”协同发力

[复制链接]

2万

主题

0

回帖

6万

积分

论坛元老

Rank: 8Rank: 8

积分
65118
发表于 2025-10-15 21:48 | 显示全部楼层 |阅读模式
机械狗搬轮胎,“五只腿”齐发力!

波士顿动力野生智能研讨所的最新方式——连系采样与进修的静态满身操纵中,波士顿动力的机械狗Spot最快仅用3.7秒就能搬起轮胎提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
搬运的轮胎重达15千克,相当于Spot本身重量的一半(32.7千克),并远超其最大臂力提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
而且,搬起轮胎后,它还能将轮胎转动到指定位置提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

甚至还能把一个轮胎叠到另一个轮胎上面(还会用头帮手顶一下)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

这一方式克服了传统操纵战略(如摇操)在分歧机械人形状学结构上的迁移限制,并经过分层控制实现了机械狗手脚与满身的调和动力学操纵提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

网友暗示,狗子快去接管站去搬轮胎吧!

这是怎样做到的?
连系采样与进修的静态满身操纵总的来说,连系采样与进修的静态满身操纵(Combining Sampling and Learning for Dynamic Whole-Body Manipulation)操纵强化进修与基于采样的控制(sampling-based control)相连系的方式,使机械人可以履行需要手臂、双腿和躯干协同配合的静态力交互使命提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
为应对复杂的操纵使命,研讨采用了分层控制(hierarchical control)方式,将控制题目分别为两个互补且同步的层级提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在低层,基于强化进修的活动战略间接控制机电力矩,以实现平衡、稳定性与活动履行提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
高层控制则按照使命范例而有所分歧:
对于轮胎扶正、拖拽与堆叠等使命,系统采用基于采样的控制,经过模拟潜伏的未来情境来发现最优操纵战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
对于轮胎转动使命,则利用强化进修来捕捉保持物体稳定活动所需的纤细动力学特征与反应性控制机制提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
一切的高层方式,终极城市输出包括底盘速度、姿势参数(包括滚转、俯仰、高度 )、腿部控制以及手臂行动等指令提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在采样控制中,采样控制器经过并行模拟多个未来情境,寻觅最有用的操纵战略,从而挑选最能实现使命方针的行动提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
对于那些需要切确施力和多打仗调和的使命,系统会运转32个并行CPU线程,每个线程利用MuJoCo模拟未来几秒内的分歧行动序列提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

与间接采样原始轨迹分歧,研讨在样条曲线空间(space of splines)中停止采样,这类方式能天生更平滑、更自然的活动轨迹,同时下降搜索空间的维度提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
该控制器展现出源自物理仿真的机遇性行为提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。在轮胎扶正进程中,控制器自立发现了复杂的操纵战略:机械人经过Spot Arm与前腿行动的调和,发生充足的杠杆力以抬起繁重的轮胎提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
为了顺应多样的初始构型,机械人能够利用手臂、前腿、身材,或这些部位的组合来灵活调剂操纵战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
值得一提的是,系统并未预设任何牢固的操纵形式提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。这类多肢体、多打仗的行为,是在采样进程中优化自然出现的成果,而非经过显式编程设定打仗顺序实现的提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
此外,控制器会按照尝试室空间中机械人与轮胎确当前构型静态调剂战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在具体的强化进修战略方面,研讨经过PPO算法在IsaacLab中练习获得的活动战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

这一战略为高层控制供给了妥当的低层控制笼统,可以在多种操纵场景中连结平衡,从而使高层控制题目更易处置提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在轮胎转动使命中,研讨操纵强化进修来应对难以切确建模的复杂磨擦与接震动力学提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
其采用非对称演员-批评家(asymmetric actor-critic architecture)方式,在单块GPU上经过约24小时练习,获得高层技术战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
该战略接收的观察状态包括机械人、轮胎与方针之间的相对姿势,以及枢纽位置与速度提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。嘉奖函数则按照物体多少外形及其与情况的空间关系,计较期望的躯干与结尾履行器位置,指导战略进修到达方针姿势提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

练习获得的轮胎转动战略使机械人可以静态调剂其躯干与Spot Arm的位置,以稳定控制转动的轮胎,避免其倾倒,并将其指导至方针位置提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
最初,为处理从仿真到现实的差异,练习进程中引入了随机化,包括对物体的质量、磨擦系数与外形等属性停止随机变化提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
实测表示正如我们开首提到的,在轮胎扶正使命中,机械人最好成就为3.7秒,均匀每个轮胎用时5.9秒,几近到达人类在该使命中的操纵速度提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

这一表示远超传统的准静态假定提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在准静态假定下,机械人操纵物体时速度很慢,加速度发生的惯性被疏忽,枢纽驱动力矩首要依靠静态平衡提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
而在这篇研讨中,机械狗可以高效搬运重达15千克的轮胎——远超其夹持器的峰值举升才能(11 千克)和延续才能(5 千克)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这说明机械人经过静态调和满身行动,将活动与操纵慎密耦合,拓展了操纵范围,超越了传统的拾取与放置方式提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
此外,研讨表白,将高层控制与低层控制分手可以明显简化控制题目提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
高层控制器无需在具稀有十个自在度的系统中推理枢纽力矩、打仗力以及稳定性约束,而是仅在一个简化的行动空间中工作,该空间由底盘速度和姿势参数组成,其将履行细节交由活动控制器处置,从而极大下降了复杂度提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
分层控制架构使得高层控制器可以专注于使命完成,而无需显式地推理平衡约束或空中打仗提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
由此,进修获得的活动笼统层让高层控制更简单、计较更可行,控制器只需专注于“在那里”和“若何操纵物体”,无需处置复杂的低层动力学细节提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
参考链接:
[1]https://rai-inst.com/resources/blog/combining-sampling-and-learning-for-dynamic-whole-body-manipulation/
[2]https://x.com/rai_inst/status/1978113805604258161
本文来自微信公众号“量子位”,作者:henry ,36氪经授权公布提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯论坛_华人最大的社区论坛_新天涯社区  

GMT+8, 2025-11-8 03:38 , Processed in 0.999484 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表