最近,来自UCSD、IAIFI和MIT机构的研究人员,用一种全新的神经体积记忆架构(NVM),教会了一只机器狗感知三维世界。
利用这项技术,机器狗可以通过单一的神经网络实现爬楼梯、跨缝隙、翻障碍等等——完全自主,无需遥控。
(资料图)
不知道你有没有注意到狗背上那个的白盒子?
里面搭载的是苹果的M1芯片,负责运行机器狗的视觉处理任务。而且,还是团队从一台Mac上拆下来的。
不难看出,MIT的这只机器狗可以轻松地爬过了横在自己面前一段树枝,毫不费力(基本上)。
长了4条腿的MacBook?众所周知,对于机器狗,以及其他有腿的机器人来说,想要翻越不平整的道路,可谓是困难重重。
路面状况越是复杂,就有越多的障碍无法被看到。
为了解决「部分可观测环境」问题,目前SOTA的视觉-运动技术通过帧堆叠(frame-stacking),将图像通道连接起来。
然而,这种简单的处理方法远远落后于现在的计算机视觉技术——后者可以明确地模拟光流和特定的3D几何形状。
受此启发,团队提出了一种神经体积记忆架构(NVM),可以充分考虑到三维世界的SE(3)等变性(Equivalence)。
项目地址:https://rchalyang.github.io/NVM/
与以往的方法不同,NVM是一种体积格式。它可以将来自多个相机视图的特征体积聚合到机器人的自我中心框架中,从而让机器人能更好地理解周围的环境。
测试的结果显示,使用神经体积记忆(NVM)对腿部运动进行训练后,机器人在复杂的地形上的表现要明显优于之前的技术。
此外,消融实验的结果显示,神经体积记忆中存储的内容捕获了足够的几何信息来重构3D场景。
现实世界中的实验为了在模拟之外的不同现实世界场景中进行验证,团队在室内和室外场景中都进行了实验 。
当机器狗发现有障碍物突然出现在自己面前时,直接就会选择绕开。
在满是石头的地面上,走起来好像也没什么问题,虽然比在平地上还是要费力一些的。
相对于自身来说比较大的障碍,努努力也还是可以翻过去的。
采用此前的识别控制技术,小狗后腿对距离判断明显出现了误差,一脚踩沟里翻车了,失败。
采用MIT提出的NVM之后,小狗过沟,稳稳的幸福,成功!
采用此前的识别控制技术,小狗第一脚就踩空了,狗头抢地,失败。
采用MIT提出的NVM之后,小狗四平八稳地走过了矩阵。
腿部运动的体积记忆
使用以自我为中心的摄像机视角,本质上是一个处理「部分可观测环境」的问题(Partially-Observed)。
为了使控制问题具体化,机器人需要从先前的帧中收集信息,并正确推断被遮挡的地形。
在运动过程中,直接安装在机器人底盘上的摄像机发生剧烈和突然的位置变化。
这样,在表征一连串的画面的过程中,某单个帧能够被放到正确的位置,就变得非常重要了。
为此,团队提出的神经体积记忆(NVM)的概念,可以将输入的一连串视觉信息,转化为场景特征进行3D描绘,进而进行输出。
通过自监督学习NVM虽然「行为克隆目标」足以产生一个好的策略,但针对平移和旋转的等变性,自动为神经体积记忆提供了一个独立的、自监督的学习目标。
自监督学习:研究团队训练了一个独立的解码器。让它通过一段视觉观察和两个帧之间的预估转换,来预测不同帧中的视觉观察。
如上图所示,可以假设在帧之间周围的3D场景保持不变。由于相机是朝前看的,我们可以将先前帧的特征体积规范化,并用它来预测后续的图像。
解码器的视觉重建第一幅图显示机器人在环境中移动,第二幅图是输入的视觉观察结果,第三幅图是使用3D特征体积和预估画面合成的视觉观察效果。
对于输入的视觉观察,研究团队对图像应用了大量的数据增强来提高模型的鲁棒性。
作者介绍Ruihan Yan
Ruihan Yan是加州大学圣地亚哥分校的二年级博士生。在此之前,他于2019年在南开大学获得软件工程学士学位
他的研究兴趣是强化学习、机器学习、机器人等。具体来说,他想建立智能体,利用来自不同来源的信息进行决策。
Ge Yang
Ge Yang本科毕业于耶鲁大学物理和数学专业,并在芝加哥大学获得物理学博士学位。目前是美国国家科学基金会人工智能与基础交互作用研究所(IAIFI)的博士后研究员。
Ge Yang的研究涉及两组相关问题。第一组是通过重新审视我们在神经网络中表征知识的方式,以及知识如何在分布中转移,来改善学习。第二组是通过理论工具的视角来看待强化学习,如神经正切核、非欧几里得几何和哈密顿动力学。
Xiaolong Wang
Xiaolong Wang是加州大学圣地亚哥分校ECE系的一名助理教授。他是TILOS国家科学基金会人工智能研究所的机器人团队的成员。
他在卡内基梅隆大学获得了机器人学的博士学位,并曾在加州大学伯克利分校做博士后研究。
上一篇:抖音在深圳成立星火微芒科技公司 注册资本100万人民币
下一篇:最后一页
最近,来自UCSD、IAIFI和MIT机构的研究人员,用一种全新的神经体积记忆架构(NVM),教会了一只机器狗感知
本报讯(记者李锦)5月18日,记者从银川市生态环境局了解到,宁夏首个臭氧立体观测设备落地银川,并通过验
深圳星火微芒科技有限公司成立。
全场比赛,戴维斯出战41分钟,15投4中只拿到18分14篮板4助攻,虽然送出4次盖帽,但也有4次失误的出现,自己
(摄制:济南广播电视台李玮)编辑:马少华责任编辑:孔令定
听说竹子沟的夏天,能治愈所有的忧伤。来吧,别辜负了这一山一水的盛情款待……(通讯员:马若森)编辑:马少
中国甘肃网5月18日讯(本网记者宋芳科)5月18日,由甘肃省委网信办主办的“I@甘肃2023网络富民博览会”网信
本网记者程健通讯员苏钧郭强5月的安定,早已弥漫着初夏的味道,浪漫的空气中凝聚着奋斗、凝聚着幸福、凝聚
产业振兴是乡村振兴的重中之重,做好“土特产”这篇大文章,要因地制宜,“一把钥匙开一把锁”,让广袤乡村
小伙伴们好,带大家回顾下阿根廷队6月15日在北京踢澳大利亚队阿根廷队中国行行程正式敲定梅西将携大力神杯
今天,边肖想告诉你关于笔记本电脑。你会说你讲过很多次笔记本电脑。然而,今天,边肖想说,我要谈谈不同品
原标题:欧联杯:塞维利亚胜尤文图斯5月18日,塞维利亚队球员拉梅拉(左)庆祝打入制胜球。新华社 路透当日
楼板房就是采用预制板做楼板的房屋,长期使用会导致结构会不稳定,所以必须进行加固处理。那楼板房怎样抗震
这段时间A股市场整体上走出了震荡的走势,而中字头板块表现比较突出,带动了市场指数的回升。前段时间上证
中新网武汉5月18日电(记者梁婷)2023年二季度湖北重大项目集中开工活动18日在荆州举行。该省集中开工重大项
近日,中央宣传部、全国妇联发布2023年“最美家庭”先进事迹。这其中,就有我们熟悉的王亚平家庭。
5月18日,浙江吉利控股集团有限公司(下称“吉利”)与阿斯顿·马丁同时宣布,双方进一步达成新的合作协议
5月18日,外交部发言人汪文斌主持例行记者会。有记者提问,据报道,慈善机构乐施会估计,组成七国集团(G7
记者梁永吉在这如诗如画的季节,5月16日至18日,民族武术比赛项目在临夏市红园体育馆举行,由兰州市城关区
记者王伟如随着比赛结束哨声响起,陀螺比赛男子团体冠军诞生了!5月17日,经过两天的激烈角逐,甘肃民族师
记者马进忠缤纷五月,相约临夏。时隔5年,全省各少数民族运动员、教练员和裁判员又齐聚临夏,参加全省第十
记者赵好飞“这次临夏之行,让我感受最深的是各民族团结友爱、和睦相处,通过比赛促进了各民族的交往交流交
日内建议:逢高沽空,注意止盈止损。
国家统计局数据显示,2023年4月中国空调产量2586 9万台,同比增长12 1%;1-4月累计产量8869 5万台,同比增
【国际快讯】图森未来将裁减30%美国员工;苹果限制员工使用ChatGPT;松下计划在北美提高4680电池产量聚焦·
“又发热了”“这次是咳嗽厉害”“跟拉风箱一样,又有点像哮喘”……最近,不少家长被一种病毒“吓”到,它
截至2023年5月18日收盘,蓝晓科技(300487)报收于94 11元,下跌2 59%,换手率1 66%,成交量3 34万手,成交额3 13亿元。
去年,苹果正式发布了iOS16。5月19日,手机中国注意到,苹果今日向iPhone用户推送了iOS16 5更新,本次更新
5月18日,交银瑞思混合(LOF)最新单位净值为1 1305元,累计净值为1 1305元,较前一交易日下跌0 29%。历史数
上个月,华为发布了HUAWEIADS2 0也就是华为高阶智能驾驶辅助系统,是一套智能驾驶辅助解决方案。那么问题来