ramy  2019-02-11 13:29:37  机器人 |   查看评论   

AI 只练了 300 次就学会玩叠叠乐

▲AI 只练了 300 次就学会玩叠叠乐!

 

AI 已经能做很多事情,例如下围棋、打牌、打新海争霸,而且表现比人类好。现在, AI 又多了一项新技能:玩叠叠乐。

 

叠叠乐 AI 机器人,学会判断「触觉」

 

麻省理工学院(MIT)的科学家研发一款叠叠乐 AI 机器人。这款机器人有摄影机和力量传感器,可以感知叠叠乐的平衡状态,并有两根「手指」,用於推、抽、抓取,以及放置积木。

 

不同於围棋和星海争霸等纯粹智能的游戏,叠叠乐还包含了「触觉」的判断,玩家需要感知抽积木时的叠叠乐平衡状态,才能够抽出正确的积木,放到正确的位置,避免叠叠乐倒塌。因此对 AI 来说,具备玩叠叠乐的能力,等於具备触觉感知、物理模型建构,以及精细操作的能力,这些是 AlphaGo 等 AI 所没有的技能。

 

用「群」的概念,提升 AI 学习效率

 

不同於传统用大量数据训练 AI 的方式,科学家用「群(cluster)」的方式,让机器人大约玩了 300 次,就学会了叠叠乐。机器人将类似的传感结果和叠叠乐的平衡状态分组,例如将不好移动的积木的传感数据分为一组,将容易移动的积木的传感数据分为一组,将叠叠乐倒塌前的行为数据分为一组,机器人就藉由这些分组数据开发模型,预测每个动作之下,叠叠乐会如何被影响。

 

该研究的主导者 Nima Fazeli 表示,这种训练 AI 的方式是模仿人类的学习方式,它能提升 AI 的学习效率。人类学习玩叠叠乐时,会分辨好推和不好推的积木,而不是将所有的积木一视同仁,全部都「推推看」,这就是分群的概念,比试推全部的积木还要省时间。

 

虽然从视频上来看,机器人的表现和人类相当,但是机器人没有情绪压力,手不会抖,或许当叠叠乐叠到了「危险」的程度,机器人的表现就会超越人类玩家。

 

科学家表示,这款机器人的传感技术,可以应用在工业生产上,特别是那种需要精确传感的生产流程,例如手机组装。或许几年之后,这种 AI 不只是用来玩乐高,还可以用来盖真的摩天大楼。

  
 

除特别注明外,本站所有文章均为 人工智能学习网 原创,转载请注明出处来自MIT 用「群」训练,AI 只练了 300 次就学会玩叠叠乐

留言与评论(共有 0 条评论)
   
验证码: