“阿尔法狗”进化到第四代,无需告知规则 MuZero算法自学成“棋”才

2020-12-30 01:00:00 来源: 科技日报 作者: 冯卫东

MuZero成为DeepMind最先进的AI算法。(图片来源:DeepMind公司网站

科技日报记者 冯卫东

据最新一期《自然》杂志报道,DeepMind公司开发的一种人工智能(AI)算法MuZero,可以在不告知其游戏规则的情况下掌握围棋、国际象棋、日本将棋和视频游戏,这是谷歌人工智能部门获得的又一重大突破。

DeepMind公司表示,研究人员多年来一直在寻找一种方法,既可以学习建立用于解释当前环境的模型,也能够利用这个模型来进行最好的决策。到目前为止,大多数方法都难以在Atari这种游戏中进行有效规划。

MuZero最初在2019年推出,通过只关注环境中最重要的一个方面,来学习建立模型并解决问题。通过将这种方法与“阿尔法狗”强大的搜索树技术相结合,MuZero的能力实现了重大飞跃。此外,MuZero还利用了前瞻搜索、基于模型的规划来解决问题。

MuZero不会使用规则来找到最佳情况(因为事先不被告知),而是学习考虑游戏环境的各个方面,自己观察它是否重要。在数百万场比赛中,它不仅学习规则,而且学习位置的通用价值、成功的通用策略以及事后评估自己行为的方式。后一种功能可帮助其从自身的错误中学习、回忆和重做游戏,以尝试各种不同方法来进一步优化位置和策略价值。

MuZero不仅在国际象棋、围棋和日本将棋上达到了与提供完善规则的“阿尔法狗”一样的超人水平,在Atari游戏这样的杂乱感知输入环境中,也创造了新纪录。研究人员将MuZero描述为“在追求通用算法方面迈出的重要一步”。

加载更多>>
责任编辑: 常丽君
科技专题 更多>>
国内 更多>>

中新天津生态城彩虹欢乐...

从中新天津生态城获悉,2020年12月31日晚间22:06:53-22:08:53,一颗名为“瓢虫一号”的卫星在天津上空闪烁摩...

引入“互联网+”的理念&...

为丰富老年学员的文娱生活,搭建老年学员展示平台,宣传老年大学办学成果,山东省老年大学协会举办了“摩罗...

让课外书点燃乡村小学孩...

微信支付用户可进入“知识星光”小程序收集星光,集满99颗星光就能为乡村小学的孩子捐赠一本课外书,还可以...

聚焦三大社会问题,用AI...

《2019年全国未成年人互联网使用情况研究报告》显示,目前46%的未成年人表示曾遭遇不良网络信息,他们受到网...

打造中国生物医药产业的...

近年来,随着智能科技的迅猛发展,越来越多的科技型企业开始涉足生物医药领域。12月26日,中国工程院院士、...

科报集萃 更多>>

格力“再掀11.11”:给更...

11月26日晚,格力电器发布《“再掀11.11 百亿大让利”公告》,宣布从11月27日开始,按照与“11.11”当天同类...

GES大会“新好论道”,共...

11月25日,由中国发展研究基金会、北京师范大学、腾讯、GSV(全球硅谷投资公司)、新东方、好未来联合主办的...

喜获青少年足球产业推力...

11月16日,2019CIYF国际青少年足球嘉年华暨第二届青少年足球运动奖颁奖典礼在厦门举行。格力电器凭借在少年...

首届中国数据安全和治理...

近日,中国信息协会信息安全专业委员会2019年年会暨首届中国数据安全和治理高峰论坛在北京召开。本届峰会以...

彩88-Welcome