服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

AI终于掌握了Stratego博弈|Science一周精选

日期: 来源:ScienceAAAS收集编辑:优睿科新闻平台

点击上方蓝色字,关注我们


据研究人员报告,一种新开发的名为“DeepNash”的人工智能代理学会了具备人类专家水平的Stratego博弈;Stratego是AI还未掌握的少数棋盘游戏之一。这项研究的作者说,它代表了一个“非同寻常的结果,因为Stratego圈内人士认为,这是现有的技术水平不可能实现的。”

多年来,棋盘游戏Stratego一直是AI研究的下一个前沿领域之一。该游戏所测试的是一个人依次做出相对缓慢、审慎和逻辑决策的能力。作为一种“不完美的”信息游戏(即游戏中的某些玩法是向对手隐瞒的),Stratego给AI研究人员带来了重大挑战,因为它的结构有许多复杂的方方面面,其中包括它比另一经过充分研究的不完美信息游戏(即无限制德州扑克)拥有更多可能的状态。

目前,人们不可能用不完美信息搜索技术来掌握Stratego。Julien Perolat和同事在此介绍了一种新的方法,它能让AI来学习该游戏。这种新方法产生了一中名为DeepNash的机器人,它能在该游戏的最复杂变体“Stratego Classic”中展示人类的专家级表现。

DeepNash的核心是一种强化学习算法“R-NaD”。为制作DeepNash,Perolat和团队将R-NaD与深度神经网络架构结合,旨在学习在高度竞争层面进行博弈的策略。

DeepNash与各种最先进的Stratego机器人和专家级人类玩家进行了博弈测试。它战胜了其它所有的机器人,并在Gravon(一个互联网游戏平台,也是Stratego的最大在线平台)上与Stratego的专家级人类玩家进行了极具竞争性的对弈。

作者说,值得注意的是,这种博弈水平是在没有使用任何搜索方法的情况下做到的,而搜索方法是过去各种桌游中许多具里程碑意义的AI成就的关键组分。

欢迎关注Science官方公众号

点击下方“阅读原文”访问英文原文

为本期Science点亮你的赞吧

相关阅读

  • 不延期,可借考!结束了!

  • 考研不延期,可以异地借考。三年了,不容易!一开始就说了不要通过呼吁延期来解决问题。国考,高考,四六级是统一的试卷,什么时候考都可以,延期带来的影响虽然有,但是没有那么大,但是考研
  • 今天,你“畊”了吗?

  • 同学们好!今天,“你刘畊宏了没?”听说,最近《本草纲目》又火了,很多同学都成了“刘畊宏的男孩女孩们”?每晚开始跟着刘教练一起“咔咔地”跳了??你也会一听到《本草纲目》就想拍腿吗
  • “渣渣灰” 与 中旭未来 | 金融时报

  • “大渣好,我系渣渣辉。”2017年,因这句广告语而“出圈”的不只是中国香港知名演员张家辉,还有游戏《贪玩蓝月》。如今,这款游戏背后的运营商——中旭未来从幕后走向台前,并向港交
  • 历史剧视频 | 信息管理学院《军人荣誉》

  • 2022- 第十二届历史剧表演大赛 -信息管理学院军人荣誉冲锋队 | 《军人荣誉》《军人荣誉》以上世纪八十年代对越自卫反击战为背景,讲述了解放军某部指导员、高干子弟赵蒙生,由

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • AI终于掌握了Stratego博弈|Science一周精选

  • 点击上方蓝色字,关注我们据研究人员报告,一种新开发的名为“DeepNash”的人工智能代理学会了具备人类专家水平的Stratego博弈;Stratego是AI还未掌握的少数棋盘游戏之一。这项研
  • 导师越多越好|Science职业生涯

  • 点击上方蓝色字,关注我们“不幸的是,我现在没有时间处理师徒关系。”“我不确定我是否能帮上忙。”“我们怎么又见面了?”以上只是我在寻求更多导师过程中收到的其中一些回复。
  • 怎么给自己制定目标?

  • 在学习中,个人制定目标的重要性不言而喻。科学有效的目标制定能助一个人实现自身的愿景,提高自身的工作效率以及对异常环境的适应能力。一方面,制定具体而合理的学习目标,可以明
  • 天祝县人民医院扩容迁建项目加速推进

  • 天祝县人民医院扩容迁建项目是天祝县重大民生工程,也是高质量发展重大建设项目。项目实施以来,天祝县精心谋划、合理安排,倒排工期、挂图作战,逐一明确时间节点和具体措施,全力