AI粉碎了《星际争霸2》的顶尖玩家!谷歌的DeeMind开发的人工智能AIhatar在《星际争霸2》星际争霸II击败了两位人类专家,这是AI空间的新里程碑。在YouTube和Twitch上玩的游戏中,人工智能玩家在连续10场游戏中屡屡击败人类。在最后的对决中,职业球员格里高哥尔兹玛娜科明奇赢得了人类的唯一胜利。与人类玩家相比,人工智能的优缺点是显而易见的与GoAIAIhago峰会不同是一个不完善的信息系统。

充满了战争迷雾,阻碍了信息的顺利获取。此外,行动的数量和频率都很大而且有多条战线。同时,考虑到后方的管理,以及在前线的多线作战。显然,人工智能在多线决策中的优势远大线性思维的优势。Atari,Go和tarCraft2的比较DeeMind研究的共同负责人戴维·西尔弗Davidilver在赛后表示,33,个人工智能的历史已被标记为许多重大的基准胜利。尽管仍有许多工作要做,但我希望未来当人们看到回到今天。

他们认为这是AI系统向前发展的象征在电子游戏中击败人类玩家似乎是AI开发过程中的一个事件,但这也是一个重大的研究挑战。《星际争霸2》此类游戏比棋类游戏例如Go更难玩。在视频游戏中,人工智能无法通过观察每个棋子的运动来计算下一步,它们必须实时做出反应。12月游戏的屏幕显示Alhatar与人类玩家TLO对抗这些因素似乎并未对DeeMind的AI系统Alhatar构成主要障碍。首先,它击败了人类职业选手DarioWunchTLO。

然后将瞄准了MaNa该比赛最初去年12月在DeeMind的伦敦总部举行,但今天该公司参加了Alhatar和MaNa之间的最后一场比赛,这是人类玩家赢得的唯一一场比赛。《星际争霸2》的专业员将Alhatar的表现描述为非凡和超人。在《星际争霸》中,玩家在建造基地,训练部队和入侵敌方领土之前,从同一地图的不同侧移动。Alhatar特别擅长所谓的微操作,即能够迅速而果断地控制战场上的少量或少量部队的能力。即使人类玩家有时可以训练更强大的战斗部队。

AlhaZero仍可以在近距离击败他们在游戏中,Alhatar用一个名为talker的快速移动单位骚扰MaNa。员凯文·范·德·库伊KevinvanderKooi将其描述为非常罕见的单位控制。马纳说,赛后:如果我与任何人类对抗,他们将不会很好地使用talker。这与我们在其他高级游戏AI中所看到的相呼应。去年,当OenAI在《星际争霸2》与人类专家面对面时,他们最终以失败告终。但是专家指出,这些AI是以清晰准确的方式发挥作用的在这方面我们无需感到惊讶。

快速犯错的决定是机器的天赋专家们已经开始仔细分析这些比赛,并讨论Alhatar是否具有任何不公平的优势。这些AI在某些方面仍然很笨拙。例如,Alhatar的每分钟次数仍然低人类。但是,与人类玩家不同,它可以每次整个地图,而无需手动导航。DeeMind的研究人员说,这并不为Alhatar提供真正的优势,因为它仅在任何时候都专注地图的特定部分。但是,正如游戏所示,这并不妨碍Alhatar熟练地控制三个不同区域中的单位。员说这对人类是不可能的值得注意的是。

当MaNa在实况游戏中击败Alhatar时,AI使用了有限的相机视角。Alhatar的另一个潜在痛点是,尽管人类选手是专业选手,但他们并不是世界冠军的标准。TLO还必须参加《Dota2》他不熟悉的三场比赛之一。Alhatar流程的图形表示,从上到下整个地图,并预测哪些行为将有助赢得竞争人工智能取得重大进展?除了这些,专家说游戏对AI来说是重要的一步。长期从事《星际争霸2》人工智能研究的AI研究人员DaveChurchill表示,我认为AI取得了重大成功,比我在AI研究人员中听到的最乐观的猜测至少提前了一年丘吉尔补充说。

由DeeMind尚未发布有关这项工作的任何研究论文,因此很难说它是否显示出任何技术飞跃。他指出:我尚未阅读此博客,也没有接触过论文或技术细节。杏鑫娱乐资讯乔治亚理工学院副教授马克·里德尔MarkRiedl说,他对结果并不感到惊讶。AI的胜利只是一个时间问题。里德尔补充说,他不认为这些游戏表明《星际争霸》已完全由AI控制。他说在上次直播中,Alhatar的某些局限性确实消除了其人类的许多优势。但是,我们看到的更大问题是,当人们将AI置舒适区域时,它将崩溃。丹麦哥本哈根信息技术大学的塞巴斯蒂安·里西ebatianRii说这似乎是向前迈出的一大步我们不知道有多少创新。

但是训练AI的方法似乎是关键。里斯的同事尼尔斯·贾斯特森说:我没想到会发生这种情况,特别是因为以前的《星际争霸2》端到端研究还远没有达到人类的水平。残酷的强化学习AI竞技场最终,这类工作的最终不是使用AI在视频游戏中击败人类,而是改善AI的训练方法,尤其是创建可以在复杂的虚拟环境如《星际争霸》中运行的系统。为了训练Alhatar,DeeMind研究人员使用了一种称为强化学习的方法。人工智能特工基本上是通过反复尝试来达到某些。

例如获胜或幸存。他们首先通过模仿人类玩家来学习,然后在类似的竞争游戏中彼此对抗。最强的AI将生存,而最弱的AI将被淘汰。DeeMind估计,其每个Alhatar代理都以这种方式积累了大约200年的游戏时间,并且游戏速度也在加快。DeeMind非常了解执行此工作的。Alhatar项目的共同负责人OriolVinyal表示首先,DeeMind的任务是构建一个能够执行人类可以完成的任何心理任务的通用AI。要实现这一。最重要的是对我们的基准进行基准测试。AI代理在各种任务中的表现科技Engadget表示。

谷歌的AI子公司DeeMind已经转向,其AI系统已经过微调,以适应《星际争霸》。今天的《星际争霸2》竞赛是Alhatar与职业玩家之间的首次积极对抗。在五局的两个系列中,Alhatar击败了职业玩家TLO和MaNa并赢得了10场胜利。经过十连败,人类选手终赢得了最后一场比赛。杏鑫娱乐资讯DeeMind的野心尽管该游戏不能很好地展示技术,但它确实描绘了DeeMind在理解人类行为方面的进步。最终,该技术可以用许多其他领域,例如理论物理学甚至医学。纽约大学的朱利安·柳斯Julianliu表示我认为《星际争霸2》就像是一家公司。

尤其是物流部门关键是要计划研发工作,并在正确的时间将产品交付到正确的位置。避免出现瓶颈。Alhatar还可以帮助专业人士改善其策略。马耳他大学的GeorgioYannakaki说:如果AI能够找到最佳的玩法,那将是非常令人兴奋的。这是人们构建AI的原因之一。目前,许多人不想玩任何游戏与DeeMind的AI对手会面,更不用说与《星际争霸》的激烈对抗了。