源之原味

深度思维的 ai 如何在星际争霸 ii 中击败顶级玩家

 

本文来自thenextweb.com。源URL是: https://thenextweb.com/artificial-intelligence/2019/01/25/how-deepminds-ai-defeated-top-players-at-starcraft-ii/

以下内容由机器翻译生成。如果您觉得可读性不好, 请阅读原文或 点击这里.

《深度思维》此前接受了 击败世界冠军 在中国的围棋游戏中.这也是 惊人地擅长国际象棋和 shogi, 并已擦去地板与最好的 a i 开发的那些游戏。

2017年8月, 这家阿尔法特拥有的公司决定承担一个更大、更复杂的挑战: 训练人工智能掌握星际争霸 ii.的 非常受欢迎的实时策略游戏 看到玩家负责一个外星种族, 收集资源, 开发技术, 并把你的军队与他人对其他人, 争取在虚构的科幻宇宙中的霸权。

在上个月的一系列比赛中, 深度心灵的 alphastar ai 被击败的高级专业人员 星际争霸 II 球员 tlo 和 mana;机器人在连胜之后只输掉了一场现场比赛。

这对 ai 背后的团队来说是一个巨大的成就。不像围棋和国际象棋这样的回合制游戏 星际争霸 II 实时地让玩家相互对立, 并要求他们制定和执行 "宏观" 作战战略, 同时还要处理采矿资源等 "微观" 任务, 为下一次围攻准备部队, 抵御即将到来的攻击。再加上亲球员 每分钟执行数百个操作 在竞争激烈的比赛中, 你给自己带来了严峻的挑战。

那么, 如何教 ai 在复杂的策略游戏中变得比地球上一些最好的人类玩家更好呢?deepmind 的方法包括训练 alphastar 大约200年的游戏价值。

该团队基本上创建了一个人工智能代理联盟, 该联盟依靠的是一个神经网络, 该网络依靠人类比赛回放中的数据 (每场比赛一般持续一个小时)。在7天的时间里, 经纪人们互相对抗, 测试策略, 向导致胜利的策略学习。

其中5名特工在催化剂地图上的五场比赛中与德国王牌球员 tlo 对决;双方都使用了 tlo 在大师级比赛的神族外星种族 (但他在虫族比赛中表现得更好)。阿尔帕星5次登顶。

之后, ai 又接受了一周的训练, 然后与擅长神族比赛的波兰球员马娜进行了比赛。阿尔帕星也在对阵他的比赛中赢了5次。

值得注意的是, ai 确实有一个优势: 与人类玩家不同的是, 他们必须不断地在地图上移动相机, 看看发生了什么, 并采取相应的行动--不管是命令部队建立防御部队, 还是指挥部队攻击敌人– alphastar 能够在整个比赛过程中查看整个地图区域。马娜能够击败一名 ai 特工训练了 7天, 被迫使用与人类玩家相同的相机主导的地图视图, 输给了 mana。

实验表明, 训练 ai 制定足够有效的策略, 在像这样复杂的事情上击败排名靠前的球员是可能的 星际争霸 II.但这不仅仅是模仿人类, tlo 解释说:

alphastar 采取了众所周知的策略, 并将其扭转乾坤。经纪人展示了我以前没有想到的策略, 这意味着可能还有新的打法, 我们还没有充分探索。

他的观察类似于 deepmind 的首席执行官德米丝·哈萨比斯, 他将该公司的 alphazero ai 的国际象棋打法描述为一种 不像人类或机器, 但更像一个 "外星人。这或许是这次练习中最引人注目的发现之一: 有了足够的数据和实验空间, ai 可以帮助发现新的、意想不到的解决难题的办法。

deepmind 的团队希望, 它在培训 ai 应对这些棘手挑战方面取得的进展, 能够为利用人工智能解决更紧迫的科学问题打开大门。

了解有关培训方法的更多信息 在深度心灵的网站上.

下一篇:

风险资本是真正的男性, 也是真正的白人--阿兰·汉密尔顿想解决它

Leave A Reply

Your email address will not be published.