源之原味

腾讯创建 AI 代理, 可以击败星际争霸2的骗子 AI

 

本文来自thenextweb.com。源URL是: https://thenextweb.com/artificial-intelligence/2018/09/20/tencent-created-ai-agents-that-can-beat-starcraft-2s-cheater-ai/

以下内容由机器翻译生成。如果您觉得可读性不好, 请阅读原文或 点击这里.

中国科技巨头腾讯研究人员 最近开发了一对 AI 代理, 能够击败星际争霸 II 的 (SC2) "AI" 在最高难度水平的完全匹配-使他们第一个这样做。

在最近发布的 白皮书 研究人员解释了两名特工的发展, 称为 TSTARBOT1 和 TSTARBOT2。第一个是一个宏级控制器代理, 它负责监视几个专门用于处理较低级别函数的特定算法。TSTARBOT2, 更健壮的两个, 是一个宏观微控制器组成的几个模块, 处理整个游戏的各个方面独立。

与所有基于神经网络的 AI 代理一样, TSARBOTS 被设计为模仿人类的思维过程。

玩星际争霸2不像玩围棋或下棋, 在那里所有的棋子都在桌子上和在平原上。SC2 球员经常看不到对方的单位, 直到他们 "侦察" 地图--在腾讯的实验中有 "战争迷雾" 的情况下。即使这样, 也有一个疯狂的信息量的球员观察和处理。

AI 的特工们都受过训练, 在深海礁上玩1V1 虫族和虫族的比赛, 这张地图传统上阻碍了神经网络试图战胜 CPU。在短短的两天内, 两位特工都可以在最难的环境下击败电脑:10 级。

酷的部分: 代理是在一个 GPU 上进行培训的。不太酷的部分: 它需要一个疯狂的数量的处理器来处理大量的数据, 它需要训练机器人上亿帧的视频。根据研究人员:

我们目前采取1920个并行参与者 (3840 个 cpu 横跨80台机器) 来生成重播转换, 速度约为每秒1.6万帧。这大大减少了训练时间 (从几周到几天), 并且由于探索的轨迹的多样性的增加, 也提高了学习的稳定性。

这项任务之所以如此困难, 其中一个原因是星际争霸2的三高难度设置的特点是 "AI" 作弊。不, 我不只是说, 因为我不能击败它-它实际上被称为骗子 AI。在最高级别, 计算机知道所有资源在哪里, 没有战争的迷雾, 并且总能看到地图上的每个单元。这是一个明显的不公平的优势, 设计是令人难以置信的挑战, 对手克服。

TSTARBOTs 没有任何好处, 一个人没有-它必须与游戏, 在鼠标点击和宏, 它 "看到" 一个人的完全相同的东西。虽然, 由于算法没有眼睛, 他们解释视频输出帧, 并将视觉信息翻译成它可以使用的数据。

要重新来过国际象棋, 并从上面进行比较, 还有一个事实, 那就是那些游戏是以回合为基础的。在 SC2 球员都在实时行动。夫妻之间, 有数以千计的单位在发挥, 它很快就变得几乎无法控制的所有, 但最有才华和熟练的球员-人或其他。

多亏了腾讯高级指挥官范式的发展, 它能够跟踪总体战略, 同时根据中低层算法 (或模块, 在 TSARBOT 2) 进行单元级管理, 机器人比电脑对手。

这意味着他们不仅仅是能够战胜最高难度水平, 他们主宰着它。Bot 的第二个赢得超过90% 的时间, 而第一个不太有效, 在71%。也许更有趣的是, 他们都表现出了击败铂和钻石水平的人的能力, 但人类赢得了比他们输掉更多的游戏。

如果你想知道当 TSTARBOT1 和 TSTARBOT2 去的时候会发生什么, 你可能会感到惊讶。每一次, 机器人一踢两个屁股。尽管 TSTARBOT2 可能更适合与人类竞争 (或者, 随着进一步的发展可能是), 并击败内置的 SC2 AI 以更高的双赢率, 它无法抵御1的攻击策略。

据研究人员说:

值得 (sic) 注意的是, 虽然 TStarBot1 能够成功地学习和获得击败所有内置 AIs 和 TStarBot2 的策略, 但它缺乏战略多样性, 以不断击败人类球员。在上述的测试与人类球员, TStarBot1 将无法赢得一旦人类球员开始知道 TStarBot1's 偏好跳虫拉什。

所以, 人类仍然是星际争霸2世界中最顶尖的狗, 但是说这不会持续很久是很安全的。腾讯计划将 TSTARBOTS 发布为开源代码, 你可以打赌你的底线他们会变得更好。

如果你想深入了解一下机器人的工作方式, 你可以查看白皮书 这里.这是一个令人惊讶的有趣的阅读。别忘了看看我们的 人工智能 部分!

下一篇:

罗技的 MX 因此几乎说服我切换到轨迹球鼠标

Leave A Reply

Your email address will not be published.