源之原味

DeepMind 的新机器人学会了如何自学

 

本文来自thenextweb.com。源URL是: https://thenextweb.com/artificial-intelligence/2018/03/02/deepminds-new-robots-learned-how-to-teach-themselves/

以下内容由机器翻译生成。如果您觉得可读性不好, 请阅读原文或 点击这里.

机器人启示录时钟上的分针刚刚稍稍逼近午夜。DeepMind, 谷歌的姊妹公司负责这个星球上最聪明的人工智能, 只是教机器如何自己解决问题。

机器人不善于自己探索。AI 只存在于分析数据, 如神经网络, 决定某事是否是一个 热狗或不, 相对于物理机器人必须弄清的几乎无限数量的事情来说, 几乎没有什么比这更集中的了。

为了解决这个问题, DeepMind 为 AI 驱动的机器人建立了一个新的学习范式, 称为 "定时辅助控制" (SAC-X).'这个新范式给机器人一个简单的目标, 像 ' 清理这个操场 ', 并奖励它完成。

信用: DeepMind

根据 DeepMind 博客文章:

我们定义的辅助任务遵循一个一般原则: 它们鼓励代理探索其传感器空间。例如, 激活一个触摸传感器在它的手指, 感知一个力量在其手腕, 最大限度地在其本体传感器的关节角度, 或迫使一个物体在其视觉相机传感器的移动。

研究人员不告诉机器人如何完成任务, 他们只是用传感器 (最初关闭) 装备它, 让它摸索, 直到它得到正确的东西。

信用: DeepMind

通过探索它的环境和测试其传感器的功能, 机器人最终能够获得它的奖励: 一点。如果它失败了, 它没有得到一个点。

看着机器人手臂在一个盒子里摸索可能不会令人印象深刻, 特别是如果你看到类似的机器人 建筑家具.但令人惊讶的是, 这个特殊的机器并没有遵循一个程序或者做它设计的东西。这只是一个机器人试图找出如何使人类快乐。

这项工作很重要: 如果 DeepMind 或其他 AI 公司能完善它, 它将改变世界。现在, 没有一个机器人存在, 可以走/滚到一个陌生的房子和整理。做一张床, 清空垃圾, 或者放一壶咖啡, 都是 AI 非常复杂的任务。有一个几乎无限量的方式, 每项任务可以执行-更多的, 如果机器人被允许使用火焰喷射器, 并作出保险索赔。

在一天结束的时候, 我们还有很长的路要走 "罗西机器人" 从 "Jetsons."但是, 如果 DeepMind 有什么要说的, 我们会去的。这一切都始于一个机器人手臂学习如何玩积木本身。

想从世界顶尖专家那里听到更多关于 AI 的信息吗?加入我们的机器: 学习者跟踪TNW 会议2018.查看信息并获得您的门票这里.

下一篇:

有人做了一个 VR 的经验, 你是乔治 W 布什在浴缸里

Leave A Reply

Your email address will not be published.