模拟人形拉出一个完美的后空翻, 它做了一个月的模拟训练。
GIF: 伯克利人工智能研究

加州大学伯克利分校的研究人员使用了成熟的机器学习技术, 教模拟人形机器人执行超过25种自然运动, 从翻筋斗和车轮到高腿踢和霹雳。该技术可能导致更逼真的视频游戏和更敏捷的机器人。

计算机动画从来没有更好, 但仍然有足够的改进空间。如果我们要冒险穿越神秘山谷的另一边--那就是观众无法辨别模拟和真实的地方--这将是因为我们最终将虚拟人物与自然的表象和运动结合在一起。

为此, 加州大学伯克利分校研究生薛斌 "杰森" 彭, 连同他的同事, 已经结合了两种技术-运动捕捉技术和深层强化计算机学习-创造全新的东西: 一个系统, 教模拟如何以高度现实的方式执行复杂的物理任务。从零开始学习, 在有限的人类干预下, 数字人物学会了如何踢, 跳, 和翻转他们的方式成功。更甚的是, 他们甚至学会了如何与环境中的物体进行交互, 比如放置在他们的道路上的屏障或直接向它们投掷的物体。

Bot 表演各种高度动态和杂技技巧。
GIF: 伯克利人工智能研究

通常, 计算机动画师必须为每项技能或任务手动创建自定义控制器。这些控制器是相当粒状的, 包括离散技能, 如行走, 跑步, 翻滚, 或任何角色需要做的。用这种技术创建的动作看起来不错, 但是他们每个人都必须手工制作。另一种方法是专门使用强化学习方法, 如 DeepMind 的盖尔.这项技术是令人印象深刻的, 因为模拟的人形机器人学习如何从头做事情-但它往往产生 奇怪的, 不可预知的, 高度不自然的结果.

新的系统, 被称为 DeepMimic, 工作有点不同。DeepMimic 使用动作捕捉剪辑来 "显示" AI 的最终目标应该是什么样子, 而不是将模拟字符推到特定的终点目标上, 比如步行。在实验中, Bin 的团队从25多个不同的物理技能, 从跑步和投掷到跳跃和后空翻的运动捕捉数据, 以 "确定所需的风格和外观" 的技能, 作为彭 解释 在伯克利人工智能研究 (贝尔) 博客。

广告

结果没有一夜之间发生。虚拟字符绊倒, 跌跌撞撞, 并下跌平在他们的脸上反复, 直到他们终于得到了运动的权利。每种技能的发展需要一个月的模拟 "练习", 因为人形机器人经历了数以百万计的试验, 试图钉住完美的后空翻或飞行腿踢。但是随着每次失败的到来, 调整使它更接近理想的目标。

机器人通过多种技能进行培训。
GIF: 伯克利人工智能研究

利用这种技术, 研究人员能够生产出以高度逼真、自然的方式表现的特工。令人印象深刻的是, 机器人也能够管理从未见过的条件, 如挑战性的地形或障碍。这是强化学习的额外好处, 而不是研究人员必须专门研究的东西。

广告

"我们提供了一个概念上简单的 [强化学习] 框架, 使模拟字符能够从参考运动剪辑中学习高度动态和杂技技巧, 可以以 mocap 数据的形式 (即动作捕捉) 来记录从人的主题, "彭写道。"考虑到一个技能的单一演示, 如一个自旋踢或一个后空翻, 我们的性格能够学习一个强大的政策, 模仿的技能模拟。我们的政策产生的议案几乎无法与 mocap, "补充说," 我们正在向一个虚拟特技演员。

模拟龙。
GIF: 伯克利人工智能研究

为了不被超越, 研究人员使用 DeepMimic 来创造逼真的运动, 从模拟狮子, 恐龙, 和神话野兽。他们甚至创建了一个虚拟版的地图集, 人形机器人投票最有可能摧毁人类。这个平台可以被用来制作更逼真的电脑动画, 也可用于机器人的虚拟测试。

广告

此工作设置为在 2018 SIGGRAPH 会议 在8月。一个 印本纸 已过帐到 arXiv 服务器。