源之原味

 

这篇文章来自 nvidia.com。原始 url 是: https://blogs.nvidia.com/blog/2018/06/26/accelerated-computing-exascale-isc/

以下内容由机器翻译生成。如果您觉得可读性不好, 请阅读原文或 点击这里.

另一台超级计算机技术节目, 另一个性能记录, 本周的礼遇 橡树岭国家实验室峰会系统, 第一个粉碎通过 100 petaflop 屏障。

但是, 在法兰克福国际超级超级计算节目的标题背后, 是一个更广泛的故事, 关于超级计算机技术世界的板块是如何变化的。

随着摩尔定律的持续缓慢, 在 ISC, 加速计算明显地出现在将很快推动我们进入 exascale 计算时代的助推火箭。考虑: 在刚刚发布的 Top500 列表中, 大多数新的处理能力来自 GPUs, 它提供了95% 的峰会的触发器。


和 NVIDIA 沃尔特. 特斯拉核心 GPUs 提供这一权力, 使多精度计算, 融合了高度精确的计算, 以解决高性能的挑战, 高精度的处理需要深入学习。

事实上, Top500 列表显示, 世界上七强超级计算机的五现在都是 GPU 供电的, 包括美国、欧洲和日本的顶尖系统。

登顶加速计算

那些追踪大型两年级超级计算机节目的人, 最近几年的增长加快了计算速度。但在 ISC18, 它打破了转折点。

首脑会议显然是最有力的例子。以27648伏的张量芯 GPU 为动力, 测量了122千兆次的双精度性能。它的性能每秒相当于地球上的全体人口在一整年里做一次计算。

而且它的 AI 性能速度在 3 exaops 更加耀眼。这就像整个地球的人口在15年里做了一秒的计算。

平均和精益

多精度计算开辟了新的可能性世界。但如果 GPUs 也没有提供非凡的效率, 那将是有限的效用。

根据新的 Green500 列表, GPUs 现在拥有世界上20个最环保系统的17的电力。峰会不仅是世界上最快的, 也是世界上最有效率的系统, 在新成立的 "3 级" 类别中, 最严格的 Green500 列表中的级别.

在过去10年中, GPU 在橡树岭国家实验室的领导级超级计算机上帮助提高了50x 的电能效率, 从仅 CPU 的捷豹到 GPU 加速的泰坦和峰会。

这一切只是一个开始。实现 exascale 将需要更高的电力效率的突破。随着绿色500列表中系统的平均效率, 供电 exascale 将需要超过300兆瓦的能源, 相当于25万家美国家庭的电力需求。Exascale 要求10X 更高的效率运行在30兆瓦。

GPUs 已经达到了这个宏伟目标的一半, 并为到2021年有效的 exascale 提供了明确的途径。

通过节的切割

最新的顶级系统的想象处理能力使当今的研究人员有可能 解决一些科学棘手的挑战.

以遗传学为例。GPU 计算能力可以解开这样的谜题, 如人类基因组的亿万 AGCT DNA 对与帕金森氏症和阿尔茨海默病等破坏性疾病之间的联系。峰会在梳理个人基因以确定阿片类成瘾的敏感性方面已经取得进展--这是美国死亡的主要原因之一。

或取材料。超导材料可用于为 MRI 设备、粒子加速器或磁性聚变装置开发强大的科学磁铁。然而, 今天的版本是脆弱的, 很难制造, 只有在非常低的温度工作。峰会正在帮助模拟和发现新的超导材料的金属样的性质, 可以在室温下运行。

或者做癌症研究。防治癌症的关键是开发能够自动提取、分析和排序健康数据的工具, 以揭示以前在基因、生物标记和环境等疾病因素之间的隐性关系。与非结构化数据 (如基于文本的报告和医学图像) 配对, 深度学习算法在峰会上的规模将有助于为医学研究人员提供全面的观点, 整个美国癌症人口的细节水平通常只获得临床试验病人。

刚刚开始

我们认为这只是加速计算的开始。

每个国家都在竞相建造 exascale 系统。查看2025年的 Top500 列表, 你可能会看到超过一打这样的系统, 多精度加速计算平台的选择。相比之下, 在本周新的 Top500 列表中添加的所有系统都几乎没有达到总计算的 exaflop。这说明了未来的巨大机遇。

加速计算的一个最大的呼吁是, 它的全面创新-从体系结构, 到系统, 加速栈, 开发商, 以及半导体过程。这很重要, 因为, 随着摩尔定律的结束, 没有自动的性能增益。

在 NVIDIA, 我们一直在投资, 以加速整个 HPC 栈超过十年。

当我们开始使用第一个 CUDA 功能的 GPU 时, 它可以运行完全零的应用程序。整个宇宙的应用, 算法, 图书馆, 工具, 编译器, 操作系统, 和系统设计需要重新设计一个新的加速世界。建立一个芯片来标记数学处理器是很容易的。使这些处理器可用和可编程的世界高性能开发人员在整个堆栈上采取非凡的创新。

因此, 超过550个 HPC 和 ai 应用程序的 GPU 加速, 包括前15个应用程序和所有 AI 框架。在过去五年中, 开发此项工作的开发者数量接近 100万, 上升了10X。并与 最新 HPC 容器 在我们的 NGC 容器注册表上, HPC 用户现在只需点击、下载和运行最新的 gpu 加速应用程序, 或者在其系统上或在张量核心 gpu 供电的云。

环顾四周的弯道

现在我们正在快速的加速计算, 我们中的一些人正在环顾下一弯, 量子计算, 它使用量子比特, 或 "量子比特" 而不是1s 和0s 来处理信息。

这些理论是非常有趣的。在将来的某个时候, 可能会有杀手级的应用程序运行在量子计算机上, 特别是在密码学或量子化学领域, 利用非凡的处理能力来吸引极少的能量。

但在可预见的未来, 加速计算的势头似乎势不可挡。我们致力于在 HPC 中继续创新, 将 exascale 的承诺--以及它为科学所掌握的一切--置于我们的掌握之中。

Leave A Reply

Your email address will not be published.