源之原味

 

这篇文章来自 nvidia.com。原始 url 是: https://blogs.nvidia.com/blog/2018/09/05/parabricks-genomic-analysis/

以下内容由机器翻译生成。如果您觉得可读性不好, 请阅读原文或 点击这里.

任何有100美元和唾液样本的人都可以通过邮购获得一些有趣的遗传见解。但使用 DNA 进行研究或临床目的需要整个基因组-这意味着测序和处理所有30亿基对, 在我们的染色体内。

这些年来, 从2003年的第一个序列到目前不到1000美元的10亿美元, 这一成本大幅下降。但是, 排序只是过程的第一部分。

现在, 基因组洞察的瓶颈是按照排序的计算分析。它是在遗传数据中检测关键标记和异常值 (称为变体) 的过程。

Parabricks, 总部设在密歇根州安堡, 并 NVIDIA 成立 成员, 正在萎缩的时间, 这一分析从几天到一个小时。Parabricks 的总裁戴夫 Gregorka 说: "这是 GPU 上对基因组数据进行二次分析的第一个应用, 它完全符合最先进的分析管道。

这种加速使研究人员能够有效地分析来自全人群的基因组数据的趋势, 造福于个性化医学、药物发现和疾病治疗领域。这是一个游戏更换的医疗案件, 病人是在危急情况下, 和基因分析可以帮助医生快速诊断和制定治疗计划。

匿名 Sethia, Parabricks 创始人和技术领先者说: "通过分析多, 速度更快, 你可以更快地找到正确的问题和正确的解决方案。

需要速度

对整个基因组测序和分析的需求正在迅速上升。Sethia 说, 生成的基因数据量几乎每年都在翻倍。每个人类基因组样本约300兆字节, 计算需求迅速增加。

他说: "当有数以万计的病人, 成千上万的样本需要分析, 它可能需要几年使用基于 CPU 的处理。

Parabricks 团队开发了在 gpu 上运行的软件, 以快速分析基因组。它识别数据中的突变和变种, 帮助医务人员了解患者的基因水平, 并决定治疗的路径。

运行在单个 NVIDIA DGX-1 服务器, Parabricks 的软件可以处理超过1.2万整个基因组每年-这一壮举需要40个 CPU 服务器。Parabricks 还可以使用 AWS、Azure 或 Google 云在云上的 gpu 上运行其软件。

对于 GPU, 处理基因组数据与处理图像不同。

gpu 的并行处理能力很好地适用于图形, 因为每个像素都可以独立处理和计算-这是彼此相邻的一堆小问题。Sethia 说, 基因组数据也是一样的。来自 DNA 测序机的数据由微小的单个基因信息组成, 它们可以分开, 然后再串在一起。

其他快速基因组分析解决方案的准确性比当前的技术状态低。Parabricks 最新的算法, 因为它的软件, 它可以很容易地更新或定制的用户。对于其基因组分析, 启动使用 NVIDIA cuda, 包括该 cuDNN 深度学习库, 以及 TensorRT 推理软件。

Parabricks 推出了其 GenomeBricks 软件套件的初始版本, 以在3月选择客户, 并在全球范围内使用, 包括在新加坡、日本和泰国。该公司还致力于大型人口研究项目, 包括针对精密医学的国家倡议。

Leave A Reply

Your email address will not be published.