利用人工智能强大的指数计算能力 结合数据中心规模的加

2021-11-15 15:32 来源:电子说

科学界和工业界开始利用人工智能强大的指数计算能力和数据中心规模的加速计算。

研究人员正在寻找能够将工作的计算性能提高数百万倍的“燃料”。

不断增长的数据导致计算需求激增。面对这种情况,他们不能完全依赖摩尔定律,这已经是过去的事情了。

因此,他们使用三个“螺旋桨”来获得所需的指数加速度。

垂直加速度和水平膨胀

加速度是现代科技的三大驱动力之一。在过去的十年中,随着五代GPU的进步以及在这些GPU上构建的完整软件堆栈,加速计算的性能提升了1000倍。

可扩展性是第二大驱动力,性能提升近10万倍。这是因为数据中心正在成为一个新的计算单元。

例如,在2015年,用开普勒图形处理器训练ResNet-50(流行的计算机视觉模型之一)花了近一个月的时间。今天,我们花了不到半分钟的时间在塞勒涅训练了同样的模型。塞勒涅是全球性能超强的工业超级计算机,包含数千个NVIDIA Ampere架构的GPU。

我们已经开发了许多关键技术来实现这种扩展,例如威震天软件,用于多GPU和多节点处理的Magnum IO,以及用于网络计算的SHARP。

开启深度学习的新时代

当今时代第三个也是最具革命性的驱动力是AI。

去年,深度学习在毫秒时间尺度上模拟了3.05亿个原子,揭示了新冠肺炎新型冠状病毒的内部结构。这项工作标志着,与15年前20秒内模拟100万个原子的最先进技术相比,它的效率提高了1000多万倍。

这就是为什么人工智能和高性能计算的结合正在席卷科学界。研究人员去年发表了近5000篇关于在arXiv上与AI HPC合作的论文,而五年前只有不到100篇论文。

英伟达研究人员最近的一篇论文。它展示了一种将神经网络与经典物理方程相结合的方法,可以将传统模拟的速度提高1000倍。

加快药物研发

如今,加速计算、大规模扩展和人工智能的结合正在推动科学计算和工业计算的发展。

在疾病治疗领域,加快药物研发是所有工作的重中之重。这项工作很有挑战性。开发人员需要解码3D蛋白质结构,了解其工作原理,然后找到可以防止其感染健康细胞的化合物。

使用x光和电子显微镜的传统方法只能解码大约25000种人类蛋白质的17%。DeepMind去年在其AlphaFold系统中使用了一套AI模型,实现了巨大的飞跃,预测了2万多种人类蛋白质的3D结构。

巧合的是,NVIDIA和加州理工学院的研究人员将机器学习和物理结合起来,创建了OrbNet,它可以加速几个数量级的分子模拟。创业公司Entos利用OrbNet将其蛋白质与候选药物化学反应的模拟速度提高了1000倍,在3个小时内完成了原本需要3个多月的工作量。

理解气候变化

类似的情况在其他领域也经常发生。科学家希望尽快用公里分辨率模拟全球气候,帮助我们适应不断变化的天气模式,更好地应对灾害。

然而,为了精确跟踪云和风暴的运动模式,科学家需要在一米的分辨率水平上进行研究。这需要高达1000亿倍的计算能力。

根据摩尔定律,我们要到2060年才能获得这种能力。因此,寻求百万倍性能飞跃的科学家们正在通过大规模加速计算和AI构建我们星球的数字孪生体。

数字孪生已经在许多行业得到应用。

研究人员已经在利用这些技术构建工厂和城市的数字孪生体。

例如,西门子能源公司使用运行在云中数十个GPU上的NVIDIA Modulus AI框架来模拟整个电厂。它可以预测蒸汽腐蚀影响引起的机械故障,减少停机时间,节约成本,保持运行。

这种模拟技术可以建立更高效的农场和医院,并帮助改造任何行业。这就是我们开发模数的原因:为了更容易创建人工智能驱动的、物理上精确的模拟。

这是我们在今天新的计算引擎的帮助下创造的另一个工具,可以实现下一个百万倍的飞跃。

数据中心规模的AI加速计算将带来数百万倍的性能提升,从而解决理解气候变化、研发药物、推动产业转型等问题。

延伸 · 阅读