英伟达发布超级计算机DGX SuperPO 用于自动驾驶汽车AI训练

文章来源：AI《汽车制造业》发布时间：2019-06-24

分享到

英伟达发布了超级计算机DGX SuperPOD，位列全球最快超级计算机第22名。它提供AI基础设施，可满足自动驾驶汽车部署的大量需求。

（图片来源：英伟达官网）

据外媒报道，英伟达发布了超级计算机DGX SuperPOD，位列全球最快超级计算机第22名。它提供AI基础设施，可满足自动驾驶汽车部署的大量需求。该系统由Mellanox互联技术在短短三周内建成，由96台英伟达DGX-2H超级计算机组成。具有9.4千万亿次浮点运算的处理能力，能够训练安全的自动驾驶汽车所需的大量深层神经网络。

自动驾驶汽车AI训练是最大的计算密集型挑战

一辆数据收集车辆每小时产生1TB的数据。这些数据乘以整个车队的驾驶年数，就会得到PB级的数据。这些数据用于训练算法，学习道路规则，并发现车辆运行的深层神经网络中的潜在故障，然后在连续的循环中对其进行再训练。

英伟达AI基础设施副总裁Clement Farabet表示，“AI领导力需要计算基础设施领导力。很少有AI挑战像训练自动驾驶汽车那样苛刻，这需要对神经网络进行成千上万次的再训练，以满足极端精度需求。DGX SuperPOD巨大的处理能力是无可取代的。”

DGX SuperPOD由1536台英伟达V100 Tensor Core GPU驱动，并与英伟达NVSwitch和Mellanox网络光纤互联，具有卓越的数据处理性能。该系统昼夜不停运行，优化自动驾驶软件，对神经网络进行再培训的周转时间可能比以前更快。例如，DGX SuperPOD硬件和软件平台训练ResNet-50仅需不到两分钟的时间。2015这款人工智能模型问世，当时最先进的NVIDIA K80 GPU耗时25天时间对其进行训练。DGX SuperPOD提供结果的速度要快18000倍。

其他性能水平类似的TOP500系统由数千台服务器组成，而DGX SuperPOD所占空间很小，大约比排名靠前的同类系统小400倍。英伟达DGX系统已被其他需要大量计算的组织所采用，包括宝马、大陆、福特和Zenuity、Facebook、微软和富士胶片。而且还被一些研究机构采用，例如日本理化研究所和美国能源部国家实验室。

参考构架创建自己的SuperPOD

DGX SuperPOD不仅运行深度学习模型速度快，而且由于其模块化的企业级设计，DGX SuperPOD的部署速度也非常快。这种规模的系统通常需要6-9个月的时间来部署，但DGX SuperPOD只需3周，工程师们遵循的是一种规定的、经过验证的方法。

建造DGX SuperPOD这样的超级计算机，帮助英伟达学会了如何为大型AI机器设计系统。这是超级计算技术的一项重要发展，它将巨大计算能力从学术界带到交通公司，以及其他希望使用高性能计算加速创新的行业。对于没有AI就绪数据中心，但希望使用英伟达SuperPOD构架来满足需求的组织，英伟达利用DGX就绪数据中心程序，为其提供简化的快速部署方案。该公司数据中心代管服务供应商支持企业客户构建部署基于DGX系统的世界级AI数据中心。