|
在突破百亿亿亿次级障碍两年半后,美国能源部橡树岭国家实验室的 Frontier 超级计算机继续为其计算速度和性能树立新的标准。
HPE Cray EX 超级计算系统本周报告了解决问题速度的新高,该速度是在亚特兰大举行的国际高性能计算、网络、存储和分析会议(SC24) 上公布的 TOP500 中更新的。Frontier 团队使用双精度算法(即 64 位国际计算精度科学标准)实现了高性能 Linpack (HPL) 得分 1.35 百亿亿次浮点运算,即每秒 1.35 千万亿次计算。
ORNL 计算和计算科学副实验室主任 Gina Tourassi 表示:“Frontier 的新数据反映了 OLCF 计算和计算专家的巨大贡献,他们知道如何最好地优化前沿的高性能计算系统,以满足我们科学用户社区不断变化的需求。”
“在整个系统的生命周期中,他们从未停止突破界限。”
这一成绩让 Frontier 在 2024 年 11 月的 TOP500 榜单上位居第二,该榜单对全球速度最快的超级计算机进行了排名。Frontier于 2022 年 5 月首次以 1.1 百亿亿次浮点运算的速度登上榜首,成为第一台每秒运算次数超过一千万亿次的百亿亿次级性能的机器。
Frontier 所在的橡树岭领导力计算中心主任阿什利·巴克 (Ashley Barker) 表示:“我们的内部专家团队知道如何最大限度地发挥该系统的性能。他们是世界上最有经验的百亿亿次计算团队,他们在 Frontier 上运行了这项测试,同时这台机器还为用户运行了其他科学问题。”
Frontier 的速度提升标志着其速度提升了约 150 千万亿次浮点运算,即每秒 150 千万亿次计算——大致相当于上周退役的前身超级计算机 Summit 的性能。
ORNL 企业研究员兼 Frontier 项目主管 Al Geist 表示:“我们已经可以在 Frontier 上解决非常大的问题,也就是地球上最大的科学问题。今年,我们基本上已经掌握了另一台超级计算机(如 Summit)的强大功能。”
Frontier 依靠数千个节点组成的集群,每个节点都是一个独立的超级计算机,由一个 CPU 和四个 GPU 组成,通过超过 90 英里的电缆连接,使它们能够通信并共同解决大问题。Frontier 于 2022 年首次亮相,拥有超过 9,400 个节点,此后工作人员又增加了 400 个节点,目前总数超过 9,800 个。最新的 HPL 基准测试涵盖了 9,500 个节点。
Geist 估计,Frontier 得分提高的一半左右可以归功于新节点,这些节点曾被百亿亿次计算项目用于应用程序开发和测试。ECP 负责监督 Frontier 和其他百亿亿次计算机的软件应用程序开发,例如阿贡国家实验室的 Aurora 超级计算机和劳伦斯利弗莫尔国家实验室的 El Capitan 超级计算机,并于今年早些时候完成了这项工作。
除了 OLCF 计算专家获得的新节点和百亿亿次级经验之外,Frontier 还对其数学库进行了改进,这些数学库由 Frontier 的构建者 HPE 和 Frontier 所采用的 CPU 和 GPU 的制造商 AMD 共同开发。
除了更新的 HPL 数字外,Frontier 团队还记录了新的高性能 Linpack-Mixed Precision(HPL-MxP)得分,为 11.4 百亿亿次浮点运算,即每秒 11.4 千万亿次计算,运行在所有 9,800 个节点上。这比之前的 HPL-MxP 得分 10.2 百亿亿次浮点运算提高了 1 百亿亿次以上。
用于模拟癌细胞、超新星、冠状病毒或元素原子结构等现象的详细模拟需要 64 位精度,这是计算要求极高的精度标准。用于人工智能的机器学习算法通常需要的精度较低——有时只需 32 位、24 位或 16 位精度。
巴克表示:“这表明了 Frontier 在解决人工智能问题方面的能力。”
“我们从混合精度运行中获得的结果同样准确,但从数学上讲,它们是以不同的方式实现的。对于某些问题,双精度仍将是标准,但在这些潜在的速度下,我们预计会有更多研究人员开始探索他们可以通过混合精度实现什么样的结果。
“他们希望利用这种能力将解决问题的速度提高 10 倍,而我们的团队知道如何实现这一目标。”
Frontier 是一套 HPE Cray EX 系统,拥有超过 9,800 个节点,每个节点都配备第三代 AMD EPYC CPU 和四个 AMD Instinct MI250X GPU。OLCF 是美国能源部科学办公室用户设施。
|
|