中国领先的企业技术服务平台

返回贤集网 返回论坛
贤集网技术论坛APP下载
3 回复贴,共 1回复 收藏

最新超算第一名“神威太湖之光”到底有多牛?简单堆砌CPU能造出超算吗?


新一期全球超级计算机500强榜单于6月20日公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数首次超过美国,名列第一(中国有167台HPC入围TOP500,美国是165台)。

一台超算由什么组成?
超算系统可以分为软件系统和硬件系统两部分。
超级计算机硬件系统主要由高速运算系统、高速互连通信网络系统、存储系统、维护监控系统、电源系统、冷却系统和结构组  装设计等部分组成。具体来说:

高速运算系统负责逻辑复杂的调度和串行任务和并行度高的任务,可以是采用同构计算(纯CPU组成计算节点),也可以采用异构计算(CPU+加速器组成计算节点);

高速互连通信网络由infiniband、高速以太网、自定制互联机制构成,将所有计算节点连接起来,使其成为一个整体;

存储系统由内存和外存组成,负责数据交换和储存;

维护监控系统保障超算不死机、不出错,毕竟每隔几秒出一次错,死一次机,这种足以让超算的使用者精神崩溃;

电源系统包装能源供应;
 
冷却系统帮助超算降温,防止出现超算过热而造成的不良后果;
 
结构组  装设计是将上述系统装载到一起,在保障性能和稳定性的基础上,实现机柜体积最小。

超级计算机软件系统主要包括操作系统、编译系统、并行程序开发环境、科学计算可视化系统等四个重要组成部分。具体来说:
操作系统系统主要包括对同构技术或异构协同支持,高效能支撑扩张,基础服务内核,全局并行文件系统;
编译系统的功能是支持C、C++、Fortran77/90/95等编程语言,支持OpenCL、OpenMP、MPI等并行编程语言,支持编译优化;
并行程序开发环境的功能是提供程序接口,支持应用程序的调试和性能分析;
 
科学计算可视化系统由海量数据服务模块、并行绘制与显示模块和可视化映射与操作模块组成。
因此,运算系统、存储系统、互联系统、操作系统、基础库、应用软件,以及监系统控、冷却系统、电源系统等都是超算的重要组成部分。因此,一些人称因国产超算使用美国Intel的CPU,因而不具备技术含量,将CPU等同于超算的全部技术的说法显然是非常不科学的。

超算不是简单堆砌CPU

堆CPU也是一个技术活,体系结构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去。超算建设不是简单的搭积木式的堆砌CPU——即便堆砌了海量的计算卡,但受制于其他方面,比如高速互联网的技术水平,也会导致无法到达理论计算性能。
具体来说,高速互联网络的难点在于超算的计算节点之间传输的数据量巨大,延迟要求严格,当互联网络效率不足,就会导致数据拥堵,大幅降低超算整机系统效率。而超算的计算节点越多,对互联网络的要求也就越高。因此,即使想通过堆砌CPU来提升运算能力,也会受限制互联网络的性能,造成这种做法并不能无节制的提升超算的性能——受制于诸如互联网络以及其他方面的瓶颈,整机效率被拉低,导致实际性能并没有因为堆砌了更多的CPU而有所提高。


“神威太湖之光”牛在哪里

“神威太湖之光”刷新TOP500排行榜,依靠的是其强悍的双精浮点性能——其高达125PFlops双精浮点峰值和93PFlops稳定性能让世人惊叹。其实,除了拥有举世无双的双精浮点性能之外,“神威太湖之光”还拥有整机效率高,整机功耗低、性能功耗比高,整机体积小等一系列优点。

“神威太湖之光”超算拥有40960个计算节点,使用了上海高性能集成电路设计中心设计的国产众核芯片申威26010,采用28nm制程工艺,主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops,在双精浮点上完全追平了Intel最好的超算芯片。正是得益于国产众核芯片申威26010的强悍性能,加上良好的体系结构设计以及互联网络等核心部件,使超算拥有异乎寻常的高性能、高效率、低功耗、高性能功耗比和小体积:

高性能——神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65PFlops,由此可见,“神威太湖之光”在稳定性能是美国超算泰坦的5.2倍(泰坦很可能是美国现在顶尖的超算之一,完成升级的Stampede 2性能为18PFlops)。

高效率——“神威太湖之光”整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19% ,天河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难,“神威太湖之光”在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦,整机效率之高简直令人惊骇!

低功耗——“神威太湖之光”的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,“神威太湖之光”的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。

性能功耗比高——“神威太湖之光”的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌——天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算“京”整机性能功耗比为0.830/W,美国超算Mira 整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)……即便是全球Green500排行榜,“神威太湖之光”也能排至第三位。由于Green500排行榜第一和第二的超算只采用了低功耗版的Intel E5,性能非常弱,而即便是采用英伟达K80加速卡的超算,其整机性能功耗比也只有4.7G/W。因此,“神威太湖之光”在性能功耗比上显得格外耀眼。

小体积——“神威太湖之光”机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米。



回复
简单堆砌cpu的话哪个国家都可以威武
收起回复 0
太棒了
回复 0
66的。。。
回复 0
3 个回复,共 1
您尚未登录,登录后才可以发帖评论,快去 登录 吧!