比拼浮点运算速度
超算排行榜是这样“算”出来的
2019年06月21日 来源:科技日报
6月17日,新一期全球超算500强榜单出炉,入选500强的所有超算浮点运算速度都突破每秒千万亿次,中国超算也在前四占有两席位置。
普通计算机用指令运算速度衡量计算性能,而超算通常用浮点运算速度来衡量其性能。那么,什么是浮点运算速度,超算榜单为什么会选择浮点运算速度来进行比较?500强特别是前十的超算,科学家们都在想哪些办法让浮点运算速度越来越快?节能环保是对超算的另一衡量指标,超算要节能环保,最新的研究思路和实现策略又有哪些?6月19日,科技日报记者带着这些问题,走访了业内相关专家。
浮点运算速度 衡量超算性能的基准程式之一
“超级计算机被称为‘国家重器’,属于国家战略高技术领域,是世界各国竞相角逐的科技最高点。目前,高性能计算机领域市场竞争日趋激烈,美国、欧洲、日本和中国都在加速超级计算机的研发。”国家超级计算无锡中心主任杨广文说。
“浮点运算速度是指计算机系统每秒可以处理的浮点操作,通常用FLOPS来表示。”江南大学物联网工程学院副院长柴志雷副教授说,超算榜单选择浮点运算速度作为对比参考,是因为超级计算机主要用于科学计算领域,而这些领域的计算主要采用浮点数。
江苏理工学院计算机工程学院副院长范洪辉副教授告诉记者,浮点是指小数点位置不固定的数,它们执行的算术运算会消耗大量计算资源并可能产生误差,所以单位时间内浮点运算的次数,是衡量超算性能的基准程式之一。
常州信息职业技术学院软件与大数据学院钱银中博士表示,计算机只能存储和处理整数,通过整数乘以某个基数的整数次幂,是计算机表示实数尤其是小数的方法。
“ 浮点运算在运算数大小变化范围很大的场合可以实现很高的计算精度,是科学研究中的典型运算。大多数处理器中,都有专门处理浮点运算的浮点运算单元(FPU),FLOPS就是浮点运算单元的执行速度。”钱银中说。
中国高性能计算重点研发专项总体组组长、中山大学数据科学计算机学院院长钱德沛表示,选用浮点运算速度作为超算运算能力的评价标准,是因为科学工程计算软件中包含了大量的浮点数运算,浮点运算速度快的计算机通常也能够更快运行相关的科学工程计算软件。
把复杂的工作细分 超算界没有最快只有更快
超级计算机具有很强的计算和处理数据的能力,主要特点表现为高速度和大容量,配有多种外部和外围设备及高性能软件系统。现有的超级计算机运算速度,大都可以达到每秒一万亿次以上。
常州信息职业技术学院电子工程学院牛杰博士介绍,超级计算机的创新设计在于把复杂的工作细分并分配给不同的处理器。根据阿姆达尔定律,超级计算机的设计都集中在减少软件序列化、用硬件在瓶颈上加速。
目前,世界排名前十的超算,基本都是通过优化CPU(中央处理器)与GPU(图形处理器)之间的连接网络结构来提升GPU和协处理器性能,增加内存容量、扩充存储容量、增大网络带宽、借助运算加速卡等方式提升算力,最终在高性能计算系统、网络架构、系统软件、应用支撑等关键技术上取得突破。
柴志雷认为,提升超级计算机系统的浮点处理能力,不是单纯让浮点运算本身更快,而是从整个系统的角度,提升芯片工艺,优化系统架构、节点计算性能、存储访问性能、节点间通信等,从而使得系统的整体能力得到提升。目前,还经常采用在系统中增加加速器等方法,来获得更高计算效率。
钱银中介绍,实现超算的技术有大规模并行计算法,这种方法使多个处理器一起工作,每个处理器处理一个大问题中的不同任务。这种方法有两种实现途径:一种是网格计算法,多个计算机连接成分散的分布式结构,分属不同的控制区域,当需要计算机时从中择机选择;另一种是把处理器组织为关系紧密的集群。现代超算使用无限带宽系统、三维环面互连等技术,在大规模并行系统中提高集群的速度和灵活性。
国家超级计算无锡中心先进制造部部长任虎介绍,目前,提高浮点运算速度的方法主要有:提高芯片计算核心的时钟频率,增加芯片中计算核心的数量,通过多流水线、乘加融合(FMA)等技术增加单位时间内处理浮点运算的能力。
例如,曙光星云采用了自主研发的超并行处理体系结构、神威蓝光超算采用了大规模并行处理体系结构、天河一号采用了多阵列可配置协同并行体系结构、天河二号采用了自创的新型异构多态体系结构。此外,互联网络、存储、系统软件、应用软件、电源和冷却等系统都对超算的性能有着重要的影响,所以超算的世界里没有最快,只有更快。
Green500 超算界针对能效的排行榜
“节能环保是衡量超算的另一指标。超算中心是高性能计算机的规模应用,功率密度高,且长期运行在高负荷率条件下,耗能极高。通过优化软硬件配置确实能降低一部分功耗,但最根本源头是要研发计算性能优异且超低功耗的高性能处理器。目前,如何实现低能耗的超算是全球科学家研究的热点问题。” 范洪辉告诉记者。
牛杰介绍,超算界还有一种被称为“Green500”的排行,就是以计算机每瓦功耗可以提供的计算速率为指标,针对超级计算机能效的排行榜。
从历年的评测结果来看,刀片服务器一般比集群式服务器更节能,被广泛使用在超算系统中。Green500排名靠前的前三大系统都采用了PEZY加速器,而前十大的其余系统则使用NVIDIA GPU作为加速器。其中,PEZY系统采用的是液体冷却方式,也就是说,整个系统浸没在液体中,这比透过板载空气或水更具有节能效率。
超算深腾7000可以实时定位计算机的热源分布和结构特点,采用取消全部风扇、在每套机柜内安装喷淋蒸发冷却循环系统的方法,完成了产品的实施。该项目与传统的风冷、水冷技术相比,具有冷却效率高、温度分布均匀、低噪音、低功耗、可靠性高等优点。
相对风冷,中国的“神威蓝光”超算中心,利用复杂的水冷系统,实现CPU、内存、元器件的冷却并带走热量,几乎不损耗水且无噪音,先进环保,就像三明治夹心,水冷板被紧紧地夹在两块CPU板中间,无缝同步散热。
如何让超算实现低能耗?柴志雷认为,低功耗计算也是超级计算机研制的重要方面,从芯片制造、架构设计、软件设计多个层次都需要做大量的工作。比如在架构设计上,可以通过增加异构加速单元,提升系统的能效比。
范洪辉提出,重点应降低每个部件的耗能,尤其是CPU的能耗。同时要改善存储器件的设计,减少数据行进的距离;让高性能存储器向三维扩展而不是朝二维延伸;超算要与闪存结合,来改变电压或频率等节省功率;其次,可以采用包括能模拟大脑内神经元操作的神经形态电路或量子计算模式,创造出新型的计算机,比如生物计算机和量子计算机。
令人欣慰的是,我国正在通过多方面发力,让超级计算机更节能环保。例如,曾获中国专利奖优秀奖的“基于物联网技术的数据中心动力环境监测系统”,采用超低功耗的无线数据采集技术、三维建模及虚拟仿真技术、智能分析技术等,有效消除了机房内局部热点,解决了功耗特别大的难题,实现超算中心安全稳定和节能的目标。