北京快三开奖

  • <tr id="U9YkSO"><strong id="U9YkSO"></strong><small id="U9YkSO"></small><button id="U9YkSO"></button><li id="U9YkSO"><noscript id="U9YkSO"><big id="U9YkSO"></big><dt id="U9YkSO"></dt></noscript></li></tr><ol id="U9YkSO"><option id="U9YkSO"><table id="U9YkSO"><blockquote id="U9YkSO"><tbody id="U9YkSO"></tbody></blockquote></table></option></ol><u id="U9YkSO"></u><kbd id="U9YkSO"><kbd id="U9YkSO"></kbd></kbd>

    <code id="U9YkSO"><strong id="U9YkSO"></strong></code>

    <fieldset id="U9YkSO"></fieldset>
          <span id="U9YkSO"></span>

              <ins id="U9YkSO"></ins>
              <acronym id="U9YkSO"><em id="U9YkSO"></em><td id="U9YkSO"><div id="U9YkSO"></div></td></acronym><address id="U9YkSO"><big id="U9YkSO"><big id="U9YkSO"></big><legend id="U9YkSO"></legend></big></address>

              <i id="U9YkSO"><div id="U9YkSO"><ins id="U9YkSO"></ins></div></i>
              <i id="U9YkSO"></i>
            1. <dl id="U9YkSO"></dl>
              1. <blockquote id="U9YkSO"><q id="U9YkSO"><noscript id="U9YkSO"></noscript><dt id="U9YkSO"></dt></q></blockquote><noframes id="U9YkSO"><i id="U9YkSO"></i>
                企业空间 推销商城 存储论坛
                北京快三开奖全闪存阵列 IBM云盘算 Acronis 安克诺斯 安腾普 腾保数据
                首页 > 环球超等盘算机排行榜 > 注释

                异构零碎的负载平衡模子助力百亿亿盘算期间的气候研讨

                2020-03-31 23:22泉源:HPCwire
                导读:2020年前几个月,气候和睦候超等盘算旧事占据了主导位置,英国,欧洲中间隔气候预告中央和美国国度陆地与大气办理局公布了紧张通告。NSF支持的国度大气研讨中央(NCAR)盘算信息零碎实行室的技能开辟总监Richard Loft在Nvidia的GTC 2020的(假造)阶段停止了

                2020年前几个月,气候和睦候超等盘算旧事占据了主导位置,英国,欧洲中间隔气候预告中央和美国国度陆地与大气办理局公布了紧张通告。NSF支持的国度大气研讨中央(NCAR)盘算信息零碎实行室的技能开辟总监Richard Loft在Nvidia的GTC 2020的(假造)阶段停止了演讲,偏重夸大了NCAR在将气候和睦候超等盘算转移到十亿亿分之一级方面的停顿。

                Loft讨论了NCAR的最新一代气候预告模子(MPAS)。MPAS是与洛斯阿拉莫斯国度实行室协作开辟,是IBM及其子公司The Weather Company 客岁推出的环球高辨别率预告零碎(GRAF)的根底,该零碎 自10月开端投入消费。Loft指出,该团队的资金无限,而且严峻依赖先生的支持,他将GRAF称为到现在为止MPAS的“拥堵成绩”。 

                Loft说:“ NCAR,IBM和睦象公司之间的这种协作干系曾经活着界上很多地域(尤其是开展中国度)消费了具有三公里辨别率的模子,而这些地域还没有这类模子之前的决定。” 他说,这些新功用将为那些效劳缺乏的地域明显加强气候预告产物。

                并且,至关紧张的是:“据我所知,[GRAF]是现在天下上任何中央的第一个基于GPU的环球预测模子。”

                MPAS的目的

                在演讲中,Loft概述了NCAR在盘算天下靠近百亿期间时针对MPAS的目的-以及GPU和CPU之间的负载均衡怎样影响这些目的,而GPU已成为很多次要超等盘算机中越来越紧张的局部。Loft说:“因而,当我们在三年前开端这项任务时,我们便从试图为该模子完成很多中心功用的角度开端研讨它。”

                起首是功能的可移植性。Loft说:“我们盼望在GPU上取得最佳功能,但我们盼望坚持CPU的功能。” “我们不想为此捐躯,由于那是我们的面包和黄油。” 

                第二是弹性。他表明说:“我们需求订定一种战略来均衡混淆节点上的一切代码,如许关于CPU和GPU的任何组合来说,它的接线就不会太硬。”

                最初,研讨职员盼望移植最少的代码。劳夫特说,为此,他们“分流”了这一进程。他们将大少数物理和动力学代码移植到了GPU,但将辐射代码(这是经过大气通报太阳辐射的缘由)留给了仅CPU的代码。劳夫特表明说,他们做出了这个选择,由于辐射代码超越30,000行。Loft说,辐射是“昂贵的”:“假如您时时刻刻都挪用它,模子将被磨去世。” 侥幸的是,辐射也以很慢的工夫标准开展,因而从地道的物理程度来看,与模子的其他局部异步运转是公道的。

                研讨职员还保存了包括地表模子(该模子担任表明地皮与大气之间的水和能量转移)作为仅CPU的模子,由于该模子有20,000行以上的“分支代码”,而且运转工夫并不长。 (不外,不幸的是,Loft说,它必需同步运转)。

                在两台功用弱小的超等盘算机上停止完满修补

                异构零碎的负载平衡模子助力百亿亿盘算期间的气候研讨

                为了优化其新移植的模子,NCAR选择了一对超等盘算机。起首是NCAR本人的Cheyenne零碎,该零碎包括4,032个节点(每个节点带有Intel Xeon Broadwell处置器),总计313 TB的内存,由Mellanox EDR InfiniBand衔接。第二个是橡树岭国度实行室的Summit,它包容4,608个节点(每个节点带有两个IBM Power9 CPU和六个Nvidia Volta GPU),超越10 PB的内存,并与EDR InfiniBand捆绑在一同。 

                夏安和萨米特辨别以4.8和148.6 PB的万万字节跌落位居天下最弱小的地下排名超等盘算机Top500排行榜的第44位和第1位。选择了这两个零碎的缘由:夏安因其仅接纳CPU的同类设计而当选中,而Summit则提供了对GPU沉重的异构零碎将来设计的理解。Summit还与GRAF的基于IBM Power9的超等盘算机类似,后者具有84个节点,每个节点具有四个Nvidia V100 GPU。

                超等盘算机被用来协助NCAR找到资源分派的“戈迪洛克区”。在为辐射或静态或辐射分派CPU内核和/或GPU时,工夫上的不婚配能够会招致严峻的工夫和款项丧失。比方,分派给CPU的辐射太少,而支持集成的GPU(模子的其他局部)将不得不在等候CPU遇上时停息其任务。

                异构零碎的负载平衡模子助力百亿亿盘算期间的气候研讨

                 

                模子时序之间能够不婚配的阐明。图片由NCAR提供。

                 

                为了停止测试,研讨职员应用了夏安的76个CPU节点和峰会的76个混淆节点,以十公里的辨别率运转MPAS,从而为每个零碎上的每个节点投入了81,920个剖析点。他们测试了CPU和GPU分派的均衡,对称多线程的变革以及将辐射重新集成到模子中的工夫距离的变革。 

                在夏安,研讨职员发明该零碎是集成受限的,在通用模子义务上的功能绝对较差–因而,他们将每个CPU上的大少数内核分派给了通用模子,而很少分派给辐射(比例为2:1)。同时,在Summit上,他们发明由于GPU为处置才能做出了宏大奉献,因而零碎遭到了辐射的限定。终极,研讨职员发明,在集成模子公用的18个CPU内核(和GPU)与辐射公用的24个CPU内核之间获得了最佳功能。

                异构零碎的负载平衡模子助力百亿亿盘算期间的气候研讨

                Summit的MPAS设置装备摆设。图片由NCAR提供。

                 

                除了找到这些设置停止优化之外,研讨职员还发明运用GPU节点时MPAS的吞吐量是CPU节点的三倍。关于重新整合辐射的频率,Loft表现,在Summit上,他们发明“除非辐射很少被挪用,不然CPU功率缺乏以跟上六个GPU。”

                 

                接上去,NCAR团队将努力于进一步优化音讯通报,并将陆面模子移植到GPU,以开释更多的内核停止辐射处置。(Loft表现,他们正在思索将辐射代码移植到GPU,但这只是“最初的选择”。) 

                虽然Loft供认在可伸缩性和吞吐量方面尚需完成任务,但他表现该模子正在逐渐优化。Loft说:“这项任务仍在停止中,但是我们曾经拥有了完好的模子。” “这是一个很好的开端。”

                持续阅读
                要害词 :
                高功能盘算
                中国存储网声明:此文观念不代表本站态度,若有版权疑问请联络我们。
                相干阅读
                产物引荐
                头条阅读
                栏目热门

                Copyright @ 2006-2019 ChinaStor.COM 版权一切 京ICP备14047533号

                中国存储网

                存储第一站,存储流派,存储在线交换平台