广告

“神威”登顶世界TOP500超级计算机,CPU也是国产哦

时间:2016-06-21 作者:网络整理 阅读:
据最新消息,继天河2号之后,国产超级计算机“神威太湖一号(Sunway TaihuLight)”再次登顶世界TOP500,成为世界上运算速度最快的计算机。需要特别指出的是,这次神威太湖一号所使用的CPU也完全是国产的。

据最新消息,继天河2号之后,国产超级计算机“神威太湖一号(Sunway TaihuLight)”再次登顶世界TOP500,成为世界上运算速度最快的计算机。需要特别指出的是,这次神威太湖一号所使用的CPU也完全是国产的。NGOEETC-电子工程专辑

相比天河2号的理论性能54.9PFLOPS(1PFLOPS=每秒1千万亿次),神威太湖一号的理论浮点性能达到了125.4PFLOPS,虽然TOP500没提,不过太湖一号应该是全球首个理论性能超过每秒10亿亿次的超级计算机了。NGOEETC-电子工程专辑

更为重要的是,神威太湖一号可不仅仅是性能强大。在美帝对我国高性能计算CPU实施封锁禁售策略之后,国内获得高性能计算芯片的来源基本被截断了(此前天河2号使用的是英特尔的Xeon系列处理器),由此神威太湖一号使用的全部是国产的CPU进行运算。据官方表示,中国是继美国、日本之后全球第三个采用自主CPU建成千万亿级别超级计算机的国家。NGOEETC-电子工程专辑

此外,TOP500排名第二的是此前已经连续6年蝉联冠军的天河2号,第三位的是美国的“泰坦”,第四到第十位分别是美国IBM公司的Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen及Shaheen II,他们都是老面孔了,只不过因为半路杀出的太湖一号而使得排名顺次下滑了一位。NGOEETC-电子工程专辑

最后需要指出的是:中国在TOP500超级计算机的总数方面也超过了美国,这次中国有167台入围TOP500,美国165台,欧洲105台,日本则只有29台。NGOEETC-电子工程专辑

神威太湖之光:不仅性能最强,能效也逆天

先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。
20160621-supercomputer-2NGOEETC-电子工程专辑

神威太湖之光超级计算机简介

在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。
20160621-supercomputer-3NGOEETC-电子工程专辑

神威太湖之光的能效比非常高

更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。NGOEETC-电子工程专辑

申威处理器:国产260核处理器

神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。
20160621-supercomputer-4
▲太湖之光使用的是申威SW26010处理器NGOEETC-电子工程专辑

太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。NGOEETC-电子工程专辑

这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
20160621-supercomputer-5
▲每张计算卡上有2个节点
20160621-supercomputer-6
▲每块主板上可以布置上下4张计算卡
20160621-supercomputer-7
▲32张卡组成1个超级节点,或者说256个节点
20160621-supercomputer-8
▲4个超级节点组成1组机柜
20160621-supercomputer-9
▲太湖之光的整体布局NGOEETC-电子工程专辑

20160621-supercomputer-10NGOEETC-电子工程专辑

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。
NGOEETC-电子工程专辑

NGOEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • ARM新版Mali GPU简析:这次终于赶超高通和苹果? 前两天,ARM在Computex 2019大会上宣布推出新一代Cortex-A77 CPU新架构,随之而来的还有Mali-G77 GPU。ARM Mali GPU一直以来相较高通Adreno和苹果A系GPU,都属短板,这让三星和华为始终在图形计算能力,尤其是游戏表现上比较尴尬。
  • AMD:与中国合作仅止于第一代技术,盼贸易战早结束 在日前开幕的台北国际电脑展(Computex 2019)上,AMD首度就贸易战问题表态:与中国的合作关系目前仅止于第一代Zen架构技术,目前没有其他技术转授权的计划
  • Arm发布新架构,大家只关心麒麟990能安排上吗? 5月27日,Arm 宣布了其下一代架构设计方案,其中包括 Cortex-A77 CPU 和 Mali-G77 GPU,另外还有一个能效更高的机器学习处理器。麒麟处理器几乎是每一代Arm平台更新架构的首发平台,而这次首发换成了联发科,大家肯定想问——华为的下一代麒麟能用上新架构吗?
  • 展锐全网通4G虎贲T310方案横空出世 在2019年春季中国电子信息博览会上,紫光展锐率先在业内推出采用ARM大小核架构的4核全网通4G基带解决方案虎贲T310,性能全面领先竞争对手的4小核或8小核方案,可为全球千元以下的入门级4G智能手机提供旗舰级的用户体验。
  • 同是2021年:AMD用5nm造Zen 4,Intel刚开始10nm? 由于日前的法说会上台积电已经对外公开了 5 纳米工艺的相关细节。因此,如果一切顺利的话,AMD 就有可能在 2021 年使用 5 纳米工艺来打造 Zen 4 架构的 Ryzen 5000 系列处理器。
  • 一声叹息,华芯通走完3年历程黯然关门 贵州华芯通半导体技术有限公司召开了内部沟通会,宣布经股东的慎重决策,公司将于4月30日关闭,所有员工将在此之前离开公司。员工的离职补偿方案与大多数人心理预期基本一致,没有人表现出过激的反应。该事件又一次给国产芯片行业敲响了警钟,不掌握核心技术,单靠政府输血,绝非长久之计……
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告