向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

“神威”登顶世界TOP500超级计算机,CPU也是国产哦

时间:2016-06-21 作者:网络整理 阅读:
据最新消息,继天河2号之后,国产超级计算机“神威太湖一号(Sunway TaihuLight)”再次登顶世界TOP500,成为世界上运算速度最快的计算机。需要特别指出的是,这次神威太湖一号所使用的CPU也完全是国产的。

据最新消息,继天河2号之后,国产超级计算机“神威太湖一号(Sunway TAIhuLight)”再次登顶世界TOP500,成为世界上运算速度最快的计算机。需要特别指出的是,这次神威太湖一号所使用的CPU也完全是国产的。gqUEETC-电子工程专辑

相比天河2号的理论性能54.9PFLOPS(1PFLOPS=每秒1千万亿次),神威太湖一号的理论浮点性能达到了125.4PFLOPS,虽然TOP500没提,不过太湖一号应该是全球首个理论性能超过每秒10亿亿次的超级计算机了。gqUEETC-电子工程专辑

更为重要的是,神威太湖一号可不仅仅是性能强大。在美帝对我国高性能计算CPU实施封锁禁售策略之后,国内获得高性能计算芯片的来源基本被截断了(此前天河2号使用的是英特尔的Xeon系列处理器),由此神威太湖一号使用的全部是国产的CPU进行运算。据官方表示,中国是继美国、日本之后全球第三个采用自主CPU建成千万亿级别超级计算机的国家。gqUEETC-电子工程专辑

此外,TOP500排名第二的是此前已经连续6年蝉联冠军的天河2号,第三位的是美国的“泰坦”,第四到第十位分别是美国IBM公司的Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen及Shaheen II,他们都是老面孔了,只不过因为半路杀出的太湖一号而使得排名顺次下滑了一位。gqUEETC-电子工程专辑

最后需要指出的是:中国在TOP500超级计算机的总数方面也超过了美国,这次中国有167台入围TOP500,美国165台,欧洲105台,日本则只有29台。gqUEETC-电子工程专辑

神威太湖之光:不仅性能最强,能效也逆天

先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。
20160621-supercomputer-2TItle="20160621-supercomputer-2">gqUEETC-电子工程专辑

神威太湖之光超级计算机简介

在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。
20160621-supercomputer-3gqUEETC-电子工程专辑

神威太湖之光的能效比非常高

更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。gqUEETC-电子工程专辑

申威处理器:国产260核处理器

神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。
20160621-supercomputer-4
▲太湖之光使用的是申威SW26010处理器gqUEETC-电子工程专辑

太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。gqUEETC-电子工程专辑

这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
20160621-supercomputer-5
▲每张计算卡上有2个节点
20160621-supercomputer-6
▲每块主板上可以布置上下4张计算卡
20160621-supercomputer-7
▲32张卡组成1个超级节点,或者说256个节点
20160621-supercomputer-8
▲4个超级节点组成1组机柜
20160621-supercomputer-9
▲太湖之光的整体布局gqUEETC-电子工程专辑

20160621-supercomputer-10gqUEETC-电子工程专辑

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。
gqUEETC-电子工程专辑

gqUEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • 到底什么是架构革命?在AI芯片内部再多加一层AI! “我们作为人类,刚出生的时候都差不多。为什么20-30年后,每个人都变得不一样?因为我们在学习,我们接受教育。教育和学习让我们有了个性,那么能不能让芯片通过接受教育和学习,跟别人变得不一样?如果能做到这一点,芯片会越用越聪明,越用越离不开。”
  • 商业ISA浮浮沉沉,谁是RISC-V的“定盘星” 2010年,RISC-V项目创始人David Patterson、Andrew Waterman、Yunsup Lee和Krste Asanovic开始思考,既然在互联网、操作系统、数据库、编译器、图像等行业都有开放的标准、免费及开放的实现方式和私有化的实现方式,那么有没有可能在处理器IC领域也打造一个真正开源的、免许可、免授权费用指令集架构?未来,能否用模块化IC或者是用软件定义硬件的理念,辅之以社区的方式,去设计和维护相关标准?在这一背景下,RISC-V项目应运而生。
  • AMD领先英特尔发布全球首款7nm服务器芯片 AMD正式发布了代号Rome(罗马)的第二代EPYC霄龙处理器,拥有7nm工艺、Zen 2架构、最多64核心128线程、最多256MB三级缓存、八通道DDR4-3200内存(单路最大4TB)、128条PCIe 4.0总线等一系列先进特性,而且得到了更广泛的软硬件生态支持,令人瞩目。
  • 阿里平头哥发布“最强”RISC-V处理器玄铁910 阿里巴巴旗下半导体公司平头哥正式发布玄铁910(XuanTie910),号称目前业界性能最强的RISC-V处理器。据介绍,玄铁910可以用于设计制造高性能端上芯片,应用于5G、人工智能以及自动驾驶等领域,未来将开放其IP Core的FPGA代码下载……
  • 13年了,Zen 2架构终于让AMD达到Intel的高度? Intel这两年的日子真是相当不好过,也不只是和苹果在基带的事情上闹掰,和宣布放弃5G基带产品;而且在AMD于2017年推出Zen架构,终于彻底抛弃CMT以后,Intel居然在桌面处理器产品线上一时乱了阵脚。Jim Keller带领下Zen的猛然一击,竟然让近两年桌面处理器的性能获得了前些年从未有过的步进,Intel都让低压U用上四核了,这在摩尔定律逐渐停滞的当下还真是奇景。
  • AIoT不比手机,联发科:除了技术,还拼兄弟 联发科明显不仅仅满足于将“AI”用在手机市场,在7月10日举办的AI合作伙伴大会上,联发科携手包括小米、阿里巴巴、TCL、长虹、创维、旷视科技、海信、海尔、优必选等在内的多家人工智能及智能家居合作伙伴,把你能想到的地方,都加上了AI……
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告