龙芯LA664性能追平AMDZen3

原创 铁君 2022-06-07 15:25


日前,龙芯发布了龙芯3C5000服务器处理器,并联合生态伙伴共同发布新一代国产服务器基础软硬件平台。这次发布会有两个亮点,一是3C5000处理器,二是3A6000仿真成绩。

龙芯3C5000弥补服务器不足

过去,龙芯一直致力于提升单核性能,没有盲目去堆核心数量。这种稳扎稳打的做法使龙芯在过去10年中IPC提升了3-4倍,在桌面CPU上成效立竿见影。

但在服务CPU上,由于国内ARM CPU往往采用“堆核战术”,也就是用64核、128核堆出一款服务器CPU,这导致龙芯的四核CPU虽然在单核性能上更好,但在多核性能上不如ARM CPU。这使龙芯在服务器CPU市场竞争中处于不利地位。

3C5000是龙芯第一款16CPU,采用完全自主的LoongArch指令架构,16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。就SPEC2006测试来看,单核定点浮点Base分均大于10/G,单芯片分值超过200。可满足通用计算、大型数据中心、云计算中心的计算需求。该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持。

3C5000最大特点是单核性能强,特别是unixbench这种看重单核核内存性能,多核加速比很低的测试,龙芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到这个成绩。从公开的数据来看,3C5000的性能在信创市场足够用了,而且16核的核心是使其部署比较灵活。另外,龙芯还会有3D5000,也就是把两个3C5000封装到一起的胶水32核芯片,主要针对一些对性能有更高要求的场景。

龙芯3A6000 IPC追平Zen3

相对于3C5000,铁流认为3A6000更加值得关注。相对于一些技术引进CPU在引进海外技术后CPU IPC增长缓慢,性能提高基本依靠购买更好的EDA工具和买台积电更好的工艺。龙芯一直致力于提升CPU微结构设计水平来提升CPU的性能。CPUIPC在过去10年中提升了3-4倍,这使龙芯可以在制造工艺上落后技术引进的某ARM CPU一代的情况下,依然可以依靠CPU微结构设计水平做到性能持平或略优于技术引进的某ARM CPU。当龙芯与引进的某ARM CPU采用相同工艺时,龙芯可以凭借其IPC上的优势在性能上领先某ARM CPU


3A6000和3A5000采用相同制造工艺,龙芯依靠其设计能力把CPU性能大幅提升。从仿真成绩看,定点相对于3A5000提升30%,浮点相对于3A5000提升60%这种提升是非常骇人的——如果仿真成绩与最终成绩相当,那么,3A6000 SPEC06单核定点Base分大于13/G,浮点Base分大于16/G如果3A50002.5G2.8G,那么,3A6000SPEC06单核定点Base分大于35,浮点将大于45这个性能对于信创和日常使用而言都已经明显过剩了。

(gcc,1165G7测试过程的频率大约是 4.2GHz,换算IPC 13.3/G。下图5600G的编译参数和1165G7基本是一样的。感谢guee帮忙测试)

gcc,int_base 48.6。测试过程中频率基本保持在 4GHz,也就是说 IPC 为12/G,由于测试还有调优空间,及5600G的缓存要比5600X少一半,可以认为调优后的Zen3可以达到13/G


作为参照,11代酷睿的IPC大约是定点13+/G12代酷睿IPC大约是定点15+/GZen3IPC大约是定点13/G,龙芯LA664能够达到定点13/G,浮点16/G,这已经追平或接近Zen311代酷睿。

当下,在同频性能上追平11代酷睿和Zen3已经很不错了,唯一的问题就在于主频了。当龙芯把7000系列把工艺换成5/7nm就可以把主频做到3G以上,可以实现 SPEC06单核定点Base分大于40,浮点Base分大于50这种性能已经达到英特尔、AMD市场主流水平,即便龙芯平台移植了3A大型游戏,龙芯7000系列CPU也足以应对。

结语

经过20多年的磨砺,龙芯终于把LA664提升到11代酷睿和Zen3的水平。LA664不仅超越了现有技术引进的ARM CPU,还超越了某些ARM CPU厂商PPT上的下一代CPU核。即便是当下国内首屈一指的海光,如果不把CPU IPC提升30%以上,面对LA664也要败下阵来。

回溯历史,在10年前,龙芯的IPC是不如技术引进CPU的,某技术引进ARM CPUIPC是当时龙芯的2倍左右。然后,技术引进是存在代价和陷阱的,往往是知其然不知其所以然,进而导致发展后劲不足。

相比之下,自主研发虽然在起步阶段慢一些,苦一些,累一些,无法像技术引进CPU那要快速拿出产品,但自主研发发展后劲更足,这一点从龙芯过去10年的发展就能看出来。

龙芯的性能已经不再是应用的障碍,唯一的障碍是软件生态。期待龙芯能以应用为阶梯,在合作伙伴的帮助下循序渐进构建可以与Wintel、AA体系相媲美的自主技术体系。


铁君 集成电路 人工智能
评论 (0)
  • 智慧家庭重大里程碑―Matter协议依照调研机构Fortune Business Insights报告指出,全球智能家庭市场在2022年价值802.1亿美元,预计每年20.1%的复合年增长率,将从2023年的939.8亿美元增长到2030年的3,382.8亿美元。在急速成长的全球智慧家庭市场,为了解决各厂牌生态圈互不相通的问题,亚马逊、苹果、谷歌、三星等主要参与者开发了新标准「Matter」,旨在简化智慧家庭生态圈,并透过Wi-Fi、Bluetooth或Thread传输连线,让各家智能家庭产品装
    百佳泰测试实验室 2023-12-22 14:00 160浏览
  •  德国的不限速高速公路,一直被很多人羡慕。现在国内也即将迎来不限速高速的“盛宴”了!     国内万众期待的首条不限速高速公路——杭绍甬高速,将于年底正式开通,该高速全长161公里,采用双向6车道设计,目前初定最高速度为150km/h,未来等到技术完善测试完成后,便不设最高限速。 不限速高速将会是一个全新的驾驶时代,车辆不再是束缚我们速度的障碍,而是我们追求更高速度、更远距离的自由翅膀。 你是不是已经准备好享受飞驰的快感了? 别急!在此之前,让我们先
    艾迈斯欧司朗 2023-12-25 16:20 26浏览
  • DT640系列硅二极管温度传感器选用了专门适用于低温温度测量的硅二极管。相比普通硅二极管,具有重复性好、离散性小、精度更高温度范围更宽、低温下电压相对高而易于测量等特点。所有此款温度计都较好地遵循一个电压-温度(V-T)曲线,因而具有更好的可互换性。很多应用中都不需要单独的标定。DT640-BC型裸片温度计,相比市场上的其它温度计,具有尺寸更小、热容更小、响应时间更短的特点。在尺寸、热容以及响应时间有特殊要求的应用中具有独特的优势。   以下是二极管温度传感器的测试
    锦正茂科技 2023-12-22 14:14 167浏览
  •         液氮恒温器是低温试验中常见的设备,其特点有:重量轻、使用方便、快速降温、温区大、控温准确等。同时配备了各种各样的低温样品台,可对粉末、薄膜、液体等各种形式的样品降温。涉及大量的低温试验,可满足电学、光学及磁学等试验。        光学恒温器可满足各种光学试验,样品处于真空中,恒温器配备2-4个光学窗口,窗口材质可更换。紧凑型缩小了外罩的直径,可配合电磁铁做磁场试验。恒温器外形可配
    锦正茂科技 2023-12-22 16:47 201浏览
  •     最近公司有一个项目选错了保险丝,试产阶段大批不良。保险丝是我知识较短缺的一环,这几天有空就看看,有一点收获,记录下来。    保险丝的技术标准是 UL 248 (北美) 和 IEC 60127 (欧洲,中国),我国标准是 GB 9364,等同采纳 IEC。    保险丝普遍要认证。认证机构是商业组织,有 UL,VDE,CQC等,做产品需要事先确认用户对认证的偏好。UL 248标准就是对提交UL认证的保险丝提出的技术规范和测试方法
    电子知识打边炉 2023-12-23 11:30 147浏览
  • 多年来,上海晶珩一直秉承创新理念,持续不断地推陈出新。在成功推出一系列基于树莓派 Raspberry Pi CM4 的工业计算机后,现推出了全球首款搭载 M.2 固态硬盘的 Raspberry Pi 5 工业计算机ED-IPC3020系列。ED-IPC3020搭载强大的Broadcom BCM2712 4核Cortex-A76 64位2.4GHz高性能CPU,同时配备多种I/O串行端口,并支持PoE。该系列提供两种内存配置:4GB和8GB LPDDR4X-4267 SDRAM,以满足不同性能需求
    树莓派开发者 2023-12-25 16:19 29浏览
  • 文章目录一、SD NAND特征1.1 SD卡简介1.2 SD卡Block图二、SD卡样片三、Zynq测试平台搭建3.1 测试流程3.2 SOC搭建四、软件搭建五、测试结果六、总结一、SD NAND特征1.1 SD卡简介  雷龙的SD NAND有很多型号,在测试中使用的是CSNP4GCR01-AWM与CSNP32GCR01-AOW。芯片是基于NAND FLASH和 SD控制器实现的SD卡。具有强大的坏块管理和纠错功能,并且在意外掉电的情况下同样能保证数据的安全。  其特点如下:接口支持SD2.0
    雷龙发展 2023-12-22 17:52 157浏览
  • 在低温领域中,经常需要对低温恒温条件下样品的各种低温性能,如热物理性质、机械性能、光学物理性能、磁热性能及超导性能等进行测试,这就需要提供一种实验装置来维持样品的低温恒温条件,而低温恒温器是一种能够提供低温恒温条件并与外界热绝缘的低温装置,它应用广泛,是进行低温实验的必要设备。小型液氮低温恒温器能提供稳定低温并与外界隔绝的真空环境,可广泛用于薄膜材料的光学,磁热,超导和电学性能研究领域。系统通过液氮杜瓦和基片加热装置使样品维持在所需的低温高真空条件下,既能通过外接光源将光线引入真空室并辐照在样品
    锦正茂科技 2023-12-22 14:40 171浏览
  • 导读:随着汽车电子技术的不断发展,车载网络已经成为汽车智能化和互联互通的关键组成部分。然而随着汽车系统的复杂性增加,CAN的带宽和数据处理能力已不足以满足快速增长的数据需求。为了应对这一挑战,虹科智能互联提出了基于车载网络捕获的全景数据处理方案。 方案背景 虹科电子科技有限公司是一家备受瞩目的高科技解决方案合作伙伴,致力于通过创新帮助客户成功。下属虹科智能互联事业部专注于汽车测试研发领域,在传统总线和车载以太网、TSN层面有着丰富的技术经验,旨在构建智能车载网络,以提高汽车系统之间的
    虹科汽车电子 2023-12-25 11:38 76浏览
  • 一、CPU概述 中央处理器(CPU)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。应用处理器SoC是在中央处理器的基础上扩展音视频功能和专用接口的超大规模集成电路,是智能设备的“大脑”,在智能设备中起着运算及调用其他各功能构件的作用。 CPU内部主要由运算器、控制器、寄存器三大部分组成。运算器负责算术运算(+、-、*、/基本运算和附加运算)和逻辑运算(包括移位、逻辑测试或比较两个值等);控制器负责应对所有的信息情况,调度运算器把计算做好;寄存器它们可用来暂存指令
    信而泰市场部 2023-12-22 16:19 117浏览
  • 疫情过后2023年,全国开发了,应是大好局面,但实际情况,电子工厂接的定单少,接到电子产品价格低,但电子产品质量要求特高,各大电子工厂因为没有收入,都在减人。太多工厂,国内一流企业都利润负增长,减人,不招人,找出路渡过难关。对电子工程师来说,2023年是最不好过一年,失业,减薪,离婚,不停搬家,信用卡逾期,网代逾期,房贷和车贷都逾期,经济不好,收入减少,2023年太不好过。我认识电子工程朋友,如下例例他们不好过日子的故事,感受一下苦难生活。    &nbs
    开发工匠 2023-12-24 23:52 102浏览
  • 12月2-5日,由新华社和海南省人民政府、中国品牌建设促进会等联合主办的2023中国企业家博鳌论坛在海南博鳌顺利举办。作为全球领先的无线通信模组和解决方案提供商,广和通受邀出席本届大会重要平行论坛-2023数字科技创新发展大会。本次分论坛以“强化数字赋能 加快产业转型”为主题,由新华网主办,高通公司协办,以开放包容的国际视野,强化创新驱动,分享前沿技术研发和应用发展。大会开始,高通公司中国区董事长孟檏进行“5G+AI开启数实融合新空间”的致辞。他表示,随着5G+AI进入千行百业,终端侧的生成式A
    物吾悟小通 2023-12-22 15:34 103浏览
  •  人生的第一等好事是? 请再猜一会,先容我闲话两句家常。 4月23日,这个日子有点妙,这一天既是意大利画家列奥纳多·达·芬奇的诞辰,更是英国文学家莎士比亚出生和辞世的纪念日, …… 冥冥之中艺术与人文的巧合,让4月23日成为“世界读书日”显得顺理成章又非它不可。 人民日报曾说:“读书是人生的第一等好事。”在妙语连珠里领略众生万象,于会心一笑中看清百态人生,非读书而不能往也。 正如马赛尔•普鲁斯特所说:“每个读者只能读到已然存在于他内心的东西。书籍只不过是一种光学仪器,帮助读
    艾迈斯欧司朗 2023-12-25 17:00 14浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦