龙芯LA664性能追平AMDZen3

原创 铁君 2022-06-07 15:25


日前,龙芯发布了龙芯3C5000服务器处理器,并联合生态伙伴共同发布新一代国产服务器基础软硬件平台。这次发布会有两个亮点,一是3C5000处理器,二是3A6000仿真成绩。

龙芯3C5000弥补服务器不足

过去,龙芯一直致力于提升单核性能,没有盲目去堆核心数量。这种稳扎稳打的做法使龙芯在过去10年中IPC提升了3-4倍,在桌面CPU上成效立竿见影。

但在服务CPU上,由于国内ARM CPU往往采用“堆核战术”,也就是用64核、128核堆出一款服务器CPU,这导致龙芯的四核CPU虽然在单核性能上更好,但在多核性能上不如ARM CPU。这使龙芯在服务器CPU市场竞争中处于不利地位。

3C5000是龙芯第一款16CPU,采用完全自主的LoongArch指令架构,16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。就SPEC2006测试来看,单核定点浮点Base分均大于10/G,单芯片分值超过200。可满足通用计算、大型数据中心、云计算中心的计算需求。该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持。

3C5000最大特点是单核性能强,特别是unixbench这种看重单核核内存性能,多核加速比很低的测试,龙芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到这个成绩。从公开的数据来看,3C5000的性能在信创市场足够用了,而且16核的核心是使其部署比较灵活。另外,龙芯还会有3D5000,也就是把两个3C5000封装到一起的胶水32核芯片,主要针对一些对性能有更高要求的场景。

龙芯3A6000 IPC追平Zen3

相对于3C5000,铁流认为3A6000更加值得关注。相对于一些技术引进CPU在引进海外技术后CPU IPC增长缓慢,性能提高基本依靠购买更好的EDA工具和买台积电更好的工艺。龙芯一直致力于提升CPU微结构设计水平来提升CPU的性能。CPUIPC在过去10年中提升了3-4倍,这使龙芯可以在制造工艺上落后技术引进的某ARM CPU一代的情况下,依然可以依靠CPU微结构设计水平做到性能持平或略优于技术引进的某ARM CPU。当龙芯与引进的某ARM CPU采用相同工艺时,龙芯可以凭借其IPC上的优势在性能上领先某ARM CPU


3A6000和3A5000采用相同制造工艺,龙芯依靠其设计能力把CPU性能大幅提升。从仿真成绩看,定点相对于3A5000提升30%,浮点相对于3A5000提升60%这种提升是非常骇人的——如果仿真成绩与最终成绩相当,那么,3A6000 SPEC06单核定点Base分大于13/G,浮点Base分大于16/G如果3A50002.5G2.8G,那么,3A6000SPEC06单核定点Base分大于35,浮点将大于45这个性能对于信创和日常使用而言都已经明显过剩了。

(gcc,1165G7测试过程的频率大约是 4.2GHz,换算IPC 13.3/G。下图5600G的编译参数和1165G7基本是一样的。感谢guee帮忙测试)

gcc,int_base 48.6。测试过程中频率基本保持在 4GHz,也就是说 IPC 为12/G,由于测试还有调优空间,及5600G的缓存要比5600X少一半,可以认为调优后的Zen3可以达到13/G


作为参照,11代酷睿的IPC大约是定点13+/G12代酷睿IPC大约是定点15+/GZen3IPC大约是定点13/G,龙芯LA664能够达到定点13/G,浮点16/G,这已经追平或接近Zen311代酷睿。

当下,在同频性能上追平11代酷睿和Zen3已经很不错了,唯一的问题就在于主频了。当龙芯把7000系列把工艺换成5/7nm就可以把主频做到3G以上,可以实现 SPEC06单核定点Base分大于40,浮点Base分大于50这种性能已经达到英特尔、AMD市场主流水平,即便龙芯平台移植了3A大型游戏,龙芯7000系列CPU也足以应对。

结语

经过20多年的磨砺,龙芯终于把LA664提升到11代酷睿和Zen3的水平。LA664不仅超越了现有技术引进的ARM CPU,还超越了某些ARM CPU厂商PPT上的下一代CPU核。即便是当下国内首屈一指的海光,如果不把CPU IPC提升30%以上,面对LA664也要败下阵来。

回溯历史,在10年前,龙芯的IPC是不如技术引进CPU的,某技术引进ARM CPUIPC是当时龙芯的2倍左右。然后,技术引进是存在代价和陷阱的,往往是知其然不知其所以然,进而导致发展后劲不足。

相比之下,自主研发虽然在起步阶段慢一些,苦一些,累一些,无法像技术引进CPU那要快速拿出产品,但自主研发发展后劲更足,这一点从龙芯过去10年的发展就能看出来。

龙芯的性能已经不再是应用的障碍,唯一的障碍是软件生态。期待龙芯能以应用为阶梯,在合作伙伴的帮助下循序渐进构建可以与Wintel、AA体系相媲美的自主技术体系。


铁君 集成电路 人工智能
评论
  • 一、前言随着自动驾驶技术的快速发展,庞大的测试数据和复杂的场景需求为性能与安全评估带来了巨大挑战。如何高效管理海量数据、挖掘关键场景,并满足以Euro NCAP(European New Car Assessment Programme,欧洲新车安全评鉴协会)为代表的严格评估标准,已成为行业亟待解决的核心问题。这不仅关乎技术研发的效率与精度,更是智能驾驶车辆进入市场、提升竞争力的关键前提。本文我们将围绕如何应对海量数据所带来的挑战进行探讨,分享提高场景测试与性能安全评估的见解。二、 场
    康谋 2025-02-13 10:44 127浏览
  • 在电路板Layout设计时,有时候会遇到高速差分信号对间或者对内需要交叉走线的情况,这不仅会导致Layout困难,而且交叉走线导致的via增加和绕线也会影响高速信号的信号质量。鉴于这个问题,一些高速差分信号在标准中就定义了其可以对内或者对间交叉连接,而不影响数据对接。现根据标准定义,将各个高速差分信号是否支持对间或对内翻转列出来,供设计参考。注:1. 列出的高速差分信号不全,后续陆续补充;2. 具体使用时,还需要咨询芯片供应商是否支持。USB2.0不支持对间和对内翻转USB3.0支持对内极性翻转
    durid 2025-02-14 08:23 80浏览
  • 前言非常感谢面包板社区和富芮坤,申请通过并收到了FR3068E-C开发板。特性FR3068E-C 芯片架构是属于双核架构,包括一颗独立的蓝牙核做蓝牙通讯以及另外一颗主核MCU,双核之间通过串口做HCI通讯,蓝牙核一般不对外开发,用户无需关注;内置128KB CRAM + 512KB SRAM,2MB Flash(根据芯片型号有不同大小配置);需外挂24MHz晶体时钟,系统主频最高可倍频至156MHz;工作温度为工业级 -40℃~105℃;有57个可编程IO(不同型号/封装会有所不同);支持两路C
    Batman 2025-02-12 12:43 303浏览
  • 在上一期的内容中,我们精心为大家整理了一份关于晶台光耦在各类通信(驱动)电路中应用的选型指南。考虑到不同通信速率下的应用需求存在显著差异,如何准确选择适合的芯片并在同时合理控制成本,成为了设计过程中至关重要的一环。因此,从本期开始,我们将通过一系列详尽的应用实例及其原理示意图,为设计者们提供切实可行且具有高度参考价值的解决方案。晶台光耦的性能优势晶台光耦作为一种高性能的电子组件,在单片机(MCU)与可编程逻辑控制器(PLC)的通信电路中应用广泛。其晶体管输出型光耦系列,能满足多种中高速通信需求,
    晶台光耦 2025-02-13 10:34 143浏览
  • 前言最近正好想要做一个定位器,正好可以用嘉立创的STM32F407的板子,还要淘晶驰的串口屏配合NEO-6M做一个GPS实时定位感觉设计到的知识点还是挺全面的,包括串口通信,还要定时器硬件NEO-6M采用串口通信,默认9600(可以通过软件改115200)搭配有源天线,在室外定位很好用淘晶驰很火的串口屏,通过自带的软件可以随便画界面,还是很方便的可通过 USART HMI 软件进行全界面可视化编辑、支持 “C 语言代码” 和 “0 代码” 双模式编程,广泛应用于工业控制、智能家居等领域的智能串口
    小恶魔owo 2025-02-13 23:05 98浏览
  • 前言基于 ESP32 设计开发的智能流动环境检测车,旨在克服传统固定监测方式的不足。该车能够在不同环境场景下灵活移动,深入到各个角落进行环境数据采集,大大拓展了环境监测的范围和灵活性。通过集成多种先进的传感器,如 BMP280 用于精确采集温湿度和气压数据,ESP32cam 摄像头能够捕捉直观的图像信息,再结合网络 API 获取的天气预报信息,实现了多源数据的综合采集与分析,为全面、准确地了解环境状况提供了丰富的数据支持。展示整车展示APP展示云端展示功能1.除草(12v割草机)2.环境检测3.
    小恶魔owo 2025-02-13 11:43 256浏览
  • 今日,长虹官宣旗下AI TV正式接入DeepSeek,并支持在“深度思考(满血R1)”和“快速响应”两个版本间自由切换,这意味着行业首个能深度思考的AI TV智能体已全面上线。据长虹相关负责人表示,目前,长虹电视用户终端的升级工作已全部结束,所有搭载了沧海智能体的长虹AI TV均已正式接入DeepSeek。通过深度融合DeepSeek的模型能力,持续升级用户的智能交互体验,真正做到让用户一次购买,就能享受产品的持续进化,让电视始终处于不断发展、永无最终形态的进化进程中。据了解,用户无需复杂的操作
    华尔街科技眼 2025-02-13 12:00 184浏览
  • 文:杜杰编辑:孙聪颖如果说2024年是手机的AI元年,三星应该是第一个站出来表示同意的,毕竟在ChatGPT热热闹闹的同时,三星S24是第一批“吃螃蟹”的。在经过了一年的AI试水之后,今年开年三星就率先在海外发布了进一步重构AI的S25,而今天该系列的国行版正式发布,大家最感兴趣的就是这部搭载原生AI的S25在国内的表现到底如何。无感的AI与去年S24小打小闹不同,今年S25在AI方面堪称是全面化、本地化,而从软硬件整合方面来看,显然AI已经成为S25的灵魂。经过这两年各路AI应用的训练,大家或
    华尔街科技眼 2025-02-13 19:30 130浏览
  • 我跟EET的相识,起源于一次国际电子工程会议,当时我是为了去听国际行业趋势和新技术产品,以公司海外英文名报名参加的,在非常不经意间,我在会场的群里发表了少许观点,没想到当场就有很多人加我微信,微信加得手软,有位VIP席位上的美国有排名的科学家(她当时在上海中科院任职)约了与我共进午餐,隔年这位美国科学家还带来了国际合作,我们公司与亚洲最大的技术顾问公司签了战略合作及一些实际合作项目。所以,我挺早就在EET面包板上了,只不过那些年我所在的公司的国际业务繁忙,还要忙着参加美国分公司的筹备,于是下班后
    牛言喵语 2025-02-14 02:15 79浏览
  • ​随着GNSS技术的不断进步,各类设备广泛采用该技术实现高精度定位,并推动了其在众多领域的广泛应用。对于关键行业如汽车制造和基础设施,设备的可用性和可靠性被视为基本准则,GNSS作为提供“绝对位置”信息的关键传感器,其稳定性和可靠性尤为关键。为此,中国已为汽车行业制定了详细的GNSS定位规范和行业标准。GNSS模拟器解决方案支持:BD 420005—2015 《北斗/全球卫星导航系统(GNSS)导航单元性能要求及测试方法》BD 420023—2019 《北斗/全球卫星导航系统(GNSS) RTK
    德思特测试测量 2025-02-13 15:35 136浏览
  • 文心一言准备免费,说实话,这个是好事情,但是他也会产生非常大的影响,总体来说,对技术的发展还是起到积极的作用。文心新苑为什么要免费呢?无非就是市场的原因,绝对不是文心一言不想利用这个AI赚钱。我分析下原因:1、市场竞争:在人工智能技术高速发展的背景下,各类AI产品层出不穷,市场竞争日益激烈。尤其是DEEPSEEK的出现,真是的非常重大的一个事件,作为同类产品,文心一言非常无奈的被迫的选择全面免费策略,旨在迅速提高用户量,争夺市场份额。通过免费使用,文心一言能够吸引更多用户,形成网络效应,进而提升
    curton 2025-02-14 10:30 54浏览
  • 文/Leon编辑/cc孙聪颖‍DeepSeek的持续火爆,正在向各个领域蔓延,包括智能终端、汽车智驾、制造业、金融和教育等。其中,DeepSeek在手机领域的应用最为引人关注。《华尔街科技眼》了解到,国产品牌努比亚则将深度整合DeepSeek,采用了系统级内嵌方式,用户在手机亮屏时可以直接与集成DeepSeek大模型的智能体对话,无需跳转应用。此前,华为小艺助手也接入了DeepSeek,但更接近于插件的方式,而非系统级的调用。DeepSeek大模型的优势在于用较低的训练成本实现高性能推理,并且开
    华尔街科技眼 2025-02-12 17:12 215浏览
  • 文心一言免费对于创业来说是一个很大的机遇,加油!虽然是一个很大的挑战,但是好处还是很大的。文心一言的免费开放为创业者提供了一个低成本甚至零成本使用先进人工智能技术的机会。在以往,创业者若想在项目中融入AI技术,往往需要支付高昂的研发或授权费用。而现在,他们可以直接利用文心一言的强大功能,如语言理解、生成能力、深度搜索等,来构建自己的产品或服务,从而显著降低创业成本。文心一言的全面免费开放为创业者提供了广阔的创新空间。创业者可以基于文心一言开发出各种创新的应用和服务,满足市场的多样化需求。例如,利
    curton 2025-02-14 13:37 50浏览
  • 案例概况ABB能源自动化公司通过宏集Cogent DataHub软件将电厂设施的数据实时传输到公司办公室,实现了OPC隧道/镜像解决方案,在电厂和公司网络之间建立了一个安全、可靠的连接,确保数据传输的高度安全,减少入侵风险。(一)应用背景1.确保电厂与公司办公室之间的安全数据传输ABB能源自动化公司为发电厂提供软件和控制系统,确保发电厂设备在最佳速度和效率下运行。在近期的项目中,ABB发现若能直接在公司办公室监控电厂的运行情况,将大大提高工作效率。于是ABB项目工程师Michele开始寻找一种可
    宏集科技 2025-02-13 16:38 119浏览
  • 蓝牙6.0是蓝牙技术联盟(Bluetooth SIG)最新推出的核心规范,而蓝牙信道探测(Channel Sounding)则是该规范中最重要的一项创新功能,可广泛应用在室内定位,距离检测及靠近感应等应用场景中。蓝牙信道探测是专为提高蓝牙设备测距的准确性与安全性而设计,不同于粗略测距的传统接收信号强度指示(RSSI)方法,蓝牙信道探测是一种更为精密的测距功能。现阶段,蓝牙技术已经成为人们生活中不可分割的一部分,每天都有数十亿的蓝牙设备运行在广阔的物联网领域之中,而蓝牙信道探测功能的出现则可为这些
    华普微HOPERF 2025-02-12 09:57 178浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦