广告

新版本Geekbench 5基准测试在改进的同时带来了偏差

时间:2019-11-20 作者:Jim McGregor 阅读:
新版本Geekbench 5基准测试在改进的同时带来了偏差
处理器设计社区离不开基准测试,作为一种跨平台的基准测试,Geekbench在众多可用产品中最受欢迎。Geekbench 5相较于之前的版本做了一些重大改进,但新版本比以前少了一些系统级性能基准测试,甚至还额外产生了以前版本中没有的偏差。
ASPENCORE

Geekbench 5相较于之前的版本做了一些重大改进,但新版本比以前少了一些系统级性能基准测试,甚至还额外产生了以前版本中没有的偏差。FFCEETC-电子工程专辑

处理器设计社区离不开基准测试,但两者的关系可谓是爱恨交织。作为一种跨平台的基准测试,Geekbench在众多可用产品中最受欢迎,它使用类似于常见应用程序的模拟工作负载来测试单核和多核CPU性能。Primate Labs最近发布了其最新版本:Geekbench 5。FFCEETC-电子工程专辑

与旧版Geekbench 4相比,新版本所做的重大变革导致平台性能跑分发生翻天覆地的变化。一般新版本的改动都是为了解决了上一代版本的缺陷,并通常可以使之成为更完善的系统级基准测试。然而,Tirias Research分析提到的一些变化让我们摸不着头脑,令人质疑其中一些改动的价值所在。FFCEETC-电子工程专辑

我们一致坚持认为,没有一个基准测试结果可以完美体现每个应用程序或工作负载的性能,所以,一般建议用多个基准测试来评估一个计算平台,无论是智能手机、PC还是服务器。要开发出一个完美的基准测试平台非常困难,因为每家公司都想得最高分,这导致他们在测试规则上玩弄花招。一些公司从中寻找可以被利用的规则,或想法优化平台来获取更高的分数。每隔一段时间,就会发现有公司因为操纵测试平台作弊。当然,我们希望随着时间的推移,基准测试会变得越来越完善。FFCEETC-电子工程专辑

Geekbench 5的一些增强功能包括:对新Vulkan图形API的支持、对单个任务进行多线程处理(而不是处理多个单独的任务)、机器学习测试、增强现实、计算摄影学等,以及其他一些新兴的测试负载,用于更好地衡量现代CPU和GPU的功能特性。另外还增加了一些针对Apple的更改,例如支持macOS中的Dark Mode,以及对iOS未来版本的支持等。FFCEETC-电子工程专辑

内存和电池测试被取消?

但是,新版本取消了一些系统级测试,包括内存和电池测试。内存性能对整体系统性能至关重要,而电池寿命对移动应用性能也是十分重要。对于具有较大缓存的处理器来说,内存测试的确存在问题,因为整个测试可以在不访问外部DRAM存储的情况下进行,但这似乎并不该成为将整个内存测试全部取消的理由,用更大的测试负载是可以解决这个问题的。Primate Labs指出新的应用可以更好地衡量内存和整体系统性能,但我们对于这种说法,表示怀疑。FFCEETC-电子工程专辑

除了上述变化之外,新版本采用了非常精确的64位(双精度)浮点值来进行机器学习测试,而不是更常见的精度级别,例如用于推理的8位或16位整数、16或32位浮点数、或者较新的用于训练的bfloat16。实际上,这种改变与保持高度准确率的同时降低精度的趋势背向而驰,还会对移动平台的机器学习解决方案产生不利影响。FFCEETC-电子工程专辑

不幸的是,从一个版本到另一个版本,性能测试数据之间并没有相关性,而且由于基线处理器的变化,所有平台上的测试得分都将明显降低。例如,通过Geekbench 4对英特尔酷睿i7-6600U双核/四线程Skylake处理器进行基线测试,得分为4,000。而通过Geekbench 5测试英特尔酷睿i3-8100四核/四线程Coffee Lake处理器,得分仅为1,000。FFCEETC-电子工程专辑

分别通过Geekbench 4和Geekbench 5对相同的平台进行测试,可以发现Android OS和AMD处理器的性能数据变化,大于Apple操作系统或Intel处理器的变化(参看下表中的数据)。可以想见,新版本基准测试规则的变化似乎对Apple操作系统和英特尔处理器益处更大,而其中的主要原因可能是因为取消了有利于AMD处理器和Android操作系统的内存与电池测试。FFCEETC-电子工程专辑

20191120-001.jpgFFCEETC-电子工程专辑
PC Perspective也做了一个类似的比较,用两个版本分别对英特尔处理器PC和AMD处理器PC进行基准测试,其差异也相当大 - 基于英特尔处理器的平台性能远高于基于AMD处理器的平台。FFCEETC-电子工程专辑

尽管Geekbench 5确实有一些明显的改进,但似乎比之前的版本少了些系统级基准测试,甚至还产生了一些之前没有的偏差。Tirias Research仍然建议将其作为一整套基准测试中的一部分,但我们对新基准测试的整体有效性心存疑虑,如果有人仅仅引用Geekbench 5评分来说事儿,这是很令人质疑的。FFCEETC-电子工程专辑

除了CPU性能,Geekbench一般还涵盖图形、内存、电池寿命和其它系统功能的测试。虽然其设计适用于任何计算平台,但通常被用作移动设备的关键基准测试之一,包括智能手机、平板电脑和移动PC。FFCEETC-电子工程专辑

本文为《电子工程专辑》11月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅FFCEETC-电子工程专辑

责编:Yvonne GengFFCEETC-电子工程专辑

ASPENCORE
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • 通过形式验证找到更多Bug 本文将介绍在形式验证过程中找到最佳“钓鱼点”的方法。它利用功能仿真活动,从仿真轨迹中找到有价值的“钓鱼点”,进行形式验证。我们称这种方法为“河钓法”,它并不是从一个初始状态开始形式验证,而是从功能仿真轨迹中挑选出一些可疑的点,然后从这些“钓鱼点”开始形式验证。
  • 上海市委书记:欢迎应用材料加大在沪投资 上海市委书记李强与美国应用材料公司总裁兼首席执行官盖瑞·狄克森(Gary Dickerson)举行视频连线。李强表示,应用材料公司是全球领先的半导体和显示制造设备供应商,欢迎你们加大在沪投资,把更多新项目、新技术、新产品放到上海、落到临港……
  • 医疗诊断测试方案业者成为新冠疫情赢家 与新冠病毒的对抗是一场与时间的赛跑,每一分钟世界上都有不断新增的确诊与死亡案例。幸而有越来越进化的芯片上整合与自动化技术,实现了能快速提供可行动结果的定点照护(PoC)分子诊断测试设备...
  • 国产半导体检测设备再获国际大厂订单 芯片制造工艺发展到28纳米以下技术节点时面临着诸多挑战,但一项通常被忽视的技术变得异常困难,却又对工艺控制尤为重要,这就是半导体光学量测与检测技术。4月初,国内一家半导体检测设备厂商匠岭半导体官方消息显示,其大型半导体检测机台近日获得国际客户订单……
  • 富士康青岛高端半导体封测厂,2021年投产 4月16日,富士康官方微信号发文称,青岛西海岸新区与富士康科技集团于4月15日通过网络视频的形式开展“云签约”活动,富士康半导体高端封测项目正式落户。据了解,富士康将运用扇出型封装和晶圆键合堆叠封装技术,业务主要面向目前需求量快速增长的5G通信、人工智能等应用芯片,项目计划于今年开工建设,2021年投产,2025年达产……(头图自青岛新闻)
  • 模块化使检测更快速且更高效 新冠肺炎(COVID-19)的急速传播,使得检测效率备受考验。如何有效将嵌入式逻辑设计导入实验室分析仪并提升检测效率呢?现在越来越多人会想到使用计算机模块。
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了