向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

新版本Geekbench 5基准测试在改进的同时带来了偏差

时间:2019-11-20 作者:Jim McGregor 阅读:
处理器设计社区离不开基准测试,作为一种跨平台的基准测试,Geekbench在众多可用产品中最受欢迎。Geekbench 5相较于之前的版本做了一些重大改进,但新版本比以前少了一些系统级性能基准测试,甚至还额外产生了以前版本中没有的偏差。

Geekbench 5相较于之前的版本做了一些重大改进,但新版本比以前少了一些系统级性能基准测试,甚至还额外产生了以前版本中没有的偏差。lkREETC-电子工程专辑

处理器设计社区离不开基准测试,但两者的关系可谓是爱恨交织。作为一种跨平台的基准测试,Geekbench在众多可用产品中最受欢迎,它使用类似于常见应用程序的模拟工作负载来测试单核和多核CPU性能。Primate Labs最近发布了其最新版本:Geekbench 5。lkREETC-电子工程专辑

与旧版Geekbench 4相比,新版本所做的重大变革导致平台性能跑分发生翻天覆地的变化。一般新版本的改动都是为了解决了上一代版本的缺陷,并通常可以使之成为更完善的系统级基准测试。然而,Tirias Research分析提到的一些变化让我们摸不着头脑,令人质疑其中一些改动的价值所在。lkREETC-电子工程专辑

我们一致坚持认为,没有一个基准测试结果可以完美体现每个应用程序或工作负载的性能,所以,一般建议用多个基准测试来评估一个计算平台,无论是智能手机、PC还是服务器。要开发出一个完美的基准测试平台非常困难,因为每家公司都想得最高分,这导致他们在测试规则上玩弄花招。一些公司从中寻找可以被利用的规则,或想法优化平台来获取更高的分数。每隔一段时间,就会发现有公司因为操纵测试平台作弊。当然,我们希望随着时间的推移,基准测试会变得越来越完善。lkREETC-电子工程专辑

Geekbench 5的一些增强功能包括:对新Vulkan图形API的支持、对单个任务进行多线程处理(而不是处理多个单独的任务)、机器学习测试、增强现实、计算摄影学等,以及其他一些新兴的测试负载,用于更好地衡量现代CPU和GPU的功能特性。另外还增加了一些针对Apple的更改,例如支持macOS中的Dark Mode,以及对iOS未来版本的支持等。lkREETC-电子工程专辑

内存和电池测试被取消?

但是,新版本取消了一些系统级测试,包括内存和电池测试。内存性能对整体系统性能至关重要,而电池寿命对移动应用性能也是十分重要。对于具有较大缓存的处理器来说,内存测试的确存在问题,因为整个测试可以在不访问外部DRAM存储的情况下进行,但这似乎并不该成为将整个内存测试全部取消的理由,用更大的测试负载是可以解决这个问题的。Primate Labs指出新的应用可以更好地衡量内存和整体系统性能,但我们对于这种说法,表示怀疑。lkREETC-电子工程专辑

除了上述变化之外,新版本采用了非常精确的64位(双精度)浮点值来进行机器学习测试,而不是更常见的精度级别,例如用于推理的8位或16位整数、16或32位浮点数、或者较新的用于训练的bfloat16。实际上,这种改变与保持高度准确率的同时降低精度的趋势背向而驰,还会对移动平台的机器学习解决方案产生不利影响。lkREETC-电子工程专辑

不幸的是,从一个版本到另一个版本,性能测试数据之间并没有相关性,而且由于基线处理器的变化,所有平台上的测试得分都将明显降低。例如,通过Geekbench 4对英特尔酷睿i7-6600U双核/四线程Skylake处理器进行基线测试,得分为4,000。而通过Geekbench 5测试英特尔酷睿i3-8100四核/四线程Coffee Lake处理器,得分仅为1,000。lkREETC-电子工程专辑

分别通过Geekbench 4和Geekbench 5对相同的平台进行测试,可以发现Android OS和AMD处理器的性能数据变化,大于Apple操作系统或Intel处理器的变化(参看下表中的数据)。可以想见,新版本基准测试规则的变化似乎对Apple操作系统和英特尔处理器益处更大,而其中的主要原因可能是因为取消了有利于AMD处理器和Android操作系统的内存与电池测试。lkREETC-电子工程专辑

20191120-001.jpglkREETC-电子工程专辑
PC Perspective也做了一个类似的比较,用两个版本分别对英特尔处理器PC和AMD处理器PC进行基准测试,其差异也相当大 - 基于英特尔处理器的平台性能远高于基于AMD处理器的平台。lkREETC-电子工程专辑

尽管Geekbench 5确实有一些明显的改进,但似乎比之前的版本少了些系统级基准测试,甚至还产生了一些之前没有的偏差。Tirias Research仍然建议将其作为一整套基准测试中的一部分,但我们对新基准测试的整体有效性心存疑虑,如果有人仅仅引用Geekbench 5评分来说事儿,这是很令人质疑的。lkREETC-电子工程专辑

除了CPU性能,Geekbench一般还涵盖图形、内存、电池寿命和其它系统功能的测试。虽然其设计适用于任何计算平台,但通常被用作移动设备的关键基准测试之一,包括智能手机、平板电脑和移动PC。lkREETC-电子工程专辑

本文为《电子工程专辑》11月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅lkREETC-电子工程专辑

责编:Yvonne GenglkREETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • 谁仍在惧怕难搞的电容负载变化?斩波放大器? 零点漂移和斩波放大器具有复杂的输出阻抗,因此在输出端出现电容负载时很难稳定。我将展示如何使用带双反馈的Riso来补偿斩波稳定运算放大器的电容负载。
  • 5G毫米波空口测试挑战与解决方法 Sub-6GHz频段可以沿用4G时期的一些技术,与之相关的射频器件产业链也相对成熟,但由于该频段资源有限,业界将目光投向了资源相对丰富的毫米波频段。毫米波频段的优势是具备大量的可用频谱带宽、波束窄、方向性好等,但这也将给未来5G终端及基站的测试带来诸多挑战。本文将从测试角度探讨毫米波芯片带来的挑战及解决方法。
  • 华为5款手机被移出GeekBench跑分榜单 日前,国外知名跑分平台Geekbench更新排名名单,同时也公布了最新黑名单,有六款设备因人工干预上榜,五款华为,一款一加。型号分别的华为Mate 10 Pro、华为P20 Pro、华为Mate 10、华为P20、华为荣耀Play、一加手机5……
  • 芯片设计如何跑赢汽车电子系统的安全性和可靠性竞赛? 无论是此前自动驾驶汽车失控导致车毁人亡,还是近段时间发生的多起高端新能源汽车因为电池/电路原因导致自燃的事件,都不禁让人感叹,这些电子技术制成的创新汽车产品,什么时候才能让人开起来更安心,停在车库里更放心呢?在笔者看来,新时代的汽车电子如果要实现安全性和可靠性,主要有以下四个障碍需要跨越。
  • LitePoint 5G实验室近日台北正式落成 LitePoint 5G实验室配合已经推出的单机测试系统 IQgig-5G, 大量简化设定与校准时间,帮助客户快速解决问题。
  • 从电源管理到无线兼容,解决物联网测试面临的五大挑战 在未来几年,AI、5G、IoT和工业自动化(IIoT)的进步将加快行业变革和创新的步伐。跨行业的各种物联网传感器将用于自动数据传输和远程设备控制。在万物互联的时代,连接将变得司空见惯,到2020年,Gartner预计将有超过200亿台物联网设备投入使用。
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告