向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

有关麒麟810和华为nova 5,有些事华为没告诉你

时间:2019-06-22 作者:黄烨锋 阅读:
“因为夜的黑,光才被衬托得更美。”这话其实是用来形容华为nova 5系列手机的拍照能力的,不过在现如今这个国际环境大背景下,倒似更有深意了,也更符合华为现在的处境。华为消费业务手机产品线总裁何刚在华为nova 5系列产品发布会上,说出这句话的时候,发布会所在地的武汉还在下着小雨。

“因为夜的黑,光才被衬托得更美。”这话其实是用来形容华为nova 5系列手机的拍照能力的,不过在现如今这个国际环境大背景下,倒似更有深意了,也更符合华为现在的处境。华为消费业务手机产品线总裁何刚在华为nova 5系列产品发布会上,说出这句话的时候,发布会所在地的武汉还在下着小雨。CXAEETC-电子工程专辑

20190622-huawei-nova-1.jpgCXAEETC-电子工程专辑

 华为nova 5发布会的关键,除了易烊千玺和易烊千玺的粉丝们,就是海思麒麟810了。而AI又是麒麟810的重点,或者说华为nova 5手机的一切都是围绕着AI在进行的。而有关麒麟810的NPU——也就是AI核心部分,有些是华为在发布会上没告诉你的。CXAEETC-电子工程专辑

为什么7nm很重要?

华为nova 5和5 Pro两款手机的配置包括6.39英寸1080p OLED屏幕(覆盖108%的DCI-P3色域),后置四颗摄像头(1/2英寸4800万像素主摄,1600万像素广角摄像头,200万像素微距镜头,200万像素辅助深度计算摄像头),前置3200万像素摄像头,屏下指纹识别,支持NFC,支持40W功率快充(30分钟充85%的电),3500mAh电池,8GB RAM以及最高256GB存储容量。CXAEETC-电子工程专辑

两款手机不同之处就在于nova 5 Pro采用麒麟980 SoC,而nova 5为麒麟810。前者也就是先前华为P30/Mate 20这样的旗舰设备所用的SoC,而后者是首次问世——麒麟810是华为海思推出的第一个“8”系列SoC,也是本场发布会的真正主角。这样一来麒麟的7、8、9系列就补全了(实际上还有6系列)。从数字排位就不难发现,麒麟810是一颗定位中高端的移动SoC。CXAEETC-电子工程专辑

20190622-huawei-nova-3.jpgCXAEETC-电子工程专辑

 海思麒麟810的主要配置包括,7nm工艺制程,CPU部分8核设计:两个最高频率2.27GHz的Arm Cortex-A76核心,以及六个最高1.88GHz的Cortex-A55核心;GPU部分为定制的六核Mali-G52;NPU是华为自研的达芬奇架构;此外通信部分支持双VoLTE、双卡双待。CXAEETC-电子工程专辑

从CPU架构就不难发现,麒麟810的主要竞标对手是高通骁龙730。后者是高通在今年4月推出的一款SoC,其CPU部分就是两个2.2GHz的Kryo 470核心——基本相当于Cortex-A76小改款,外加六个频率更低的小核心。华为在2018年7月发布麒麟710之后,长时间没有针对这一档位更新SoC;尤其在高通去年10月发布骁龙675力压麒麟710之后,中高端移动SoC更新显得更加紧迫。CXAEETC-电子工程专辑

20190622-huawei-nova-5.pngCXAEETC-电子工程专辑

 华为也毫不避讳地在发布会上就各组件的性能,直接将麒麟810和骁龙730进行了比较。虽然这个定位没法像麒麟980那样用到DynamiQ结构,但7nm工艺制程仍是是麒麟810引以为傲的一部分:主流的移动SoC制造商,几乎不会将最先进的工艺制程下放给旗舰SoC之外的产品,比如高通现如今也只有骁龙855采用7nm制程,而最新的骁龙730所用的是三星的8nm LPP工艺——其实际效果,以及从三星自家旗舰SoC的die size来看,8nm LPP还是比台积电的7nm差不少的。CXAEETC-电子工程专辑

高通早年的传统也一直是旗舰SoC用新工艺,次旗舰用上一代或过渡工艺。何刚也在发布会上特别说华为是全球第一个有两颗7nm芯片的厂商,这一点还是具备了很大意义的。在谷歌宣布停止与华为合作后,GMS服务的缺失会让华为手机在海外市场大为挫败。肯花血本在次旗舰SoC产品,大约是华为期望提振国内手机销量的某种表现:推动非旗舰产品在国内的销量,进一步攻占中低端手机市场,并保证中低端设备的体验,麒麟810设备必然是未来真正走量的产品,销量应该也理应远高于麒麟980。CXAEETC-电子工程专辑

20190622-huawei-nova-7.jpgCXAEETC-电子工程专辑

 所以就频率来看,麒麟810的CPU大核心只比骁龙730多了0.07GHz,小核心多0.08GHz,但华为宣称麒麟810单核性能较骁龙730高出11%,多核则高13%。7nm的制程红利应该是其中的最重要因素,毕竟更出色的工艺在提升性能密度的同时,也可提升能效、控制发热,并将热平衡转折点进一步推高。CXAEETC-电子工程专辑

定制GPU性能强于骁龙730?

原本GPU性能和能效一直是麒麟SoC的短板,从高端到中低端皆是如此。麒麟810的GPU部分为Arm Mali-G52核心,这是G51的换代产品,定位仍然是中端,在Mali家族也无法与Mali-G7x系列相提并论。从NoteBookCheck的数据看,Arm Mali-G51MP4(麒麟710)与Mali G72MP12(麒麟970)的性能差距可能超过150%。CXAEETC-电子工程专辑

实际上,我们很少看到有手机SoC采用Mali-G5x GPU,大概也就海思上一代麒麟710 SoC用的是Mali-G51MP4(G51比较奇特,G51包含uni-pixel和dual-pixel纹理单元,Arm当时是用像素吞吐来标注MP后面的数字,所以这里的MP4很可能不表示shader核心数,但G52已经修正了这一问题)。CXAEETC-电子工程专辑

20190622-huawei-nova-9.pngCXAEETC-电子工程专辑
来源:ArmCXAEETC-电子工程专辑

Mali G52在微架构上的提升还是比较大的,一个核心内一个执行引擎的ALU lane数量翻倍。在Bifrost架构中,每条ALU lane包含一个FMA和一个ADD/SF计算单元;原本每个执行引擎由4个这样的lane构成,组成一个wavefront,G52则将这个数字提升到了8个——这种转变其实颇有点儿G77 Valhall的意思。Arm宣称,Mali G52的性能密度提升30%,也就是每平方毫米的fps帧率提升30%——这个程度的提升至少在Mali G7x面前还是有量级差距的。可以说华为nova 5和nova 5 Pro的图形处理性能会有很大差距。CXAEETC-电子工程专辑

但要跟Adreno对比,就比较麻烦了。高通骁龙Adreno GPU在架构上完全是个黑匣子,也就无法做出理论对比。好在NoteBookCheck曾对比过Mali G51MP4和Adreno 616的性能,这让Mali G52和Adreno 618的对比有了点儿依据。从NoteBookCheck的数据来看,Mali G51MP4比Adreno 616要弱40%左右,这还是个不小的差距。CXAEETC-电子工程专辑

20190622-huawei-nova-11.pngCXAEETC-电子工程专辑
数据来源:NoteBookCheckCXAEETC-电子工程专辑

高通宣称,Adreno 618相比616在性能方面提升了25%。那么基于Mali G52的性能密度提升30%,麒麟810在GPU方面的绝对性能要超越骁龙730,难度感觉还是有点大的。但华为提到这是“定制的”Mali G52,shader核心数量为6,而Arm官方推荐的是1-4个核心,性能的理论情况就变得比较复杂了。CXAEETC-电子工程专辑

另外不要忘记,发布会上提到了GPU的负载优化技术Gaming+。何刚只说这种技术更底层,是“GPU底层驱动升级”,以及AI调频调度——提到AI,它听起来就和GPU Turbo很像了。早前有种技术通过硬件计数器监听GPU利用率,调整DVFS,这种技术是不及GPU Turbo精度高的——GPU Turbo配合了渲染管线,对于未来帧的预测比之更细粒度。我们猜测Gaming+可能融合了这种更被动和低精度管线的机制。CXAEETC-电子工程专辑

20190622-huawei-nova-13.jpgCXAEETC-电子工程专辑

 发布会上何刚呈现了游戏《崩坏3》的帧率成绩。《崩坏3》以往一直都是比较吃GPU渲染能力的游戏。从华为官方的数据来看,麒麟810玩这款游戏时,帧率基本稳定在60fps,而骁龙730则在40fps上下剧烈震荡,有时可能掉到30fps以下。这很大程度可能是Gaming+和GPU Turbo的功劳。CXAEETC-电子工程专辑

GPU Turbo的本质就是采用神经网络,针对每款设备、每款游戏的DVFS动态电压频率调整优化控制。这是一种典型利用深度学习的技术,在应用和GPU驱动之间设一个监听层,监听渲染调用,试图找到游戏每个时刻硬件资源最佳利用的甜蜜点。不过其缺陷就在于,针对每款游戏都需要事先在云端进行training,然后通过固件推到手机端,在手机端通过NPU来inferencing。CXAEETC-电子工程专辑

20190622-huawei-nova-15.jpgCXAEETC-电子工程专辑

 至于华为宣称GFXBench霸王龙和曼哈顿常规测试项测试成绩,麒麟810较骁龙730分别有15%和44%的领先,就让人感觉有些惊讶了,可能是核心数超Arm官方预期所致,这就让我们非常好奇这颗GPU的能效比情况如何——毕竟Arm提到Mali G52的能效比提升仅15%。CXAEETC-电子工程专辑

所以麒麟810的这颗GPU未来还是很值得研究的,至少华为没有按照Arm公版套路来,就定制和改动这件事,华为看来的确是预备在GPU方面发力的。未来的麒麟SoC,GPU部分可能会出现更有趣的变化。定制的G52很可能只是个开始。CXAEETC-电子工程专辑

麒麟810的AI性能比980还强?

华为在AI,或者神经网络的应用上真可谓十分激进,GPU Turbo这种技术就是个例子。这次麒麟810也有AI专核,也就是NPU了,早前的麒麟710是没有的。更重要的是,这次的NPU是华为自研的达芬奇架构,而不再是寒武纪的NPU。这原本也是顺理成章的,去年10月,华为就发布了两款名为昇腾的AI芯片,当时就提到“全新自研Da Vinci计算架构”,也就是达芬奇,不过它们并不应用于手机。昇腾310在宣传中就提到集成张量、矢量、标量等多重计算单元。CXAEETC-电子工程专辑

实际上,NPU在AI或者叫卷积神经网络中扮演着本地推测(inferencing)的角色。AI神经网络工作分成两部分,其一是模型训练(training),这个类型的工作量极大,且精度要求高,得是服务器才行,比如谷歌TPU就干这个——GPU Turbo的游戏模型训练就是这部分工作;其二就是模型推测——它对性能要求低很多,精度也更低,也就能放到本地来执行了。CXAEETC-电子工程专辑

20190622-huawei-nova-17.jpgCXAEETC-电子工程专辑

 高通在这方面的思路一直是,通过DSP、GPU来完成inferencing工作,而没有必要做个专门的硬件单元,包括骁龙855实际上都是依靠多个现有单元联合实现AI运算(不过骁龙855的DSP内部多加了张量加速器)。高通在启动AI SDK方面的工作也是比较早的。GPU和DSP在执行这种重度并行工作时相比CPU的确有优势,所以Arm推的Mali GPU架构都在宣传机器学习ML inferencing性能,包括麒麟810这次用的Mali G52,Arm也特别提升了其ML性能——虽然在麒麟810中,这部分能力大概也不会发挥多少。CXAEETC-电子工程专辑

而华为、苹果则认为,DSP和GPU是不够的,尤其在张量立体化运算方面。所以AI专核NPU就诞生了。就这个角度来说,麒麟810的AI跑分数据超越骁龙730其实是理所应当的,超越骁龙855则让人比较惊讶了——毕竟骁龙855的DSP在张量计算方面也相当出色。要知道,就苏黎世联邦理工学院的AI Benchmark来看,骁龙855的AI跑分成绩实际是优于麒麟980的。CXAEETC-电子工程专辑

20190622-huawei-nova-19.jpgCXAEETC-电子工程专辑

 发布会上,何刚并没有对比麒麟810和麒麟980的NPU算力成绩。如果何刚公布的这个排名属实,那么麒麟810的AI性能实际是优于华为自家旗舰麒麟980的。为此,我们去AI Benchmark官网查看了目前的跑分排名数据,单就手机设备的成绩来看,与华为在发布会上给的数据基本一致——不过这个成绩实际考察的是设备的综合AI性能,比如还关乎存储性能,而且还涉及到设备的某些配置模式,例如nova 5有高性能模式。CXAEETC-电子工程专辑

20190622-huawei-nova-021.pngCXAEETC-电子工程专辑
数据来源:AI-BenchCXAEETC-电子工程专辑

但即便只看处理器本身,这个排名其实依然是不变的,且麒麟810的确是比本家的980还要强悍。这里尤为值得一提的是,AI Benchmark主要针对的是Android的NNAPI,而非SoC制造商自家的SDK工具和API(比如海思的HiAI API,高通的SNPE SDK)。CXAEETC-电子工程专辑

而NNAPI是需要华为、高通这样的SoC制造商底层驱动给予支持的,如果说它们未能支持NNAPI,则计算任务就会转给CPU,那么效率就会低下很多了。比如高通855的张量加速器模块,在Android Q之前就没有支持NNAPI。所以AI基准测试实际也有待进一步完善,或者说手机AI专核目前的发展程度还比较初级,未来正要迎来一波爆发。CXAEETC-电子工程专辑

这么强的AI性能,是噱头吗?

有这么强悍的NPU,又能用来做什么呢?前面提到GPU玩儿《崩坏3》满帧是个例子。NPU实际上还可以帮助CPU和存储更快地通讯、预测GPU负载过高及时调整、追踪手机运行帧率、流畅度和触控输入的实时变化,来进一步提升手机的使用体验。还有一些则是华为在本次发布会上提到的各种细枝末节,包含了:CXAEETC-电子工程专辑

- AI提升4800万像素的解析力CXAEETC-电子工程专辑
- AI视频拍摄防抖CXAEETC-电子工程专辑
- AI视频与照片HDRCXAEETC-电子工程专辑
- AI让身材秒变大长腿CXAEETC-电子工程专辑
- AI电影留色CXAEETC-电子工程专辑
- AI智慧视频剪辑CXAEETC-电子工程专辑
- AI语音助手小艺CXAEETC-电子工程专辑
- AI美音CXAEETC-电子工程专辑

尤其是最后一项“AI美音”,实际就是用KTV软件唱个歌,手机智能修音,优化唱歌节奏和音准,就算你唱歌很差也能拯救。现场演示时,所有观众都自发赞叹和鼓掌,可见这还是个刚需。就前面这些列出的AI应用,不难发现目前AI的应用还集中在在视觉AI,比如拍照、拍视频。CXAEETC-电子工程专辑

20190622-huawei-nova-23.jpgCXAEETC-电子工程专辑
歌声不动听?AI能自动后期!(此处有欢呼声)CXAEETC-电子工程专辑

它们听起来好像都不够高大上。但AI在computational photography领域的应用原本就是悄无声息的。举个简单的例子,谷歌针对拍照、拍视频一直都在进行机器学习研究。比如针对视频拍摄的防抖,除了利用陀螺仪、光学防抖传感器来获取视频拍摄时的动态源数据,随后对动态画面进行剪切,当场景本身很复杂包含大量深度层级的时候,视觉的AI分析就能极大地减少处理痕迹。现在拍视频越来越稳,实际就有AI的功劳。这应该和华为的AI视频拍摄防抖比较类似。CXAEETC-电子工程专辑

何刚在发布会上特别对比了华为nova 5拍照的细节胜于竞品。他说同样是4800万像素的图像传感器,且型号一致,但AI能给出更多的细节。我们猜测nova 5的这颗图像传感器应该是来自索尼的IMX586——这也是很多手机在用的一颗CIS。而细节更多,本质上更像是“AI拍月亮”的延续,或者结合了ISP做多张堆栈。另外还有拍摄视频时,仅有画面主体人物保留色彩,周围都是黑白的;在夜晚自拍时,即便逆光,通过识别拍摄主体、剥离拍摄主体,结合多张堆栈实现高动态HDR…这些都是典型的深度学习应用场景了。CXAEETC-电子工程专辑

CXAEETC-电子工程专辑
20190622-huawei-nova-25.jpgCXAEETC-电子工程专辑
主播们的福音:秒变大长腿,毫无PS痕迹CXAEETC-电子工程专辑

20190622-huawei-nova-27.jpgCXAEETC-电子工程专辑
借用AI,实现前置摄像头的夜间HDRCXAEETC-电子工程专辑

20190622-huawei-nova-29.jpgCXAEETC-电子工程专辑
AI其实是在悄无声息间解决一些体验痛点CXAEETC-电子工程专辑

一直以来不都是隐于生活,并令其成为生活习惯的组成部分,才是最好的科技吗?这是现如今AI在悄无声息改变生活方式的一种表达,就是让手机使用的体验变得更好,在悄无声息间变得更好。而AI实际的发展领域可能还非常多,GPU Turbo之类只是冰山一角。例如谷歌前两年畅想的,将深度学习应用于软件、系统的不同层级,比如放到编译器层级,实现高级语言编译的最优化,让程序运行更流畅,让上层和底层硬件的默契更好;甚至应用到华为的方舟编译器,更进一步提升runtime的效率。CXAEETC-电子工程专辑

20190622-huawei-nova-31.jpgCXAEETC-电子工程专辑

 这是华为AI布局的前瞻,实际也是现如今麒麟手机SoC走在前列的核心,和华为手机差异化竞争的关键所在。包括拍照好,现如今都需要NPU的参与。如此舍得在3000元这个价位的手机产品(nova 5/2799元;nova 5 pro/2999元起)中放进如此算力的NPU,也表明将AI专核、edge AI普及到智能手机中,华为跨的步子最大,亦将是推动华为手机销量的主要组成部分。CXAEETC-电子工程专辑

CXAEETC-电子工程专辑
发布会更多花絮:

20190622-huawei-nova-33.jpgCXAEETC-电子工程专辑
本场发布会主体色始终为绿色CXAEETC-电子工程专辑

20190622-huawei-nova-35.jpgCXAEETC-电子工程专辑
20190622-huawei-nova-37.jpgCXAEETC-电子工程专辑
nova 5背面的纹理工艺又有特别处理CXAEETC-电子工程专辑

20190622-huawei-nova-39.jpgCXAEETC-电子工程专辑
nova 5四摄,主摄、广角、微距、深度计算辅助CXAEETC-电子工程专辑

20190622-huawei-nova-41.jpgCXAEETC-电子工程专辑
发布会上展示的平板产品M6,同样采用麒麟980CXAEETC-电子工程专辑

20190622-huawei-nova-43.jpgCXAEETC-电子工程专辑
nova 5的特色之一是内置NFC芯片,华为特别与一些跑步机厂商合作,和跑步机碰一下就连接,并呈现运动数据CXAEETC-电子工程专辑

20190622-huawei-nova-45.jpgCXAEETC-电子工程专辑
现场正在自拍的小姐姐CXAEETC-电子工程专辑

20190622-huawei-nova-47.jpgCXAEETC-电子工程专辑
20190622-huawei-nova-49.jpgCXAEETC-电子工程专辑
发布会的汹涌人潮CXAEETC-电子工程专辑

20190622-huawei-nova-51.jpgCXAEETC-电子工程专辑
发布会的大量观众都是专程来看易烊千玺的CXAEETC-电子工程专辑

20190622-huawei-nova-53.jpgCXAEETC-电子工程专辑
20190622-huawei-nova-55.jpgCXAEETC-电子工程专辑
易烊千玺登场CXAEETC-电子工程专辑

20190622-huawei-nova-57.jpgCXAEETC-电子工程专辑
这是华为第一次走进武汉召开发布会CXAEETC-电子工程专辑

20190622-huawei-nova-59.jpgCXAEETC-电子工程专辑
华为消费业务手机产品线总裁何刚CXAEETC-电子工程专辑

20190622-huawei-nova-61.jpgCXAEETC-电子工程专辑
除了nova 5/5 Pro之外,本次发布会还发布了10.8和8.4英寸的平板M6,nova 5i手机,华为mini蓝牙音箱,以及一些多彩配件产品 CXAEETC-电子工程专辑

20190622-huawei-nova-63.jpgCXAEETC-电子工程专辑

20190622-huawei-nova-65.jpgCXAEETC-电子工程专辑

20190622-huawei-nova-67.jpgCXAEETC-电子工程专辑

20190622-huawei-nova-69.jpgCXAEETC-电子工程专辑

 CXAEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
您可能感兴趣的文章
  • 苹果再次拒绝解锁iPhone,FBI: 根本不需要苹果“开后门 1月15日消息,据外媒报道,美国联邦调查局(FBI)和司法部长威廉·巴尔(William Barr)都要求苹果公司为正在进行的佛罗里达州彭萨科拉枪击案调查提供更多帮助。然而苹果拒绝了帮助解锁相关两部iPhone手机的请求。近日,安全专家指出,FBI已经拥有可以解锁iPhone的黑客工具,根本不需要苹果“留后门”。
  • 柔宇科技寻求在美IPO 募资约10亿美元 柔宇科技正寻求约10亿美元的融资,公司估值约80亿美元,主要用于资助公司的销售、营销和研发活动。
  • 触觉反馈手机屏幕让你“触手可感” 法国新创公司Hap2U在CES发表支持触觉反馈的智能手机显示器Hap2phone,可透过其HD纹理感知接口,让用户在手机的触控屏幕上触摸并感知到所显示的物体…
  • 富士康印度工厂停摆,但出海大计并非全盘皆输 1 月 7 日,印度马哈拉施特拉邦(Maharashtra)工业部长苏巴什·德赛(Subhash Desai)称,与富士康在当地合作建立电子产品制造工厂的计划已经取消。
  • FBI再求苹果解锁iPhone,机主在美海军基地枪杀三人 FBI周一晚间致函苹果公司总法律顾问凯瑟琳·亚当斯,要求苹果帮助解锁两部iPhone。调查人员认为,这两部iPhone为沙特空军成员穆罕默德·赛义德·阿尔沙姆拉尼(Mohammed Saeed Alshamrani)所有,他是上个月在佛罗里达海军基地枪击事件中造成三人死亡的枪手嫌疑犯。
  • 汇顶CEO张帆新年致辞,盘点2019年Design Wins 汇顶科技CEO张帆在2020新年致辞中表示,2019年,汇顶科技走过了一段充满创新激情与收获的征途,如今采用汇顶屏下光学指纹方案的商用手机机型已达101款。汇顶PC触控方案已经打入HP、华为和联想等全球顶尖品牌的供应链,汽车触控芯片也已经在吉利、长安、奇瑞等自主汽车品牌实现了规模商用……
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告