向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

Hot Chips 2018大会上13款最“热”芯片

时间:2018-09-03 作者:Rick Merritt 阅读:
随着机器学习的崛起,Hot Chips再度成为专注于芯片架构的工程师热烈参与的年度盛会。今年夏天,在第30届的Hot Chips 2018大会上有哪些值得关注的“热门芯片”?
ASPENCORE

Optane引发法规争议?

英特尔描述其最新的14nm Xeon服务器处理器Cascade Lake。该公司在不久前的一场活动中才发布这款芯片,但在Hot Chips大会上提供了更多细节,但也引发一些争议。lt3EETC-电子工程专辑

Cascade Lake采用与英特尔现有14nm Xeon相同的机制、散热和插槽接口,也支持相同的核心数、快取结构以及I/O速度。新增部份包括微调14nm工艺,以提高一点性能和降低一些功耗。此外,该芯片还支持新的AI指令和硬件,以避免暴露于Meltdown/Spectre的旁路通道攻击。lt3EETC-电子工程专辑

但其重点在于,Cascade Lakes是第一款带有内存控制器的Xeon,可支持Intel Optane (即3D XPoint内存),可为每插槽提供高达3TB主存储器以及带来超越DRAM的读/写速度。lt3EETC-电子工程专辑

介绍该新产品的英特尔工程师并未评论Optane的耐用性。然而,他表示,这些主板使用的Jedec DDR4电气总线采用英特尔的专有协议,这已能让竞争对手近期内都望尘莫及。lt3EETC-电子工程专辑

Brookwood说:“我认为这并不至于构成法律挑战。”lt3EETC-电子工程专辑

“如果我是IBM或AMD,当Optane DIMM普及于数据中心而我却无法取得时,那么我可能会要大发牢骚了!英特尔占据了98%的服务器市场,在我看来,这就是一种垄断。”lt3EETC-电子工程专辑

2Optanex800.pnglt3EETC-电子工程专辑

英特尔目前正主导储存网络产业协会(SNIA),为Optane等替代主流内存打造软件平台lt3EETC-电子工程专辑

NEC加速器低价挑战Nvidia V100

NEC描述一款新的向量引擎,可搭载PCIe Gen 3板卡,而功耗还不到200W。该芯片专为搭配SX-Aurora超级计算机与Linux服务器中的x86主机而设计,据称其价格要比Nvidia V100更低得多。lt3EETC-电子工程专辑

NEC声称其向量芯片可提供高达307GFlops的双精度性能。在大多数基准检验下,其性能可介于Xeon和V100二者之间。该公司还指出,NEC芯片的内存带宽略高,而且在一些工作负载上的性能功耗比几乎相当于Nvidia GPU。lt3EETC-电子工程专辑

相较于Nvidia V100芯片尺寸约840 mm2,NEC的1.6GHz、16nm向量芯片尺寸相对较小——480-mm2。此外,NEC的芯片支持多达6个Hi8或Hi4 HBM2内存堆栈,可提供高达48GB的总内存容量。lt3EETC-电子工程专辑

3NECvectorengine.pnglt3EETC-电子工程专辑
为IoT打造超低功耗AI加速器

美国哈佛大学(Harvard University)和Arm的研究人员连手发表一种用于物联网中执行深度学习任务的超低功耗加速器。这款所谓的SMIV芯片采用台积电(TSMC) 16-nm FFC工艺打造,芯片尺寸约为25 mm2。lt3EETC-电子工程专辑

SMIV可说是使用Arm Cortex-A核心的首款学术界开发芯片。它在always-on的加速器丛集中使用近阈值操作,并透过嵌入式FPGA模块提供大约80个硬件MAC和44Kbits RAM。lt3EETC-电子工程专辑

因此,该芯片能以低功率提供更高精确度。同时,相较于竞争方案,它的功率和面积效率都提高了近10倍。lt3EETC-电子工程专辑

4HarvardSMIVx800.pnglt3EETC-电子工程专辑
MIT打造更低功耗导航芯片

美国麻省理工学院(MIT)的研究人员则为机器人和无人机打造了一款客制设计的导航芯片,据称该芯片的功耗较Arm CPU核心更低。这款Navion导航芯片采用65nm CMOS制造,在20-mm2芯片面积上打造视觉惯性测距引擎。lt3EETC-电子工程专辑

研究人员称,该芯片的性能是标准CPU的2倍至3倍,并可缩减多达5.4倍的内存占用空间。它在最大配置下的功耗为24mW,而在优化配置时的功耗仅2mW,而仍能实现实时导航。lt3EETC-电子工程专辑

在Hot Chips大会的多场会议中只针对已发布的组件(有的甚至都已经出货)提供较多细节。接下来我们将先介绍用于客户端系统的AI加速器和CPU,并将关注焦点转向服务器处理器和加速器。lt3EETC-电子工程专辑

5NavionMITx800.pnglt3EETC-电子工程专辑
Arm展示新款机器学习核心实力

Arm深入探讨其预计将在年底出现在芯片中的机器学习核心。新款机器学习核心可在1GHz提供约4TOPS运算性能,以及在以7nm制造的2.5-mm2核心上提供超过3TOPS/W性能。其乘法累加单元支持8个16位宽点乘积。lt3EETC-电子工程专辑

6ARMMLperfx800.pnglt3EETC-电子工程专辑

Arm介绍其机器学习核心上的8 x 8区块压缩lt3EETC-电子工程专辑

三星提升智能手机性能

三星举例说明聪明的工程师如何在工艺技术进展趋缓时显著提升性能。因此,从一系列基准检验来看,目前在其智能手机中使用的2.7GHz M3应用处理器,轻轻松松地就能超越前一代M2至少50%以上。lt3EETC-电子工程专辑

这项进展来自于在其分支预测器中使用神经网络,以及利用德州农工大学(Texas A&M )教授Daniel A. Jiménez的学术研究成果。不过,M3应用处理器的芯片尺寸是M2的2倍以上,但采用了10 LPP工艺——这是三星10 LPE工艺的微幅升级。lt3EETC-电子工程专辑

7SamsungM3perfx800.pnglt3EETC-电子工程专辑
Mythic展示内存处理器最新进展

Mythic描述其内存处理器(PIM)设计细节,它可用于处理具有0.5 picojoules/MAC的深度学习影像。该芯片设计针对监控和工厂相机,功耗约为5W,包括所有数字控制逻辑。lt3EETC-电子工程专辑

PIM概念已出现多年了,但一直到最近才被应用于AI。Mythic打造基于NOR单元的可变电阻器数组,但并不在内存单元写入和读取深度学习权重。相反地,它将电压施加到数组线,以求和并读取电流级,进一步达到省电的效果。lt3EETC-电子工程专辑

初始芯片可处理有限数量的权重,但基于砖式(tile)的设计可为全标线芯片扩展多达5倍权重。此外,还可以添加Arm核心以创建可编程组件,而且多个芯片间可以协同工作以执行更大的应用程序(app)或更快地执行。但缺点之一在于无法利用神经网络的稀疏特性。lt3EETC-电子工程专辑

Mythic声称,这款40nm芯片的功耗只有GPU的一小部份。该公司预计明年年中提供样片,并预计于2019年底量产。lt3EETC-电子工程专辑

8Mythictable.pnglt3EETC-电子工程专辑

Mythic的PIM目的在于以MCU功率提供GPU性能,而不至于影响稀疏神经网络lt3EETC-电子工程专辑

 lt3EETC-电子工程专辑

Google侧写Pixel Visual Core

Google介绍在其最新智能手机中的Pixel Visual Core。这款基于A53的可编程引擎,专为手机摄影机执行目前仍在发展中的最新版HDR +算法。一位Google工程师打趣地说:“它能让你的社交媒体图片看来不会太糟糕。”lt3EETC-电子工程专辑

有趣的是,三星内存部门的一位工程师问道,未来世代是否会放弃典型的图像处理管线,转而采用新兴的深度学习技术?Google工程师回复说:“但我们还没在这个领域发布太多AI算法啊!”lt3EETC-电子工程专辑

9aGooglePixel.pnglt3EETC-电子工程专辑

Google声称其28nm Pixel核心执行HDR+作业的速度比10nm移动应用处理器的CPU快至少2.8倍lt3EETC-电子工程专辑

IBM强化Power 9服务器系统

针对服务器领域,IBM与英特尔似乎都在14nm节点停摆一段时间了。IBM这次在Hot Chips介绍其最新的计划,为基于其Power 9处理器的系统强化I/O和内存带宽,不过,至少要到2020年或之后才会针对新工艺提供新设计了。lt3EETC-电子工程专辑

9bIBMPowerroadmap.pnglt3EETC-电子工程专辑

IBM的目标是在其Power 9服务器上发掘更多内存带宽,同时为基于7-nm处理器的设计做好准备lt3EETC-电子工程专辑

富士通将Arm核心带入超级计算机

富士通(Fujitsu)描述了7-nm A64FX,其设计目标在于成为超级计算机中的首批Arm核心之一。该512位SIMD芯片为Arm架构带来向量扩展,以执行传统的超级运算和新的AI任务。52核心的芯片使用32GB HBM2内存,可提供2.7TFlops性能和1,024GB/s的内存带宽。lt3EETC-电子工程专辑

9cFujitsuArm64FXx800.pnglt3EETC-电子工程专辑

富士通的首款post-Sparc设计A64FX,瞄准用于将在2021年发表的日本新一代Post-K超级计算机lt3EETC-电子工程专辑

Nvidia展示其GPU服务器实力

Nvidia透过其DGX-2及其内部NVLink互连,从芯片进一步扩展到系统。该公司展示了几项基准检验,包括以DGX-2展现超越标准双GPU系统的性能。lt3EETC-电子工程专辑

9dNvidiaDGX2benchmarkx800.pnglt3EETC-电子工程专辑
英特尔、AMD以及…中东和平?

英特尔介绍如何使用其嵌入式多芯片互连桥接(EMIB)技术,将其Kaby Lake桌上型x86 CPU与AMD Radeon RX Vega M GPU连接在一个模块(下图)中,以用于轻薄型笔记本电脑。lt3EETC-电子工程专辑

分析师Brookwood还与英特尔主讲人开玩笑说,“不管是谁来谈成这项协议的,接下来应该可以派他去进行中东和平的任务。“lt3EETC-电子工程专辑
9eIntelAMDcombo.pnglt3EETC-电子工程专辑
编译:Susan Honglt3EETC-电子工程专辑

qrcode_EETCwechat_120.jpglt3EETC-电子工程专辑

关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”lt3EETC-电子工程专辑

ASPENCORE
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Rick Merritt
EE Times硅谷采访中心主任。Rick的工作地点位于圣何塞,他为EE Times撰写有关电子行业和工程专业的新闻和分析。 他关注Android,物联网,无线/网络和医疗设计行业。 他于1992年加入EE Times,担任香港记者,并担任EE Times和OEM Magazine的主编。
您可能感兴趣的文章
  • 针对五种不同场景的耳塞式光学心率测量 传感器技术的进步改变了人们诊断其生命体征和健康的方式与地点。便携式非侵入测量技术可以在我们的日常生活中进行快速简单的测量,现在可以将有效运作的生命体征测量器件集成到典型的入耳式耳机中。本文针对五种不同场景介绍并评估了耳塞式光学心率测量系统。
  • 康佳半导体首款存储主控芯片量产,首批出货10万颗 2月4日晚间,康佳披露控股子公司首款存储主控芯片KS6581A已实现量产。KS6581A是康佳半导体科技事业部规划的首款嵌入式存储器控制器芯片,由康佳半导体科技事业部下辖的合肥康芯威存储技术公司承接开发……
  • 疫情打乱2月新机发布节奏,卢伟冰:100W快充技术已成熟 突如其来的新型冠状病毒肺炎疫情,不仅影响了大家的生活,也对智能手机行业的开年带来考验,打乱了2月份本来多款旗舰机发布的节奏。日前卢伟冰在微博表示,小米高管和核心干部已经到岗,员工还继续保持远程办公……
  • 美国施压荷兰,阻挠EUV设备出口中国 为了阻止荷兰半导体巨头阿斯麦尔(ASML)向中国公司出售光刻机的一笔1.5亿美元交易,这届美国政府可谓操碎了心。据知情人士透露,从2018年开始,特朗普当局为了阻止ASML出售最先进的EUV设备给中国,曾四度和荷兰官员会面,并大力施压挡下此案。白宫官员还与该国首相分享了一份机密情报……
  • 华为5款手机被移出GeekBench跑分榜单 日前,国外知名跑分平台Geekbench更新排名名单,同时也公布了最新黑名单,有六款设备因人工干预上榜,五款华为,一款一加。型号分别的华为Mate 10 Pro、华为P20 Pro、华为Mate 10、华为P20、华为荣耀Play、一加手机5……
  • “遁隐”的Groq终于开始揭开其AI架构的神秘面纱 自从Groq “高调”没出现在自己赞助的AI硬件峰会之后,EETimes日前采访了这个开始从“潜伏”状态进入大众视野的神秘公司,与其高层领导团队进行了访谈,详细了解了他们关于其软件定义的硬件TSP。
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告