许多人都听说过缓存一致性这个术语,但并不完全了解片上系统(SoC)器件,尤其是使用片上网络(NoC)的器件中的注意事项。要了解当前的问题,首先必须了解缓存在内存层次结构中的作用。

许多人都听说过缓存一致性这个术语,但并不完全了解片上系统(SoC)器件,尤其是使用片上网络(NoC)的器件中的注意事项。要了解当前的问题,首先必须了解缓存在内存层次结构中的作用。

内存层次结构中的缓存

CPU内部有相对较少的速度极高的寄存器。CPU可以在一个时钟周期内访问这些寄存器。但是,它们的存储容量很小。相比之下,访问主内存以读取或写入数据需要耗费许多时钟周期。这往往会导致CPU大部分时间处于空闲状态。

1965年,英国计算机科学家莫里斯·威尔克斯(Maurice Wilkes)提出了高速缓存和内存缓存的概念。这包括在CPU附近放置少量称为缓存的快速内存。“缓存”一词本身来自法语单词“cacher”,意为“隐藏”或“隐瞒”,其概念是利用缓存将主内存隐藏在CPU之外。涉及简单缓存的内存层次结构的高级视图如1所示。

图1:显示缓存在内存层次结构中位置的高级视图。(来源:Arteris)

这一过程的运行基于两个关键点。首先,当CPU上运行的程序涉及主内存中的一个位置时,通常会对附近的几个位置执行操作。因此,当CPU请求从主内存中获得单个数据时,系统会从附近的位置引入数据。

这种方法可确保相关数据在需要时随时可用。其次,程序通常会对相同的数据集进行大量操作。因此,将常用数据存储在最靠近CPU的缓存中是有益的。这种接近性允许更快地访问数据和处理数据。

SoC环境中的缓存

在SoC中,缓存是在高速、高功耗、低容量的SRAM中的片上实现的。同时,主存储器是在印刷电路板(PCB)上的片外实现的,通常采用低速、低功耗、高容量DRAM的形式。

为了最大限度地减少延迟,设计人员在当今的许多SoC中添加了多级缓存。这些缓存通常包括两个级别:L1和L2。L1缓存最靠近CPU,容量最小,但访问速度最快,通常在1到2个时钟周期内。L2缓存距离CPU稍远,容量更大,但访问速度较慢,通常在4到10个时钟周期之间。

多级缓存可最大限度地提高性能,同时最大限度地减少对主存储器的片外访问。访问此主存储器可能会消耗数百个时钟周期。通过使用多级缓存,可以更快地从这些缓存而不是较慢的主存储器中检索数据,从而提高整体系统的效率。

当涉及多个CPU内核时,所有这一切的复杂性都会增加。考虑一个常见的场景,集群中有四个CPU内核,标记为内核0到3,每个内核都有自己专用的L1缓存。在某些实施方案中,每个内核还有自己专用的L2缓存。在其他设计中,内核0和1共享一个L2缓存。这些不同的配置会影响数据在不同缓存级别上的存储和访问方式。

通常,单个集群中的所有处理器内核都是同构的,即它们的类型相同。然而,拥有多个处理器内核集群的情况越来越普遍。在许多情况下,不同集群中的内核是异构的,或者说是不同类型的。例如,在Arm的big.LITTLE技术中,“big”内核旨在实现最高性能,但使用频率较低。

“LITTLE”内核则对能效进行了优化,使用频率更高,但性能较低。例如,在基于Arm的智能手机中,“big”内核可能会被激活用于Zoom通话等相对不频繁的任务。相比之下,“LITTLE”内核可以处理更常见、要求不高的任务,如播放音乐和发送短信。

维护缓存一致性

在有多个具有独立缓存的处理单元共享同一主内存的系统中,共享数据可能拥有多个副本。例如,主内存中可能有一个副本,而每个处理器的本地缓存中可能有更多副本。要维护缓存的一致性,就必须在所有副本中都反映出对一份数据副本的所有更改。这可以通过用新数据更新所有副本或标记其他副本无效来实现。

缓存一致性可以在软件控制下维护。但是,软件管理的一致性非常复杂,调试起来也很困难。尽管如此,通过缓存清理等技术仍可实现一致性,即把缓存中存储的修改数据标记为脏数据,这意味着必须将其写回主内存。缓存清理可以在整个缓存或特定地址上执行,但需要耗费大量CPU周期,而且必须在持有数据副本的所有CPU上执行。

维护缓存一致性的首选方法是使用专用硬件,在软件无法察觉的情况下管理缓存。例如,与处理器集群中的内核相关联的缓存,通常包括维护缓存一致性所需的所有硬件。

用还是不用

SoC由大量称为知识产权(IP)块的功能块组成。处理器集群就是这样一个IP块。连接IP块的常见方法是使用NoC。

在许多SoC设计中,处理器集群外部不需要一致性,因此可以使用非一致性或IO一致性的AXI5或AXI5-Lite NoC,例如Arm的NI或Arteris的FlexNoC。但是,对于具有多个处理器集群、缺乏固有缓存一致性的SoC设计,或者在集成需要缓存一致性的第三方IP或自定义加速器IP时,则需要一致性NoC。这方面的例子包括使用AMBA CHI协议的Arm CMN或使用AMBA ACE和/或CHI的Arteris Ncore。

图2:在上述示例中,主系统采用了一致性NoC,而安全岛则采用了非一致性NoC。(来源:Arteris)

在整个芯片上普遍应用缓存一致性会耗费大量资源,而且对于特定组件而言也没有必要。因此,如2所示,将缓存一致性隔离到CPU集群和特定加速器IP等芯片子集,可以更有效地利用资源并降低复杂性。一致性NoC(如Ncore)在需要严格同步的应用场景中表现出色。同时,非一致性互连(如FlexNoC)则在不需要严格同步的情况下非常理想。

设计人员可以从战略上平衡特定领域对数据一致性的需求,同时在不需要严格一致性的情况下从更精简的通信通道中受益。在当今复杂的异构SoC中,一致性和非一致性互连之间的协同作用已成为一种战略优势,可提高系统的整体效率和适应性。

Arteris公司产品管理和营销副总裁Andy Nightingale拥有超过36年的高科技行业经验,其中23年在Arm公司担任各种工程和产品管理职位。

(原文刊登于EE Times姊妹网站EDN,参考链接:SoC design: When a network-on-chip meets cache coherency,由Franklin Zhao编译。)

本文为《电子工程专辑》2024年8月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里

责编:Franklin
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
大模型催生了算力需求,而异构计算范式与RISC-V技术优势高度契合,让RISC-V架构SoC受到了市场广泛关注。RISC-V+AI落地的需求场景在哪里?如何在软件生态上直面CUDA、Android的挑战?究竟是先做产品还是先定标准?
CC2560A采用芯来科技NS300 RISC-V内核,主频可达120MHz,传输速度提升至25Mbps,算力达到150+ DMIPS。不仅具备安全性,还能通过灵活扩展满足特定应用场景的需求。
FTTR技术能为家庭用户提供了超千兆、全屋覆盖无死角的极致网络体验,显著提升了家庭宽带体验。
WQ9201芯片采用独创的“2+1+1”新型架构,集成了两个高性能RISC-V内核,采用对称多处理(SMP)架构运行IEEE 802.11ax协议栈,实现高吞吐量和稳定可靠的无线传输。
在专用芯片市场上,目前VR芯片国产率几乎为零,而AR主控芯片则缺乏高度集成的产品。六角形半导体针对AR/VR市场的三大痛点——功耗、尺寸和实时性,推出了专为AR眼镜设计的HX77系列高性能主控SoC……
无线通讯最大的愿景,是用一张网覆盖整个人类社会,这对整个社会来讲是最经济、效率最高并且成本最低的方式。
在2024年RISC-V中国峰会上,Imagination Technologies展示了其RISC-V CPU+GPU集成优化平台,并就如何利用系统性创新加速RISC-V CPU的采用和普及、借助GPU在智能化时代加速RISC-V CPU的落地和产业化、以及在汽车应用中发挥RISC-V架构的优势等话题发表了演讲。
本篇文章是SmartDV数字芯片设计经验分享系列文章的第三篇,将继续分享第五、第六主题,包括确保在FPGA上实现所需的性能和时钟两个方面的考量因素。
2024年8月19日,德国黑森州新伊森堡报道——艾睿电子开发并推出了全新资源中心,目标旨在推动电动汽车充电技术的发展。艾睿电子进一步扩充其技术资源库,助力工程师开发下一代电动汽车充电器以及相应的软件生态系统。资源中心为三种电动汽车充电器提供设计和技术上的支持:车载充电器、交流充电器和直流(或快速)充电器。
贸泽电子 (Mouser Electronics)宣布将于8月28-30日首次亮相IOTE 2024第二十二届国际物联网展(展位号:10号馆 10B9号展位)。届时,贸泽电子将联合国际知名厂商Amphenol, Silicon Labs等聚焦AI、智能家居、可穿戴、物联网、边缘计算、智慧城市建设、电源管理等一系列热门技术与应用话题。
点击上方蓝字谈思实验室获取更多汽车网络安全资讯AutoSec 2024第八届中国汽车网络安全周9月3日-4日9月3日-4日,「AutoSec 2024第八届中国汽车网络安全周暨第五届智能汽车数据安全展
本文来源:物联传媒世界聚焦物联,产业规模空前!一场高端产业研学盛会即将如约而至。IOTE第二十二届2024国际物联网展·深圳站(简称:IOTE深圳物联网展),2024年08月28-30日将在深圳国际会
往期精选2023年度中国移动机器人产业发展研究报告发布!超200个——2024年上半年AGV/AMR行业中标项目盘点市场保有量超10000台的8大中国AGV/AMR厂商总额超190亿-盘点全球移动机器
点击上方蓝字谈思实验室获取更多汽车网络安全资讯8月26日,第一财经记者从IBM中国方面确认,IBM将彻底关闭中国研发部门,涉及员工数量超过1000人。此次研发部门关闭涉及的业务线主要有两条,一个是 I
点击上方蓝字谈思实验室获取更多汽车网络安全资讯AutoSec 2024第八届中国汽车网络安全周9月3日-4日9月3日-4日,「AutoSec 2024第八届中国汽车网络安全周暨第五届智能汽车数据安全展
文|德福汽车正在崛起成为新中产家庭的“户外教具”——教育理念领先鸡娃20年。长期以来,一些家庭盛行“鸡娃”教育,孩子们承受着巨大的学业压力,他们的童年被大量的习题和考试所占据,没有多少时间去享受户外乐
本文来源:司南导航~END~一键三连,这次一定!
8 月 26 日消息,众泰汽车股份有限公司 8 月 22 日发布关于副总裁辞职公告。公告显示,众泰汽车董事会于近日收到公司副总裁王磊提交的书面辞职报告,王磊因个人原因申请辞去公司副总裁职务,其辞职报告
 今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来----来源:光行天下申明:
8 月 26 日消息,据蓝鲸新闻报道,和谐汽车就被曝全员降薪一事回应称经营目前一切正常。和谐汽车称:“全员降薪是我们主动适应市场大环境的阶段性举措,以增加抵御未来风险的能力。公司有信心通过各项举措,尽