图灵奖得主DavidPatterson:为什么要有RISC-V(福利:留言抽奖送书)

FPGA技术江湖 2023-12-13 08:02

点击上方蓝字关注我们

RISC-V(发音为“RISC five”)的目标是成为一款通用的指令集架构(Instruction Set Architecture,ISA):

• 它要适合设计各种规模的处理器,包括从最小的嵌入式控制器到最快的高性能计算机。

• 它要兼容各种流行的软件栈和编程语言。

• 它要适用于所有实现技术,包括 FPGA(Field-Programmable Gate Array,现场可编程逻辑门阵列)、ASIC(Application-Specific Integrated Circuit,专用集成电路)、全定制芯片,甚至未来的制造元件技术。

• 它能用于高效实现所有微体系结构,包括微程序或硬连线控制,顺序、解耦或乱序流水线,单发射或超标量等。

• 它要支持高度定制化,成为定制加速器的基础,以应对摩尔定律的放缓。

• 它要稳定,基础 ISA 不会改变。更重要的是,它不能像以往的公司专有 ISA 那样消亡,包括 AMD 的 Am29000、Digital 的 Alpha 和 VAX、Hewlett Packard1 的 PARISC、Intel 的 i860 和 i960、Motorola 的 88000,以及Zilog 的 Z8000。

RISC-V 是一款与众不同的 ISA,不仅因为它年轻(它诞生于 2010 年,而其他 ISA 大多诞生于 20 世纪 70 年代或 80年代),而且因为它开放。与过去几乎所有的架构不同,其未来不受任何一家公司的兴衰或心血来潮的决策所影响(过去许多 ISA 因此消亡)。相反,RISC-V 属于一个开放的、非营利性质的基金会。RISC-V 国际基金会的目标是维护 RISC-V 的稳定性,仅出于技术原因而缓慢谨慎地改进 RISC-V,并推动RISC-V 在硬件中流行起来,犹如 Linux 在操作系统中流行一般。图 1.1 列出了 RISC-V 国际基金会最大的企业会员,展示了 RISC-V 的繁荣。




模块化ISA和增量型ISA


Intel 曾将其未来押在高端微处理器上,但这还需要很多年时间。为与 Zilog 公司抗衡,Intel 开发了一款名为8086 的过渡产品。它本该朝生暮死,无任何后续产品,但事实并非如此。高端处理器姗姗来迟,等它最终面世时,性能却不如人意。因此,8086 架构得以延续——它演化为 32 位处理器,最终又演化为 64 位。其名称不断更替(80186、80286、i386、i486、Pentium),但底层指令集丝毫未减。                                                                                               ——Stephen P. Morse,8086 架构师 (Morse, 2017)


计算机体系结构的传统发展方式是增量型 ISA,这意味着新处理器不仅需要实现新的 ISA 扩展,还必须实现过去的所有扩展。其目的是保持向过去的二进制兼容性,使数十年前的二进制程序仍可在最新处理器上正确运行。出于市场营销的目的,新一代处理器的发布通常伴随着新指令的发布。这两点需求共同导致 ISA 的指令数量随时间流逝而大幅增长。图 1.2 展示了当今主流 ISA x86 的指令数量增长过程。x86 的历史可追溯到 1978 年,在漫长的生命周期中,它每个月大约增加 3 条指令。

x86 在 1978 年诞生时有 80 条指令,2015 年增长到 1 338 条,翻了 16 倍,并且仍在增长。但图中数据仍偏保守。一篇 2015 年的 Intel 博客指出,统计结果为 3600条指令 (Rodgers et al. 2017)。按这个数据,在 1978 年到 2015 年期间,x86 指令平均每 4 天增长 1 条。我们统计的是汇编语言指令,他们统计的也许是机器语言指令。增长的主要原因是 x86 ISA 通过 SIMD 指令实现数据级并行。

这种约定意味着 x86-32(我们用它表示 32 位地址版本的x86)的每款处理器都必须实现过去扩展的错误设计,即便它们已无意义。例如,图 1.3 列出了 x86 的 aaa(ASCII Adjustafter Addition)指令,该指令早已失去用处。

它以二进制编码十进制数(Binary Coded Decimal,BCD)的形式进行算术运算,但它已化为信息技术的历史尘埃。x86 还有 3 条类似的指令,分别用于减法(aas)、乘法(aam)和除法(aad)。它们都是单字节指令,因此一共占用宝贵操作码空间的 1.6%(4/256)。


打个比方,假设一家餐馆只提供价格固定的套餐,最开始只有汉堡加奶昔的小餐。随着时间的推移,套餐中加入了薯条,然后是冰淇淋圣代,还有沙拉、馅饼、葡萄酒、素食意大利面、牛排、啤酒,无穷无尽,最后变成饕餮盛宴。食客能在这家餐馆找到他们过去吃过的任何一种食物(尽管这样没什么意义)。然而,这对食客来说是一个坏消息,他们每次的餐费将随盛宴加量而不断上涨。

除年轻和开放之外,RISC-V 还是模块化的,这与过去几乎所有 ISA 都不同。其核心是一个名为 RV32I 的基础 ISA,可运行完整的软件栈。RV32I 已冻结,永不改变,这为编译器开发者、操作系统开发者和汇编语言程序员提供了稳定的指令目标。模块化特性源于可选的标准扩展,硬件可根据应用程序的需求决定是否包含它们。利用这种模块化特性能设计出面积小、能耗低的 RISC-V 处理器,这对于嵌入式应用至关重要。RISC-V 编译器得知当前硬件包含哪些扩展后,便可为该硬件生成最优代码。一般约定将扩展对应的字母加到指令集名称之后,以指示包含哪些扩展。例如,RV32IMFD 在必选基础指令集(RV32I)上添加了乘法(RV32M)、单精度浮点(RV32F)和双精度浮点(RV32D)扩展。如果软件使用了一条未实现的可选 RISC-V 扩展指令,硬件将发生自陷,并在软件层执行该指令的功能。此特性属于标准库的一部分。

继续用我们刚才的比方,RISC-V 提供的是一份菜单,而不是一顿应有尽有的自助餐。主厨只需烹饪食客需要的食物,而不是每次都烹饪一顿大餐,食客也只需为他们点单的食物付费。RISC-V 无须仅为市场营销的热闹而添加新指令。RISC-V国际基金会决定何时往菜单中添加新的选择,经过由软硬件专家组成的委员会公开讨论后,他们才会出于必要的技术原因添加指令。即使这些新的选择出现在菜单上,它们仍是可选的,不像增量型 ISA 那样成为未来所有实现的必要组成部分。


RISC-V 自 2010 年诞生以来迅速发展并普及。我们认为一本精巧的程序员指南将有助于推动它的发展,还能让初学者理解 RISC-V 指令集具有吸引力的原因,并了解它与传统指令集架构(ISA)的不同之处。

本书受到其他指令集架构书籍的启发,但由于 RISC-V 自身非常简洁,我们希望能写得比 500 多页的优秀书籍(如 See MIPS Run)更精巧。我们把篇幅控制在这些优秀书籍的 1/3,至少在这个意义上我们成功了。实际上,书中前 10 章介绍了模块化RISC-V 指令集的每个组成部分,总共只用了 136 页,尽管平均每页插入了一张图片(共 97 张)。

阐释指令集设计原则后,我们展示了 RISC-V 架构师如何从过去 40 年的指令集中吸取经验教训,取其精华,去其糟粕。要评价一款 ISA,既要究其所取,也要究其所舍。

随后,我们通过一系列章节介绍这个模块化架构的每个组成部分。每章都包含一个 RISC-V 汇编语言程序,以展示该章所述指令的用法,从而帮助汇编语言程序员学习 RISC-V 代码。有时,我们还会用 ARM、MIPS 和 x86 列出同一个程序的代码,从而突出 RISC-V 的简洁性,以及在成本、功耗、性能之间权衡的优势。

为提升本书的趣味性,我们在页边加入约 50 段花絮,用于介绍关于正文内容的有趣评论。我们还充分利用页边的空间,在页边加入约 110 张图片,用于强调好的 ISA设计示例。最后,我们为愿意钻研的读者在全书中加入约 30 段补充说明。如果你对某个主题感兴趣,可以深入研读这些可选部分。略过此部分不会影响你对书中其他内容的理解,所以,如果你不感兴趣,则可以放心跳过它们。我们为计算机体系结构爱好者援引约 30 篇论文和书籍,它们能够开阔你的视野。在编写本书的过程中,我们也从中获益匪浅!

按以下方式互动,即有机会获赠图书!

活动方式:


在评论区留言参与:




RISC-V 架构是未来国产芯片的突破方向吗话题互动


届时会在参与的小伙伴中抽取3名幸运侠客每人赠送本期图书一本!

说明:留言区收到回复“恭喜中奖”者将免费获赠本图书,中奖者请在收到通知的2小时内将您的“姓名+电话+快递地址”留言至原评论下方处即可,隐私信息不会被放出,未在规定时间内回复视作自动放弃兑奖资格。

快快拉上你的小伙伴参与进来吧~~




 


如果喜欢本文
欢迎 在看留言分享至朋友圈 三连

FPGA技术江湖 任何技术的学习就好比一个江湖,对于每一位侠客都需要不断的历练,从初入江湖的小白到归隐山林的隐世高人,需要不断的自我感悟自己修炼,让我们一起仗剑闯FPGA乃至更大的江湖。
评论 (0)
  •     FPC 的含义是 Flexible Printed Circuit,柔性/挠性印制板。        (图来自网络,侵删)    FPC使用的基本材料有3种——聚酰亚胺(PI, Polyimide),铜和胶。    制作FPC时,和刚性PCB相似,也是对基本材料进行堆叠,然后热压成型。对于单面FPC,需要用两层PI分别作为载板和盖板,然后在二者之间加一层铜,铜与载板、盖板之间再各
    电子知识打边炉 2024-09-18 22:26 114浏览
  • Adaptive-Sync是什么?近年来电竞屏幕随着电竞产业的蓬勃发展以及游戏玩家对于更高画质、更流畅游戏体验的需求,电竞屏幕成为游戏设备中不可或缺的一环。电竞屏幕市场的概况与发展中,其中很重要的亮点就是高刷新率跟Adaptive-Sync技术的导入,美国视讯电子标准协会(VESA)在推出DisplayPort 1.4 规格标准时,针对电竞产品新增了Adaptive-Sync(可变更新频率)功能,让用户在玩游戏时可以减少画面的撕裂与延迟等现象,提供更平滑的游戏体验,这项功能对于不同刷新率的显示适
    百佳泰测试实验室 2024-09-19 12:29 78浏览
  • 概述       为有效利用海量的路试数据并发挥其价值,经纬恒润推出了OrienLink路试数据分析及开环/闭环回灌测试系统。该系统采用统一的数据存储标准平台,基于云计算技术提供的大规模存储、高带宽和高算力,能够对路试数据进行深入的场景挖掘。通过软件在环(SiL)和硬件在环(HiL)回灌验证,该系统能够充分评估和优化算法性能,发挥数据价值。可解决智能驾驶测试过程中的几类问题:    · 实车测试效率低,无法
    经纬恒润 2024-09-18 18:40 79浏览
  • 下载视频投屏复制链接笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习
    youyeye 2024-09-19 10:56 74浏览
  • 故障现象 一辆2013款宝马116i车,搭载N13B16A 发动机,累计行驶里程约为12.1万km。车主反映,该车行驶中偶尔加速无反应,且发动机故障灯异常点亮。 故障诊断接车后试车,故障现象无法再现。用故障检测仪检测,发动机控制单元(DME)中存储有多个与节气门相关的故障代码(图1),分析故障代码,推断故障可能是由节气门翻板过脏,偶尔卡滞引起的。 图1 DME中存储的故障代码拆下节气门总成检查,并不算脏;反复多次直接给节气门电动机短暂供电,节气门翻板打开及回位均无明显异常。用
    虹科Pico汽车示波器 2024-09-19 16:48 88浏览
  • 应用环境与市场需求随着科技不断进步,6K与8K显示器逐渐成为趋势,重新定义了我们对影像质量的期待。6K与8K显示器之所以备受瞩目,主要是因为它们提供了极高的分辨率。举例来说,6K显示器拥有超过6,000像素的水平分辨率,显著提升了影像的细节和清晰度,使用户能够更真实地体验影像的震撼效果;而8K显示器则更进一步将细节度推向新境界,带给用户身临其境般的感受。但随着高分辨率显示器的普及,也带来了挑战,首先是硬件需求的提升,高分辨率需要更强大的处理器和显示适配器来支持,目前6K/8K显示器主要采用最新的
    百佳泰测试实验室 2024-09-19 12:27 89浏览
  • 在ADTF (Automotive Data and Time-Triggered Framework)中,过滤器(Filter)扮演着数据处理的核心角色。过滤器是处理数据流的基本单元,它们接收、处理并发送数据。接下来,将分享ADTF中创建和使用过滤器,包括设置输入输出针脚(Pins)、配置触发器(Triggers)以及处理数据样本(Samples)。一、过滤器基础过滤器是ADTF中用于数据处理和转换的小型处理单元,可以通过特定的接口接收和发送数据,如图1所示。图1 Filter过滤器
    康谋 2024-09-19 09:10 120浏览
  • 可穿戴设备市场一直在寻找下一个风口。站在2024年来看,智能戒指似乎更有机会。市场调研机构 GMI 最新数据报告显示,2023年智能戒指市场规模达到2.1亿美元,预测2024~2032年将以24.1%的市场复合增长率增长,至2032年达到10亿美元市场规模。图片来源:GMInsights1、走向C位Galaxy Ring,一个曾经的小众品类,却在三星发布会上稳稳占据C位。图片来源网络基于加速度计、光学心率传感器和皮肤温度传感器,Galaxy Ring支持睡眠监测、全天候心率监测、压力水平、身体和
    艾迈斯欧司朗 2024-09-19 15:30 73浏览
  •     DFx是 Design for X(面向产品生命周期各/某环节的设计)的缩写。这个概念是1994年由SMTA(SMT Association)组织提出的,在2000年左右开始在大型公司中应用。    DFA,Assembly 可装配性    DFC,Cost 成本    DFD,Diagnosibility 可诊断分析性    DFE,Enviroment 为环保性着想  &nb
    电子知识打边炉 2024-09-18 21:43 98浏览
  • By Toradex胡珊逢简介Verdin AM62 是 Toradex 基于 TI AM623/AM625 SoC 的 Arm 计算机模块。它最多提供 4 个 A53 和 1 个 M4F 处理器。这是 TI 基于其 K3 平台的处理器,虽然和 NXP 的 iMX8M Mini/Plus 都使用 A53 核心,但是由于架构不同,在 Linux 系统中配置外设的方式也不同。文章将介绍如何配置 AM62 的引脚复用关系。硬件介绍Verdin AM62 所使用的 AM623/AM625 处理器的 GP
    hai.qin_651820742 2024-09-18 18:07 77浏览
  • 近年来,中国经济正处于转型升级的关键时期,高质量发展成为经济发展的重要目标。在这一伟大征程中,光耦作为一种关键性的电子元器件,正在发挥着重要的作用,助力中国经济迈向更加光明的未来。光耦概念及工作原理▲光耦(光电耦合器)光耦,全称为光电耦合器,是一种将电信号转换为光信号,再由光信号转换回电信号的器件。它由发光器件(通常是LED)和光敏器件(如光敏二极管或光敏晶体管)两部分组成,两者被隔离,以实现输入和输出电路之间的电气隔离。当LED接收到正向电流时,它会发出光线,这些光线通过透明介质照射到对面的光
    晶台光耦 2024-09-19 10:29 60浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦