DMA是什么?如何通过DMA实现高效传输?

原创 无际单片机编程 2025-04-24 08:02

关注公众号,回复“入门资料”获取单片机入门到高级开挂教程

 开发板带你入门,我们带你飞

文 | 无际(微信:2777492857)

全文约3903字,阅读大约需要 10 分钟

以前做过一个项目,需要连续采集多通道ADC,还有通过UART接收发送一堆数据流。

 

这时候,如果是你?你会怎么办?

 

是不是写个循环,在里面不断地读寄存器、写寄存器,或者开个中断,每次中断里就搬运一个字节?

 

一开始数据量小,感觉还好,就跟倒水似的,一勺一勺舀。

 

但是当数据量大起来,比如要采集一路高速信号,或者发送一整屏的图像数据时,你就会发现,你的CPU,那个原本应该指挥千军万马的大脑,此刻就像被数据牢牢拴住的狗子,光做数据搬运已经忙疯了。

 

它在那里苦逼地等着外设发来一个字节,赶紧把它挪到内存;或者等着外设能接收下一个字节了,赶紧从内存里拿一个塞过去。

 

你的主循环呢?其他重要的任务呢?它们只能干等着,或者在中断里被频繁地打断。

 

你可能调过ISR(中断服务程序)的优先级,想让搬数据这事儿赶紧过去,但只要数据量在那儿摆着,CPU花在搬运上的时间就省不掉。

 

更要命的是,如果数据速率很高,你的中断可能频繁到让CPU几乎干不了别的事儿,系统感觉卡顿,甚至可能会丢失数据,就像水流太急,你用小勺子根本舀不过来。

 

这种痛,只有做过类似项目应用的才能体会到。你觉得单片机性能不够,时钟频率太低,但很多时候,是你的用法限制了它的性能。

 

你的代码会充斥着大量的等待或者中断处理逻辑,变得复杂且难以维护。

 

最终的结果就是:项目延期、性能不达标、系统不稳定,如果正好又在试用期,瑟瑟发抖吧。

 

但好消息是,这个问题,现代单片机早就给你准备好了解决方案,它就是咱们今天要聊的——DMA(Direct Memory Access),直接存储器访问

 

读完这篇文章,你将彻底理解DMA是干啥的,它为什么能解放你的CPU,以及如何在你的单片机项目里用上这个“效率神器”。

 

你将学会让数据传输在后台默默进行,而你的CPU则可以去处理更重要的事情,大大提升系统的整体性能和响应速度。

 

DMA,直接存储器访问,其实从名字就能听出来它是干啥的:它能“直接”访问“存储器”(包括内存和外设寄存器),而且这个过程,很大程度上是“直接”的,不需要CPU时时刻刻参与。

 

你可以把DMA想象成CPU的一个独立的数据搬运“特助”。CPU只需要告诉它:“嘿,老哥,帮我把内存里这段数据(源地址)搬到那个外设的寄存器里(目标地址),一共搬100个字节,搬完了知会我一声(中断)。”

 

然后,CPU就可以把这事完全交给DMA,自己去干别的更体面的活儿了,比如跑算法、处理用户输入、管理调度其他任务等等。

 

DMA拿到指令后,会通过系统总线,直接在内存和外设之间(或者内存和内存之间)进行数据块的传输。每一次传输一个字节或一个字,DMA控制器自己搞定时序、地址递增等细节。就像CPU的小老弟,按照CPU的指令,自己找路,自己搬货,搬完了才告诉你:“老板,活干完了!”

 

这个过程中,CPU只在最初配置DMA和最后接收DMA完成中断时介入,中间的数据搬运过程完全由DMA硬件独立完成,几乎不占用CPU的执行时间。

 

DMA是怎么工作的?简化流程来了

 

一套典型的DMA传输流程大致是这样:

1.CPU配置DMA: 这是第一步,也是CPU唯一需要“手把手”干预的部分。CPU需要设置:

数据源地址: 数据从哪里来?可能是内存的一个buffer,也可能是某个外设的数据寄存器。

数据目标地址: 数据要搬到哪里去?可能是内存的另一个buffer,也可能是另一个外设的数据寄存器。

传输数据量: 一共要搬多少个字节、字或半字?

传输方向: 是从外设到内存(例如ADC采集),还是从内存到外设(例如UART发送),或者是内存到内存?

地址增量模式: 搬运过程中,源地址和目标地址是保持不变(用于访问同一个外设寄存器)还是自动增加(用于访问内存buffer)?

传输单位: 每次搬运是一个字节(8bit)、半字(16bit)还是一个字(32bit)?

关联的外设请求: 这次DMA传输是由哪个外设触发的?例如,UART发送数据时,当它的发送数据寄存器空了,会向DMA发出一个请求信号,DMA收到这个信号,就自动把内存里的下一个字节搬到UART的数据寄存器里。

传输模式: 只搬一次(Normal Mode),还是循环搬运(Circular Mode)?循环模式特别适合周期性数据采集(如ADC)或刷新(如屏幕显示)。

中断设置: 是在传输完成时触发中断?还是传输到一半触发中断?还是传输发生错误时触发中断?

 

2.CPU启动DMA传输: 配置完成后,CPU往DMA的某个控制寄存器里写一下,告诉它:“好了,干活儿去吧!” 然后CPU就解放了。

 

3.DMA独立执行传输: DMA控制器接收到启动信号后,就根据CPU给的配置,等待关联外设的请求(如果是外设触发模式),或者立即开始搬运。它会自行控制总线,从源地址读取数据,写入目标地址,同时自动更新内部的地址计数器和传输计数器。这个过程完全是硬件自动完成的,不需要CPU执行任何指令来干预搬运的细节。当然,DMA在搬运数据时会占用总线,可能会短暂地“暂停”CPU对总线的访问,但这比CPU自己执行搬运指令的效率高得多。

 

4.DMA发出完成信号/中断(可选): 当DMA按计划完成了所有数据的搬运,它会置位一个状态标志,并且,如果CPU之前配置了相应的中断,DMA会向CPU发送一个中断请求。

 

5.CPU处理后续事务: CPU在接收到DMA完成中断后,就知道这批数据已经搬完了。它可以接着处理这批数据(比如开始计算、分析),或者配置DMA进行下一批数据的传输。如果配置的是循环模式,DMA会在完成一轮后自动重置地址和计数器,开始下一轮搬运,甚至不需要CPU的干预。

 

拿STM32单片机举例,对应到代码的配置如下:

// 模拟一个DMA通道的配置结构体typedef struct{    uint32_t PeripheralBaseAddr; // 外设数据寄存器地址或内存地址    uint32_t MemoryBaseAddr;     // 内存buffer起始地址    uint32_t Direction;          // 传输方向:PERIPH_TO_MEMORY, MEMORY_TO_PERIPH, MEMORY_TO_MEMORY    uint32_t DMA_BufferSize;     // 传输的数据单元数量 (例如,字节数)    uint32_t PeripheralInc;      // 外设地址是否自增:DMA_PINC_DISABLE, DMA_PINC_ENABLE    uint32_t MemoryInc;          // 内存地址是否自增:DMA_MINC_DISABLE, DMA_MINC_ENABLE    uint32_t PeripheralDataAlignment; // 外设数据宽度:DMA_PDATAALIGN_BYTE, DMA_PDATAALIGN_HALFWORD, DMA_PDATAALIGN_WORD    uint32_t MemoryDataAlignment;     // 内存数据宽度:DMA_MDATAALIGN_BYTE, DMA_MDATAALIGN_HALFWORD, DMA_MDATAALIGN_WORD    uint32_t Mode;               // 传输模式:DMA_MODE_NORMAL, DMA_MODE_CIRCULAR    uint32_t Priority;           // DMA通道优先级:DMA_PRIORITY_LOW, DMA_PRIORITY_MEDIUM, DMA_PRIORITY_HIGH, DMA_PRIORITY_VERY_HIGH    uint32_t FIFOMode;           // FIFO模式使能 (部分高级DMA才有)    uint32_t FIFOThreshold;      // FIFO阈值 (部分高级DMA才有)    uint32_t MemBurst;           // 内存突发传输大小 (部分高级DMA才有)    uint32_t PeriphBurst;        // 外设突发传输大小 (部分高级DMA才有)} DMA_InitTypeDef;// 模拟DMA通道句柄 (用于管理和状态)typedef struct{    // DMA通道状态、错误标志等运行时信息    // ...} DMA_HandleTypeDef;// 模拟配置和启动DMA的函数void MX_DMA_Init(void){    // 1. 使能DMA时钟 (这是库函数干的事儿)    // __HAL_RCC_DMA1_CLK_ENABLE(); // 假设是STM32库函数风格    // 2. 初始化DMA通道句柄 (如果在用库)    // DMA_HandleTypeDef hdma_usart_tx; // 比如用于UART发送的DMA通道    // 3. 配置DMA通道参数    DMA_InitTypeDef DMA_Config;    DMA_Config.PeripheralBaseAddr = (uint32_t)&(USART1->DR); // 假设是USART1的数据寄存器地址    DMA_Config.MemoryBaseAddr     = (uint32_t)tx_buffer;    // 假设是内存中的发送buffer地址    DMA_Config.Direction          = DMA_MODE_MEM_TO_PERIPH; // 从内存到外设    DMA_Config.DMA_BufferSize     = tx_data_len;            // 要发送的数据长度    DMA_Config.PeripheralInc      = DMA_PINC_DISABLE;       // 外设寄存器地址不变 (还是那个DR)    DMA_Config.MemoryInc          = DMA_MINC_ENABLE;        // 内存地址自动增加 (挨个读取buffer里的数据)    DMA_Config.PeripheralDataAlignment = DMA_PDATAALIGN_BYTE; // 外设按字节传输    DMA_Config.MemoryDataAlignment     = DMA_MDATAALIGN_BYTE; // 内存按字节读取    DMA_Config.Mode               = DMA_MODE_NORMAL;        // 普通模式,传输一次停止    DMA_Config.Priority           = DMA_PRIORITY_LOW;       // 较低优先级    // 4. 将配置应用到具体的DMA通道 (这部分是关键的硬件寄存器操作,库函数封装了)    // 比如调用一个类似这样的函数:    // HAL_DMA_Init(&hdma_usart_tx, &DMA_Config);    // 5. 将DMA通道与对应外设的请求关联起来 (也是库函数干的事儿)    // 比如:__HAL_LINKDMA(&huart1, hdmatx, hdma_usart_tx);    // 6. 使能DMA通道的中断 (如果需要传输完成通知)    // HAL_NVIC_EnableIRQ(DMA1_Channel4_IRQn); // 假设USART1 TX对应DMA1通道4}// 模拟启动一次DMA传输的函数 (比如UART发送)void Start_UART_DMA_Transmit(uint8_t* pData, uint16_t Size){    // 假设前面已经配置好了DMA通道和UART,并关联了DMA    // 这个函数只需要告诉DMA和UART,数据在哪里,准备发送    // HAL_UART_Transmit_DMA(&huart1, pData, Size); // 类似这样的库函数调用    // 实际底层是设置DMA的MemoryBaseAddr, DMA_BufferSize,然后使能DMA通道,并使能UART的DMA发送请求}// 模拟DMA传输完成中断服务程序void DMA1_Channel4_IRQHandler(void){    // 检查是哪个事件触发的中断 (传输完成?传输错误?)    // 如果是传输完成,则可以处理后续逻辑,比如释放buffer,发送下一个数据包等    // 清除中断标志位    // HAL_DMA_IRQHandler(&hdma_usart_tx); // 类似这样的库函数调用}


 

上面这段代码,不是某个具体单片机的完整代码,而是模拟了一个使用HAL库风格配置DMA的结构和流程。你会看到,你需要定义DMA的各种行为(源、目标、大小、方向、步进、模式等),然后把这些配置“灌”给对应的DMA通道,再通过使能外设的DMA请求,让它们“联动”起来。

 

一旦Start_UART_DMA_Transmit这样的函数被调用,CPU就只是简单地设置几个寄存器,然后就可以撒手不管了。数据会通过DMA控制器和UART外设之间的“握手”,自动从tx_buffer里一个字节一个字节地被搬到UART的发送数据寄存器里,直到全部发送完毕。

 

不同单片机的DMA控制器配置寄存器名字和细节可能不一样,但核心思想和配置项是类似的。

 

 

使用DMA的好处看得见摸得着:

解放CPU: 最直接的好处。CPU从繁重的数据搬运任务中解脱出来,可以去执行更高级、更复杂的任务,让你的主循环跑得飞快。

 

提高外设吞吐量: DMA硬件搬运速度快,可以跟上高速外设的数据速率,避免数据丢失,实现更高的通信或采集速率。

 

降低系统功耗: CPU在等待数据传输时,可以进入低功耗模式(如Sleep Mode),由DMA在后台处理数据搬运,传输完成后再唤醒CPU,这对于电池供电设备非常重要。

 

简化软件设计: 很多时候,使用DMA可以替代繁琐的循环或者频繁的中断处理,让你的主代码逻辑更清晰,更专注于业务处理。

 

像我们无际单片机的项目6,有几个地方使用了DMA。

 

第一个是SPI驱动TFT屏,可以加快数据搬运速度,刷屏的时候也快一点。

 

 

第二个是串口,像wifi,4G模块链接云平台实现OTA升级,或者调试,这些都是妥妥的大数据流,用DMA很香。

 

 

总结一下:

 

DMA就是单片机里一个专门负责搬数据的硬件单元。

 

它的存在,就是为了把你CPU从那些重复、耗时的数据搬运任务中解放出来。

 

掌握DMA,是单片机进阶路上绕不开的一步。它能显著提升你的程序效率和系统性能,让你的单片机项目脱胎换骨。


end



下面是更多无际原创个人成长经历、行业经验、技术干货

1.电子工程师是怎样的成长之路?10年5000字总结

2.如何快速看懂别人的代码和思维

3.单片机开发项目全局变量太多怎么管理?

4.C语言开发单片机为什么大多数都采用全局变量的形式

5.单片机怎么实现模块化编程?实用程度让人发指!

6.c语言回调函数的使用及实际作用详解

7.手把手教你c语言队列实现代码,通俗易懂超详细!

8.c语言指针用法详解,通俗易懂超详细!

无际单片机编程 单片机编程、全栈孵化。
评论
  •   军事领域仿真推演系统的战略价值与发展前瞻   北京华盛恒辉仿真推演系统通过技术创新与应用拓展,已成为作战效能提升的核心支撑。以下从战略应用与未来趋势展开解析:   应用案例   目前,已有多个仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润仿真推演系统。这些成功案例为仿真推演系统的推广和应用提供了有力支持。   一、核心战略应用   1. 作战理论创新引擎   依托低成本仿真平台,军事人员可高效验证新型作战概念。   2. 装备全周期优化   覆盖武器
    华盛恒辉l58ll334744 2025-05-14 16:41 138浏览
  • PT100温度传感器凭借其高精度(±0.1℃级)和宽温域(-200℃~850℃)特性,广泛应用于以下核心场景:‌一、工业过程控制‌1、‌化工与石油‌l 监测反应釜温度(-200℃~850℃),通过PID算法调控加热/冷却系统,提升化学反应效率与**性。l 原油输送管道中采用浸入式铠装设计(316L不锈钢套管),实现-50℃~300℃范围的黏度与温度联动控制。2、‌电力设备‌l 监测变压器绕组表面温度(≤180℃),结合光纤绝缘层预防热老化故障。l 发电机冷
    锦正茂科技 2025-05-15 13:02 76浏览
  • 在智能设备与物联网技术深度融合的产业浪潮下,无线遥控技术早已突破电视机、空调与投影仪等传统遥控领域的应用边界,完成了从基础单向指令传输向多维智能交互体系的补充迭代,可精准匹配现代工业领域对遥控距离、遥控精度与环境适应性等能力的核心诉求。其中,无线射频作为一种具备远距离传输、抗干扰能力强与技术成熟度高等优势的无线通信技术,尤其是在Sub-GHz频段下,其低功耗、强穿透与广覆盖的特性进一步凸显,是在各种复杂工业环境中实现高可靠性的无线遥控方案之一。Sub-GHz射频在工业遥控方案中有那些应用优势?众
    华普微HOPERF 2025-05-15 11:19 88浏览
  • 在当下竞争激烈的 AI 赛道,企业高层的变动往往牵一发而动全身,零一万物近来就深陷这样的动荡漩涡。近日,零一万物联合创始人、技术副总裁戴宗宏离职创业的消息不胫而走。这位在大模型基础设施领域造诣颇深的专家,此前在华为云、阿里达摩院积累了深厚经验,在零一万物时更是带领团队短期内完成了千卡 GPU 集群等关键设施搭建,其离去无疑是重大损失。而这并非个例,自 2024 年下半年以来,李先刚、黄文灏、潘欣、曹大鹏等一众联创和早期核心成员纷纷出走。
    用户1742991715177 2025-05-13 21:24 207浏览
  • 一、量子自旋态光学操控1、‌拓扑量子态探测‌磁光克尔效应通过检测拓扑磁结构(如磁斯格明子)的磁光响应,实现对量子材料中非平庸拓扑自旋序的非侵入式表征。例如,二维量子磁体中的“拓扑克尔效应”可通过偏振光旋转角变化揭示斯格明子阵列的动态演化,为拓扑量子比特的稳定性评估提供关键手段。2、‌量子态调控界面‌非厄米磁光耦合系统(如法布里-珀罗腔)通过耗散调控增强克尔灵敏度,可用于奇异点附近的量子自旋态高精度操控,为超导量子比特与光子系统的耦合提供新思路。二、光子量子计算架构优化1、‌光子内存计算器件‌基于
    锦正茂科技 2025-05-13 09:57 74浏览
  •   电磁数据展示系统平台解析   北京华盛恒辉电磁数据展示系统平台是实现电磁数据高效展示、分析与管理的综合性软件体系,以下从核心功能、技术特性、应用场景及发展趋势展开解读:   应用案例   目前,已有多个电磁数据展示系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据展示系统。这些成功案例为电磁数据展示系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与预处理   智能分析处理   集成频谱分析、时频变换等信号处理算法,自动提取时域频域特征;
    华盛恒辉l58ll334744 2025-05-13 10:20 402浏览
  • 在当下的商业版图中,胖东来宛如一颗璀璨的明星,散发着独特的光芒。它以卓越的服务、优质的商品以及独特的企业文化,赢得了消费者的广泛赞誉和业界的高度关注。然而,近期胖东来与自媒体博主之间的一场激烈对战,却如同一面镜子,映照出了这家企业在光环背后的真实与挣扎,也引发了我们对于商业本质、企业发展以及舆论生态的深入思考。​冲突爆发:舆论场中的硝烟弥漫​2025年4月,抖音玉石博主“柴怼怼”(粉丝约28万)突然发难,发布多条视频直指河南零售巨头胖东来。他言辞犀利,指控胖东来在玉石销售方面存在暴利行为,声称其
    疯人评 2025-05-14 13:49 127浏览
  • PT100温度传感器是一种基于铂(Pt)电阻特性的温度测量器件,广泛应用于工业、医疗和科研领域。以下是其核心特性与应用解析:‌1. 定义与原理‌‌基本特性‌:PT100在0℃时基准阻值为100Ω,其阻值随温度升高近似线性增长(100℃时约138.5Ω),遵循公式 ‌R=Ro(1+αT)‌(Ro为0℃阻值,α为温度系数)。‌工作原理‌:通过铂电阻的阻值变化反映温度,测温范围覆盖 ‌-200℃至+850℃‌,精度可达A级(±0.15℃)或B级(±0.30℃)。2.&nb
    锦正茂科技 2025-05-15 11:40 78浏览
  •   舰艇电磁兼容分析与整改系统平台解析   北京华盛恒辉舰艇电磁兼容分析与整改系统平台是保障海军装备作战效能的关键技术,旨在确保舰艇电子设备在复杂电磁环境中协同运行。本文从架构、技术、流程、价值及趋势五个维度展开解析。   应用案例   目前,已有多个舰艇电磁兼容分析与整改系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润舰艇电磁兼容分析与整改系统。这些成功案例为舰艇电磁兼容分析与整改系统的推广和应用提供了有力支持。   一、系统架构:模块化智能体系   电磁环境建模:基
    华盛恒辉l58ll334744 2025-05-14 11:22 121浏览
  • 在全球能源结构转型加速推进与政策驱动的双重作用下,油气输送、智慧水务及化学化工等流体计量场景正面临效率革命与智能化升级的迫切需求。传统机械式流量计虽在工业初期有效支撑了基础计量需求,但其机械磨损、精度衰减与运维困难等固有缺陷已难以适应现代工业对精准化、智能化与可持续发展的多维诉求。在此背景下,超声波流量计则凭借着高精度探测、可实时监测、无侵入式安装、无阻流部件、易于维护与绿色环保等优势实现了突破性发展,成为当代高精度流体计量体系中不可或缺的重要一环。该技术不仅是撬动能源利用效率提升、支撑智慧管网
    华普微HOPERF 2025-05-14 11:49 94浏览
  •   军事仿真推演系统平台核心解析   北京华盛恒辉军事仿真推演系统平台以计算机仿真技术为基石,在功能、架构、应用及效能上展现显著优势,成为提升军事作战与决策能力的核心工具。   应用案例   目前,已有多个仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润仿真推演系统。这些成功案例为仿真推演系统的推广和应用提供了有力支持。   一、全流程功能体系   精准推演控制:覆盖推演启动至结束全流程。   智能想定管理:集成作战信息配置、兵力部署功能。   数据模型整合
    华盛恒辉l58ll334744 2025-05-14 17:11 119浏览
  •   电磁数据管理系统深度解析   北京华盛恒辉电磁数据管理系统作为专业的数据处理平台,旨在提升电磁数据的处理效率、安全性与可靠性。以下从功能架构、核心特性、应用场景及技术实现展开分析:   应用案例   目前,已有多个电磁数据管理系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据管理系统。这些成功案例为电磁数据管理系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与接入:实时接收天线、频谱仪等设备数据,兼容多协议接口,确保数据采集的全面性与实时性
    华盛恒辉l58ll334744 2025-05-13 10:59 319浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦