terryzhouhz 发表于 2022-5-4 20:48

DMA(Direct Memory Access)技术

本帖最后由 terryzhouhz 于 2022-5-4 20:57 编辑

DMA外设和存储器(或存储器和存储器)直接通过总线进行数据交换而不经过CPU的技术。在MCU中,DMA是一项十分重要的技术,它可以降低CPU的处理压力,提高外设数据的处理效率。概念:
[*]通道:DMA的通道表示一组外设对存储器的请求,
[*]数据对齐:源和目的数据源的地址要对齐,传输宽度对齐
[*]仲裁器:协调优先权,多个外设访问同一个存储器时可通过软件设置优先级,优先级相同时由硬件决策
DMA的定义可以看出,这是一种利用总线的技术,降低CPU在数据读取和存储上面的压力,可以执行其他操作。当CPU初始化这个传输动作,传输动作本身是由DMA 控制器来实行和完成。DMA 控制器和Cortex-M3核共享系统数据总线执行直接存储器数据传输。当CPU和DMA同时访问相同的目标(RAM或外设)时,DMA请求可能会停止 CPU访问系统总线达若干个周期,总线仲裁器执行循环调度,以保证CPU至少可以得到一半的系统总线(存储器或外设)带宽。stm32F4中的DMADMA主要特性直接存储器访问 (DMA) 用于在外设与存储器之间以及存储器与存储器之间提供高速数据传 输。可以在无需任何 CPU 操作的情况下通过 DMA 快速移动数据。这样节省的 CPU 资源可 供其它操作使用。DMA 控制器基于复杂的总线矩阵架构,将功能强大的双 AHB 主总线架构与独立的 FIFO 结 合在一起,优化了系统带宽。两个 DMA 控制器总共有 16 个数据流(每个控制器 8 个),每一个 DMA 控制器都用于管理 一个或多个外设的存储器访问请求。每个数据流总共可以有多达 8 个通道(或称请求)。每 个通道都有一个仲裁器,用于处理 DMA 请求间的优先级。
[*]每个数据流有单独的四级 32 位先进先出存储器缓冲区 (FIFO)
[*]可供每个数据流选择的通道请求多达 8 个。此选择可由软件配置,允许几个(several,注意不是同时启用)。在DMA_SxCR数据流配置寄存器中,CHSEL唯一确定一个通道的使用)外设启动 DMA请求
手册上的框图为:根据上表可以看出,一个DMA控制器管理8个数据流,每个数据流含8个通道,每个数据流在外设和存储器之间均存在一个FIFO做数据缓冲。每个数据流都与一个 DMA 请求相关联,然而并不是每个通道都能与一个DMA请求相关联,例如DMA1:即每个数据流选择一个通道内的DMA请求生效,源传输和目标传输在整个 4 GB 区域(地址在 0x0000 0000 和 0xFFFF FFFF 之间)都可以寻址外设和存储器。三种传输模式
[*]外设到存储器

[*]使能这种模式(将 DMA_SxCR 寄存器中的位 EN 置 1)时,每次产生外设请求,数据流都会启动数据源到 FIFO 的传输。
[*]达到 FIFO 的阈值级别时,FIFO 的内容移出并存储到目标中,直接模式下每完成一次从外设到 FIFO 的数据传输后,相应的数据立即就会移出并存储到目标中。
[*]只有赢得仲裁后,FIFO数据才会被取走
[*]存储器到外设

[*]使能这种模式(将 DMA_SxCR 寄存器中的 EN 位置 1)时,数据流会立即启动传输,从源完全填充 FIFO。
[*]每次发生外设请求,FIFO 的内容都会移出并存储到目标中。
[*]只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。
[*]存储器到存储器

[*]DMA 通道在没有外设请求触发的情况下同样可以工作。
[*]通过将 DMA_SxCR 寄存器中的使能位 (EN) 置 1 来使能数据流时,数据流会立即开始填充 FIFO,直至达到阈值级别。达到阈值级**,FIFO 的内容便会移出,并存储到目标中。
[*]只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。

上面说的这三种模式,其实简单的理解下就是数据可以先放入FIFO,等待触发时一次取走或写入,或者直接模式不用等FIFO到达阈值就操作。DMA的配置与工作流程DMA可以类比为仓库的货物搬移,因此需要配置以下几个基本的条件:仓库的位置,仓库的单位,仓库的大小,搬的方式。以HAL库的配置方式为例:
[*]配置目的地和源,这里可以认为是仓库的位置
DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
[*]配置DMA缓存大小,可以认为是仓库的容量
DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
[*]配置外设和存储器地址寄存器是否递增,这里的意思是数据是放在同一个地方还是递增往下放,源和目的单独可配
DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
[*]设置外设和存储器数据宽度,仓库的单位,单位不一致放置会出问题。
DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
[*]设置DMA工作模式(循环或正常(单次))
DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
[*]设置优先级
DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
[*]设置模式(外设到存储器,存储器到外设,存储器到存储器)
DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
以摄像头DCMI的DMA配置为例首先看代码://DCMI DMA配置
//DMA_Memory0BaseAddr:存储器地址    将要存储摄像头数据的内存地址(也可以是外设地址)
//DMA_BufferSize:存储器长度    0~65535
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryInc:存储器增长方式
void DCMI_DMA_Init(u32 DMA_Memory0BaseAddr, u16 DMA_BufferSize, u32 DMA_MemoryDataSize, u32 DMA_MemoryInc)
{
      DMA_InitTypeDef DMA_InitStructure;
      NVIC_InitTypeDef NVIC_InitStructure;
      //RCC_AHB2PeriphClockCmd(RCC_AHB2Periph_DCMI, ENABLE);//DCMI
      RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能
      
      DMA_DeInit(DMA2_Stream1);
      while (DMA_GetCmdStatus(DMA2_Stream1) != DISABLE) //等待DMA2_Stream1可配置
      {
      }

      /* 配置 DMA Stream */
      DMA_InitStructure.DMA_Channel = DMA_Channel_1;//通道1 DCMI通道
      DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址为:DCMI->DR
      DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
      DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
      DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
      DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
      DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
      DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
      DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
      DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
      DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
      DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
      DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
      DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
      DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
      DMA_Init(DMA2_Stream1, &DMA_InitStructure); //初始化DMA Stream

      DMA_ITConfig(DMA2_Stream1,DMA_IT_TC,ENABLE);
      NVIC_InitStructure.NVIC_IRQChannel=      DMA2_Stream1_IRQn;
      NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority=0;
      NVIC_InitStructure.NVIC_IRQChannelSubPriority=0;
      NVIC_InitStructure.NVIC_IRQChannelCmd=ENABLE;
      NVIC_Init(&NVIC_InitStructure);      //根据指定的参数初始化VIC寄存器、
}

void DMA2_Stream1_IRQHandler(void)
{      
      if(DMA_GetFlagStatus(DMA2_Stream1,DMA_FLAG_TCIF1)==SET)//DMA2_Steam1,传输完成标志
      {
               DMA_ClearFlag(DMA2_Stream1,DMA_FLAG_TCIF1);//清除传输完成中断
                        datanum++;
      }                                                                                             
}



首先是手册,可以使用DCMI的DMA数据流是DMA2的流1和流7的通道1,配置流程:
[*]while循环等待DMA2完成一次传输后配置DMA2,这里选择的是流1的通道1。
[*]之后配置外设地址和存储器地址,传输模式,数据传输量为1,即每次传1个字节。
[*]DCMI的地址是固定的,因此外设是非增量的,存储器是LCD,地址固定的非增量,长度为16位,外设是RGB565长度选择16位。
[*]传输是循环显示的,因此要循环模式,配置FIFO和传输方式,初始化DMA2和中断
使用DMA读写数据与CPU操作的对比我们做一个小实验,可能不一定准确,即通过DMA方式给USART发送数据进行计时计数,和通过CPU调用USART发送数据的时间进行对比,代码基础是在原子代码上修改而来。

#include "sys.h"#include "delay.h"#include "usart.h"#include "sram.h"#include "malloc.h"#include "ILI93xx.h"#include "led.h"#include "timer.h"#include "touch.h"#include "GUI.h"#include "GUIDemo.h"#include "includes.h"#include "../RESOURCES/**/**/**.h"#include "usmart.h"#include "spi.h"#include "w25qxx.h"#include "24cxx.h"#include "main_tasks.h"#include "ff.h"#include "exfuns.h"#include "fattester.h"#include "adc.h"#include "dma.h"
volatile uint32_t gcounter = 0;const u8 TEXT_TO_SEND[]={"STM32F4 DMA TEST. "};void extra_while_task(void);
//通用定时器5中断初始化//arr:自动重装值。//psc:时钟预分频数//定时器溢出时间计算方法:Tout=((arr+1)*(psc+1))/Ft us.//Ft=定时器工作频率,单位:Mhz//这里使用的是定时器3!void TIM5_Int_Init(u16 arr, u16 psc){      TIM_TimeBaseInitTypeDef TIM_TimeBaseInitStructure;      NVIC_InitTypeDef NVIC_InitStructure;
      RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM5, ENABLE);///使能TIM4时钟
      TIM_TimeBaseInitStructure.TIM_Prescaler = psc;//定时器分频      TIM_TimeBaseInitStructure.TIM_CounterMode = TIM_CounterMode_Up; //向上计数模式      TIM_TimeBaseInitStructure.TIM_Period = arr;   //自动重装载值      TIM_TimeBaseInitStructure.TIM_ClockDivision = TIM_CKD_DIV1;
      TIM_TimeBaseInit(TIM5, &TIM_TimeBaseInitStructure);
      TIM_ITConfig(TIM5, TIM_IT_Update, ENABLE); //允许定时器3更新中断      TIM_Cmd(TIM5, ENABLE); //使能定时器3
      NVIC_InitStructure.NVIC_IRQChannel = TIM5_IRQn; //定时器4中断      NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority = 0x02; //抢占优先级1      NVIC_InitStructure.NVIC_IRQChannelSubPriority = 0x03; //子优先级3      NVIC_InitStructure.NVIC_IRQChannelCmd = ENABLE;      NVIC_Init(&NVIC_InitStructure);
}//定时器5中断服务函数void TIM5_IRQHandler(void){      if (TIM_GetITStatus(TIM5, TIM_IT_Update) == SET) //溢出中断      {                gcounter++;      }      TIM_ClearITPendingBit(TIM5, TIM_IT_Update);//清除中断标志位}
//DMAx的各通道配置//这里的传输形式是固定的,这点要根据不同的情况来修改//从存储器->外设模式/8位数据宽度/存储器增量模式//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7//chx:DMA通道选择,@ref DMA_channel DMA_Channel_0~DMA_Channel_7//par:外设地址//mar:存储器地址//ndtr:数据传输量void MYDMA_Config(DMA_Stream_TypeDef *DMA_Streamx,u32 chx,u32 par,u32 mar,u16 ndtr){       DMA_InitTypeDefDMA_InitStructure;            if((u32)DMA_Streamx>(u32)DMA2)//得到当前stream是属于DMA2还是DMA1      {          RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能                       }else       {          RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA1,ENABLE);//DMA1时钟使能       }DMA_DeInit(DMA_Streamx);            while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}//等待DMA可配置       /* 配置 DMA Stream */DMA_InitStructure.DMA_Channel = chx;//通道选择DMA_InitStructure.DMA_PeripheralBaseAddr = par;//DMA外设地址DMA_InitStructure.DMA_Memory0BaseAddr = mar;//DMA 存储器0地址DMA_InitStructure.DMA_DIR = DMA_DIR_MemoryToPeripheral;//存储器到外设模式DMA_InitStructure.DMA_BufferSize = ndtr;//数据传输量 DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable;//外设非增量模式DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc_Enable;//存储器增量模式DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Byte;//外设数据长度:8位DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize_Byte;//存储器数据长度:8位DMA_InitStructure.DMA_Mode = DMA_Mode_Normal;// 使用普通模式 DMA_InitStructure.DMA_Priority = DMA_Priority_Medium;//中等优先级DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Disable;         DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full;DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single;//存储器突发单次传输DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single;//外设突发单次传输DMA_Init(DMA_Streamx, &DMA_InitStructure);//初始化DMA Stream      
} //开启一次DMA传输//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7 //ndtr:数据传输量void MYDMA_Enable(DMA_Stream_TypeDef *DMA_Streamx,u16 ndtr){       DMA_Cmd(DMA_Streamx, DISABLE);                      //关闭DMA传输             while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}      //确保DMA可以被设置                      DMA_SetCurrDataCounter(DMA_Streamx,ndtr);          //数据传输量       DMA_Cmd(DMA_Streamx, ENABLE);                      //开启DMA传输 }
int main(void){      u8 count = 0;      uint8_t buffer;      u8 res = 0;      POINT_COLOR = DARKBLUE;      delay_init(168);      //延时初始化      NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);   //中断分组配置      uart_init(115200);      //串口波特率设置      TFTLCD_Init();          //初始化LCD      KEY_Init();      LED_Init();             //LED初始化      TIM3_Int_Init(10000 - 1, 16800 - 1); //10Khz计数,1秒钟中断一次      //不需要经过OS的任务      extra_while_task();      }
#define SEND_BUF_SIZE 8000void extra_while_task(void){      u32 i = 0;      u8 t=0,mask=0,j=sizeof(TEXT_TO_SEND);      u8 SendBuff;      //发送数据缓冲区      if(1)      {                for(i=0;i<SEND_BUF_SIZE;i++)//填充ASCII字符集数据                {                        if(t>=j)//加入换行符                        {                              if(mask)                              {                                        SendBuff=0x0a;                                        t=0;                              }else                               {                                        SendBuff=0x0d;                                        mask++;                              }                              }else//复制TEXT_TO_SEND语句                        {                              mask=0;                              SendBuff=TEXT_TO_SEND;                              t++;                        }                            }                               Adc_Init();         //初始化ADC                TIM5_Int_Init(10 - 1, 16800 - 1); //10Khz计数,10个us中断一次                while(1)                {                        //Get_Adc_Average(ADC_Channel_5,20);//获取通道5的转换值,20次取平均                        //按DMA发送                        MYDMA_Config(DMA2_Stream7,DMA_Channel_4,(u32)&USART1->DR,(u32)SendBuff,SEND_BUF_SIZE);//DMA2,STEAM7,CH4,外设为串口1,存储器为SendBuff,长度为:SEND_BUF_SIZE.                        USART_DMACmd(USART1,USART_DMAReq_Tx,ENABLE);//使能串口1的DMA发送                           gcounter = 0;                        MYDMA_Enable(DMA2_Stream7,SEND_BUF_SIZE);   //开始一次DMA传输!                        while(1)                  {                              if(DMA_GetFlagStatus(DMA2_Stream7,DMA_FLAG_TCIF7)!=RESET)//等待DMA2_Steam7传输完成                              {                                         DMA_ClearFlag(DMA2_Stream7,DMA_FLAG_TCIF7);//清除DMA2_Steam7传输完成标志                                        printf("dma over: %d\r\n",gcounter);                                        break;                         }                  }                        //按CPU发送                        printf("cpu start\r\n");                        gcounter = 0;                        for(i = 0;i<SEND_BUF_SIZE;i++)                        {                              while ((USART1->SR & 0X40) == 0); //循环发送,直到发送完毕                              USART1->DR = (u8)SendBuff;                        }                        printf("cpu over: %d\r\n",gcounter);                        while(1);//halt                }      }}
实验结果,DMA的计数是355:USART直接发送是392:发送的数据量是8000个字节,相当于8k,当数据量更大时DMA的优势就很明显了。

页: [1]
查看完整版本: DMA(Direct Memory Access)技术