打印
[程序源码]

DMA(Direct Memory Access)技术

[复制链接]
2801|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
本帖最后由 terryzhouhz 于 2022-5-4 20:57 编辑

DMA外设和存储器(或存储器和存储器)直接通过总线进行数据交换而不经过CPU的技术。在MCU中,DMA是一项十分重要的技术,它可以降低CPU的处理压力,提高外设数据的处理效率。
概念:
  • 通道:DMA的通道表示一组外设对存储器的请求,
  • 数据对齐:源和目的数据源的地址要对齐,传输宽度对齐
  • 仲裁器:协调优先权,多个外设访问同一个存储器时可通过软件设置优先级,优先级相同时由硬件决策
DMA的定义可以看出,这是一种利用总线的技术,降低CPU在数据读取和存储上面的压力,可以执行其他操作。当CPU初始化这个传输动作,传输动作本身是由DMA 控制器来实行和完成。
DMA 控制器和Cortex-M3核共享系统数据总线执行直接存储器数据传输。当CPU和DMA同时访问相同的目标(RAM或外设)时,DMA请求可能会停止 CPU访问系统总线达若干个周期,总线仲裁器执行循环调度,以保证CPU至少可以得到一半的系统总线(存储器或外设)带宽。
stm32F4中的DMADMA主要特性
直接存储器访问 (DMA) 用于在外设与存储器之间以及存储器与存储器之间提供高速数据传 输。可以在无需任何 CPU 操作的情况下通过 DMA 快速移动数据。这样节省的 CPU 资源可 供其它操作使用。
DMA 控制器基于复杂的总线矩阵架构,将功能强大的双 AHB 主总线架构与独立的 FIFO 结 合在一起,优化了系统带宽。
两个 DMA 控制器总共有 16 个数据流(每个控制器 8 个),每一个 DMA 控制器都用于管理 一个或多个外设的存储器访问请求。每个数据流总共可以有多达 8 个通道(或称请求)。每 个通道都有一个仲裁器,用于处理 DMA 请求间的优先级。
  • 每个数据流有单独的四级 32 位先进先出存储器缓冲区 (FIFO)
  • 可供每个数据流选择的通道请求多达 8 个。此选择可由软件配置,允许几个(several,注意不是同时启用)。在DMA_SxCR数据流配置寄存器中,CHSEL[2:0]唯一确定一个通道的使用)外设启动 DMA请求

手册上的框图为:
根据上表可以看出,一个DMA控制器管理8个数据流,每个数据流含8个通道,每个数据流在外设和存储器之间均存在一个FIFO做数据缓冲。
每个数据流都与一个 DMA 请求相关联,然而并不是每个通道都能与一个DMA请求相关联,例如DMA1:
即每个数据流选择一个通道内的DMA请求生效,源传输和目标传输在整个 4 GB 区域(地址在 0x0000 0000 和 0xFFFF FFFF 之间)都可以寻址外设和存储器。
三种传输模式
  • 外设到存储器
    • 使能这种模式(将 DMA_SxCR 寄存器中的位 EN 置 1)时,每次产生外设请求,数据流都会启动数据源到 FIFO 的传输。
    • 达到 FIFO 的阈值级别时,FIFO 的内容移出并存储到目标中,直接模式下每完成一次从外设到 FIFO 的数据传输后,相应的数据立即就会移出并存储到目标中。
    • 只有赢得仲裁后,FIFO数据才会被取走
  • 存储器到外设
    • 使能这种模式(将 DMA_SxCR 寄存器中的 EN 位置 1)时,数据流会立即启动传输,从源完全填充 FIFO。
    • 每次发生外设请求,FIFO 的内容都会移出并存储到目标中。
    • 只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。
  • 存储器到存储器
    • DMA 通道在没有外设请求触发的情况下同样可以工作。
    • 通过将 DMA_SxCR 寄存器中的使能位 (EN) 置 1 来使能数据流时,数据流会立即开始填充 FIFO,直至达到阈值级别。达到阈值级**,FIFO 的内容便会移出,并存储到目标中。
    • 只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。

上面说的这三种模式,其实简单的理解下就是数据可以先放入FIFO,等待触发时一次取走或写入,或者直接模式不用等FIFO到达阈值就操作。
DMA的配置与工作流程
DMA可以类比为仓库的货物搬移,因此需要配置以下几个基本的条件:仓库的位置,仓库的单位,仓库的大小,搬的方式。以HAL库的配置方式为例:
  • 配置目的地和源,这里可以认为是仓库的位置
DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
  • 配置DMA缓存大小,可以认为是仓库的容量
DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
  • 配置外设和存储器地址寄存器是否递增,这里的意思是数据是放在同一个地方还是递增往下放,源和目的单独可配
DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
  • 设置外设和存储器数据宽度,仓库的单位,单位不一致放置会出问题。
DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
  • 设置DMA工作模式(循环或正常(单次))
DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
  • 设置优先级
DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
  • 设置模式(外设到存储器,存储器到外设,存储器到存储器)
DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
以摄像头DCMI的DMA配置为例
首先看代码:
//DCMI DMA配置
//DMA_Memory0BaseAddr:存储器地址    将要存储摄像头数据的内存地址(也可以是外设地址)
//DMA_BufferSize:存储器长度    0~65535
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryInc:存储器增长方式
void DCMI_DMA_Init(u32 DMA_Memory0BaseAddr, u16 DMA_BufferSize, u32 DMA_MemoryDataSize, u32 DMA_MemoryInc)
{
        DMA_InitTypeDef DMA_InitStructure;
        NVIC_InitTypeDef NVIC_InitStructure;
        //RCC_AHB2PeriphClockCmd(RCC_AHB2Periph_DCMI, ENABLE);//DCMI
        RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能
        
        DMA_DeInit(DMA2_Stream1);
        while (DMA_GetCmdStatus(DMA2_Stream1) != DISABLE) //等待DMA2_Stream1可配置
        {
        }

        /* 配置 DMA Stream */
        DMA_InitStructure.DMA_Channel = DMA_Channel_1;  //通道1 DCMI通道
        DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址为:DCMI->DR
        DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
        DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
        DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
        DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
        DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
        DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
        DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
        DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
        DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
        DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
        DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
        DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
        DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
        DMA_Init(DMA2_Stream1, &DMA_InitStructure); //初始化DMA Stream

        DMA_ITConfig(DMA2_Stream1,DMA_IT_TC,ENABLE);
        NVIC_InitStructure.NVIC_IRQChannel=        DMA2_Stream1_IRQn;
        NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority=0;
        NVIC_InitStructure.NVIC_IRQChannelSubPriority=0;
        NVIC_InitStructure.NVIC_IRQChannelCmd=ENABLE;
        NVIC_Init(&NVIC_InitStructure);        //根据指定的参数初始化VIC寄存器、
}

void DMA2_Stream1_IRQHandler(void)
{        
        if(DMA_GetFlagStatus(DMA2_Stream1,DMA_FLAG_TCIF1)==SET)//DMA2_Steam1,传输完成标志
        {  
                 DMA_ClearFlag(DMA2_Stream1,DMA_FLAG_TCIF1);//清除传输完成中断
                        datanum++;
        }                                                                                             
}



首先是手册,可以使用DCMI的DMA数据流是DMA2的流1和流7的通道1,配置流程:
  • while循环等待DMA2完成一次传输后配置DMA2,这里选择的是流1的通道1。
  • 之后配置外设地址和存储器地址,传输模式,数据传输量为1,即每次传1个字节。
  • DCMI的地址是固定的,因此外设是非增量的,存储器是LCD,地址固定的非增量,长度为16位,外设是RGB565长度选择16位。
  • 传输是循环显示的,因此要循环模式,配置FIFO和传输方式,初始化DMA2和中断
使用DMA读写数据与CPU操作的对比
我们做一个小实验,可能不一定准确,即通过DMA方式给USART发送数据进行计时计数,和通过CPU调用USART发送数据的时间进行对比,代码基础是在原子代码上修改而来。


#include "sys.h"
#include "delay.h"
#include "usart.h"
#include "sram.h"
#include "malloc.h"
#include "ILI93xx.h"
#include "led.h"
#include "timer.h"
#include "touch.h"
#include "GUI.h"
#include "GUIDemo.h"
#include "includes.h"
#include "../RESOURCES/**/**/**.h"
#include "usmart.h"
#include "spi.h"
#include "w25qxx.h"
#include "24cxx.h"
#include "main_tasks.h"
#include "ff.h"
#include "exfuns.h"
#include "fattester.h"
#include "adc.h"
#include "dma.h"

volatile uint32_t gcounter = 0;
const u8 TEXT_TO_SEND[]={"STM32F4 DMA TEST. "};
void extra_while_task(void);

//通用定时器5中断初始化
//arr:自动重装值。
//psc:时钟预分频数
//定时器溢出时间计算方法:Tout=((arr+1)*(psc+1))/Ft us.
//Ft=定时器工作频率,单位:Mhz
//这里使用的是定时器3!
void TIM5_Int_Init(u16 arr, u16 psc)
{
        TIM_TimeBaseInitTypeDef TIM_TimeBaseInitStructure;
        NVIC_InitTypeDef NVIC_InitStructure;

        RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM5, ENABLE);  ///使能TIM4时钟

        TIM_TimeBaseInitStructure.TIM_Prescaler = psc;  //定时器分频
        TIM_TimeBaseInitStructure.TIM_CounterMode = TIM_CounterMode_Up; //向上计数模式
        TIM_TimeBaseInitStructure.TIM_Period = arr;   //自动重装载值
        TIM_TimeBaseInitStructure.TIM_ClockDivision = TIM_CKD_DIV1;

        TIM_TimeBaseInit(TIM5, &TIM_TimeBaseInitStructure);

        TIM_ITConfig(TIM5, TIM_IT_Update, ENABLE); //允许定时器3更新中断
        TIM_Cmd(TIM5, ENABLE); //使能定时器3

        NVIC_InitStructure.NVIC_IRQChannel = TIM5_IRQn; //定时器4中断
        NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority = 0x02; //抢占优先级1
        NVIC_InitStructure.NVIC_IRQChannelSubPriority = 0x03; //子优先级3
        NVIC_InitStructure.NVIC_IRQChannelCmd = ENABLE;
        NVIC_Init(&NVIC_InitStructure);

}
//定时器5中断服务函数
void TIM5_IRQHandler(void)
{
        if (TIM_GetITStatus(TIM5, TIM_IT_Update) == SET) //溢出中断
        {
                gcounter++;
        }
        TIM_ClearITPendingBit(TIM5, TIM_IT_Update);  //清除中断标志位
}

//DMAx的各通道配置
//这里的传输形式是固定的,这点要根据不同的情况来修改
//从存储器->外设模式/8位数据宽度/存储器增量模式
//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7
//chx:DMA通道选择,@ref DMA_channel DMA_Channel_0~DMA_Channel_7
//par:外设地址
//mar:存储器地址
//ndtr:数据传输量  
void MYDMA_Config(DMA_Stream_TypeDef *DMA_Streamx,u32 chx,u32 par,u32 mar,u16 ndtr)
{
        DMA_InitTypeDef  DMA_InitStructure;
        
        if((u32)DMA_Streamx>(u32)DMA2)//得到当前stream是属于DMA2还是DMA1
        {
          RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能
               
        }else
        {
          RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA1,ENABLE);//DMA1时钟使能
        }
  DMA_DeInit(DMA_Streamx);
        
        while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}//等待DMA可配置
        
  /* 配置 DMA Stream */
  DMA_InitStructure.DMA_Channel = chx;  //通道选择
  DMA_InitStructure.DMA_PeripheralBaseAddr = par;//DMA外设地址
  DMA_InitStructure.DMA_Memory0BaseAddr = mar;//DMA 存储器0地址
  DMA_InitStructure.DMA_DIR = DMA_DIR_MemoryToPeripheral;//存储器到外设模式
  DMA_InitStructure.DMA_BufferSize = ndtr;//数据传输量
  DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable;//外设非增量模式
  DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc_Enable;//存储器增量模式
  DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Byte;//外设数据长度:8位
  DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize_Byte;//存储器数据长度:8位
  DMA_InitStructure.DMA_Mode = DMA_Mode_Normal;// 使用普通模式
  DMA_InitStructure.DMA_Priority = DMA_Priority_Medium;//中等优先级
  DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Disable;         
  DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full;
  DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single;//存储器突发单次传输
  DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single;//外设突发单次传输
  DMA_Init(DMA_Streamx, &DMA_InitStructure);//初始化DMA Stream
        

}
//开启一次DMA传输
//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7
//ndtr:数据传输量  
void MYDMA_Enable(DMA_Stream_TypeDef *DMA_Streamx,u16 ndtr)
{
        DMA_Cmd(DMA_Streamx, DISABLE);                      //关闭DMA传输
        
        while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}        //确保DMA可以被设置  
               
        DMA_SetCurrDataCounter(DMA_Streamx,ndtr);          //数据传输量  
        DMA_Cmd(DMA_Streamx, ENABLE);                      //开启DMA传输
}

int main(void)
{
        u8 count = 0;
        uint8_t buffer[256];
        u8 res = 0;
        POINT_COLOR = DARKBLUE;
        delay_init(168);        //延时初始化
        NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);     //中断分组配置
        uart_init(115200);      //串口波特率设置
        TFTLCD_Init();          //初始化LCD
        KEY_Init();
        LED_Init();             //LED初始化
        TIM3_Int_Init(10000 - 1, 16800 - 1); //10Khz计数,1秒钟中断一次
        //不需要经过OS的任务
        extra_while_task();
        
}

#define SEND_BUF_SIZE 8000
void extra_while_task(void)
{
        u32 i = 0;
        u8 t=0,mask=0,j=sizeof(TEXT_TO_SEND);
        u8 SendBuff[SEND_BUF_SIZE];        //发送数据缓冲区
        if(1)
        {
                for(i=0;i<SEND_BUF_SIZE;i++)//填充ASCII字符集数据
                {
                        if(t>=j)//加入换行符
                        {
                                if(mask)
                                {
                                        SendBuff=0x0a;
                                        t=0;
                                }else
                                {
                                        SendBuff=0x0d;
                                        mask++;
                                }        
                        }else//复制TEXT_TO_SEND语句
                        {
                                mask=0;
                                SendBuff=TEXT_TO_SEND[t];
                                t++;
                        }              
                }                 
                Adc_Init();         //初始化ADC
                TIM5_Int_Init(10 - 1, 16800 - 1); //10Khz计数,10个us中断一次
                while(1)
                {
                        //Get_Adc_Average(ADC_Channel_5,20);//获取通道5的转换值,20次取平均
                        //按DMA发送
                        MYDMA_Config(DMA2_Stream7,DMA_Channel_4,(u32)&USART1->DR,(u32)SendBuff,SEND_BUF_SIZE);//DMA2,STEAM7,CH4,外设为串口1,存储器为SendBuff,长度为:SEND_BUF_SIZE.
                        USART_DMACmd(USART1,USART_DMAReq_Tx,ENABLE);  //使能串口1的DMA发送     
                        gcounter = 0;
                        MYDMA_Enable(DMA2_Stream7,SEND_BUF_SIZE);     //开始一次DMA传输!
                        while(1)
                    {
                                if(DMA_GetFlagStatus(DMA2_Stream7,DMA_FLAG_TCIF7)!=RESET)//等待DMA2_Steam7传输完成
                                {
                                        DMA_ClearFlag(DMA2_Stream7,DMA_FLAG_TCIF7);//清除DMA2_Steam7传输完成标志
                                        printf("dma over: %d\r\n",gcounter);
                                        break;
                        }
                    }
                        //按CPU发送
                        printf("cpu start\r\n");
                        gcounter = 0;
                        for(i = 0;i<SEND_BUF_SIZE;i++)
                        {
                                while ((USART1->SR & 0X40) == 0); //循环发送,直到发送完毕
                                USART1->DR = (u8)SendBuff;
                        }
                        printf("cpu over: %d\r\n",gcounter);
                        while(1);//halt
                }
        }
}

实验结果,DMA的计数是355:
USART直接发送是392:
发送的数据量是8000个字节,相当于8k,当数据量更大时DMA的优势就很明显了。


使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

73

主题

104

帖子

1

粉丝