打印
[STM32H7]

STM32H7的Cache和MPU

[复制链接]
913|14
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
一、Cache

1、介绍

        Cache又分数据缓存D-Cache和指令缓冲I-Cache,STM32H7的数据缓存和指令缓存大小都是16KB。STM32H7主频是400MHz,除了TCM和Cache以400MHz工作,其它AXI SRAM,SRAM1,SRAM2等都是以200MHz工作。数据缓存D-Cache就是解决CPU加速访问SRAM。

        如果每次CPU要读写SRAM区的数据,都能够在Cache里面进行,自然是最好的,实现了200MHz到400MHz的飞跃,实际是做不到的,因为数据Cache只有16KB大小,总有用完的时候。

2、操作,分为读操作和写操作

        读操作: 如果CPU要读取的SRAM区数据在Cache中已经加载好,这就叫读命中(Cache hit),如果Cache里面没有怎么办,这就是所谓的读Cache Miss。

       写操作: 如果CPU要写的SRAM区数据在Cache中已经开辟了对应的区域(专业词汇叫Cache Line,以32字节为单位),这就叫写命中(Cache hit),如果Cache里面没有开辟对应的区域怎么办,这就是所谓的写Cache Miss。

3、H7支持的Cache策略,共4种


<回写:如果Cache中有,写数据只写到Cache,不写到RAM。>

<透写:如果Cache中有,写数据也要同时写到Cache和RAM。>

<write allocate:写数据时,如果Cache中没有,那么就要在Cache中开辟一个空间,把数据写入Cache,同时把RAM中的相邻数据加载进来填充Cache。>

<no write allocate:写数据时,如果Cache中没有,那么把数据直接写入RAM。>

<read allocate:读数据时,如果Cache中没有,那么就要在Cache中开辟一个空间,把数据从RAM中加载进来,后续的读操作,就可以直接从Cache中读取了。>

<no read allocate:读数据时,如果Cache中没有,那么直接从RAM中读。>
————————————————
版权声明:本文为CSDN博主「【ql君】qlexcel」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qlexcel/article/details/103117942


使用特权

评论回复
沙发
铁血丹心LLLL|  楼主 | 2023-5-29 14:28 | 只看该作者
4、风险

   从上面的图就看出来使用Cache的风险,因为DMA是直接与SRAM交换数据的,而CPU与SRAM之间隔了一个Cache,如果DMA更新了某个数据到SRAM,CPU要去访问,而恰好Cache中有,那么CPU就不会去SRAM中拿,就会拿到Cache中已经过时的数据。因此使用了DMA的内存区要配置为无Cache或者拿数据前清一次Cache。

使用特权

评论回复
板凳
铁血丹心LLLL|  楼主 | 2023-5-29 14:28 | 只看该作者
5、相关函数

        SCB_EnableICache(void) :用于使能指令Cache,系统上电后优先初始化即可。

        SCB_DisableICache(void) :用于禁止指令Cache。

        SCB_InvalidateICache(void) :用于将指令Cache无效化,无效化的意思是将Cache Line标记为无效,等同于删除操作。这样Cache空间就都腾出来了,可以加载新的指令。

        SCB_EnableDCache(void) :用于使能数据Cache,系统上电后优先初始化即可。

        SCB_DisableDCache(void) :用于禁止数据Cache。

        SCB_InvalidateDCache(void) :用于将数据Cache无效化,无效化的意思是将Cache Line标记为无效,等同于删除操作。这样Cache空间就都腾出来了,可以加载新的数据。

        SCB_CleanDCache(void):用于将数据Cache清除,清除的意思是将Cache Line中标记为dirty的数据写入到相应的存储区。

        SCB_CleanInvalidateDCache(void) :此函数是前面两个函数SCB_InvalidateDCache和SCB_CleanDCache的二合一。将Cache Line中标记为dirty的数据写入到相应的存储区后,再将Cache Line标记为无效,表示删除。这样Cache空间就都腾出来了,可以加载新的数据。

        SCB_InvalidateDCache_by_Addr(uint32_t *addr,int32_t dsize):可以指定地址和存储区大小,地址要32字节对齐,大小要是32字节的整数倍。用于将数据Cache无效化,无效化的意思是将Cache Line标记为无效,等同于删除操作。这样Cache空间就都腾出来了,可以加载新的数据。

        SCB_CleanDCache_by_Addr(uint32_t *addr,int32_t dsize):可以指定地址和存储区大小,地址要32字节对齐,大小要是32字节的整数倍。用于将数据Cache清除,清除的意思是将Cache Line中标记为dirty的数据写入到相应的存储区。

        SCB_CleanInvalidateDCache_by_Addr(uint32_t *addr,int32_t dsize):可以指定地址和存储区大小,地址要32字节对齐,大小要是32字节的整数倍。将Cache Line中标记为dirty的数据写入到相应的存储区后,再将Cache Line标记为无效,表示删除。这样Cache空间就都腾出来了,可以加载新的数据。

使用特权

评论回复
地板
铁血丹心LLLL|  楼主 | 2023-5-29 14:29 | 只看该作者
二、MPU

1、作用

        防止不受信任的应用程序访问受保护的内存区域; 防止用户应用程序破坏操作系统使用的数据;通过阻止任务访问其它任务的数据区;允许将内存区域定义为只读,以便保护重要数据;检测意外的内存访问。 简单的说就是内存保护、外设保护和代码访问保护。

使用特权

评论回复
5
铁血丹心LLLL|  楼主 | 2023-5-29 14:29 | 只看该作者
2、MPU可以配置的三种内存类型

1)、Normal memory

        CPU以最高效的方式加载和存储字节、半字和字,对于这种内存区,CPU的加载或存储不一定要按照程序列出的顺序执行。

2)、Device memory

        对于这种类型的内存区,加载和存储要严格按照次序进行,这样是为了确保寄存器按照正确顺序设置。

3)、Strongly ordered memory

        程序完全按照代码顺序执行,CPU需要等待当前的加载/存储指令执行完毕后才执行下一条指令。这样会导致性能下降。

使用特权

评论回复
6
铁血丹心LLLL|  楼主 | 2023-5-29 14:35 | 只看该作者
3、MPU的使用

        MPU可以配置保护16个内存区域(这16个内存域是独立配置的),每个区域最小要求256字节,每个区域还可以配置为8个子区域。由于子区域一般都相同大小,这样每个子区域的大小就是32字节,正好跟Cache的Cache Line大小一样。

        使用时把一段连续的内存区配置为一个MPU保护区域,然后再配置这个MPU保护区域的特性。比如128KB的DTCM、64KB的SRAM4、32MB的SDRAM。MPU保护区域的特性使用MPU_RASR寄存器来配置,描述如下:

使用特权

评论回复
7
铁血丹心LLLL|  楼主 | 2023-5-29 14:35 | 只看该作者

使用特权

评论回复
8
铁血丹心LLLL|  楼主 | 2023-5-29 14:35 | 只看该作者
1)、XN:用于控制这个MPU保护区域能否执行程序代码。

2)、AP:用于控制这个MPU保护区域的特权级和非特权级的读写访问权限。

使用特权

评论回复
9
铁血丹心LLLL|  楼主 | 2023-5-29 14:36 | 只看该作者

使用特权

评论回复
10
铁血丹心LLLL|  楼主 | 2023-5-29 14:36 | 只看该作者
3)、TEX、C、B、S:H7支持4种Cache策略,这几位就是用来控制这个MPU保护区域使用哪一种。

使用特权

评论回复
11
铁血丹心LLLL|  楼主 | 2023-5-29 14:36 | 只看该作者
S位用于解决多总线或者多核访问的共享问题,一般不要开启。

4)、SRD:这个位用于控制内存区的子区域 ,使用的是bit[15:8],共计8个bit,一个bit控制一个子区域, 0表示使能此子区域, 1表示禁止。一般情况下,取值0x00,表示8个子区域都使能。

5)、SIZE:配置这个MPU保护区域的大小。

使用特权

评论回复
12
铁血丹心LLLL|  楼主 | 2023-5-29 14:36 | 只看该作者
三、HAL配置例程
//设置某个区域的MPU保护
//baseaddr:MPU保护区域的基址(首地址)
//size:MPU保护区域的大小(必须是32的倍数,单位为字节),可设置的值参考:CORTEX_MPU_Region_Size
//rnum:MPU保护区编号,范围:0~7,最大支持8个保护区域,可设置的值参考:CORTEX_MPU_Region_Number
//ap:访问权限,访问关系如下:可设置的值参考:CORTEX_MPU_Region_Permission_Attributes
//0,无访问(特权&用户都不可访问)
//1,仅支持特权读写访问
//2,禁止用户写访问(特权可读写访问)
//3,全访问(特权&用户都可访问)
//4,无法预测(禁止设置为4!!!)
//5,仅支持特权读访问
//6,只读(特权&用户都不可以写)
//详见:STM32F7 Series Cortex-M7 processor programming manual.pdf,4.6节,Table 89.
//sen:是否允许共用;0,不允许;1,允许
//cen:是否允许catch;0,不允许;1,允许
//返回值;0,成功.
//    其他,错误.
u8 MPU_Set_Protection(u32 baseaddr,u32 size,u32 rnum,u32 ap,u8 sen,u8 cen,u8 ben,u8 Tex)
{
        MPU_Region_InitTypeDef MPU_Initure;
        HAL_MPU_Disable();                                                                        //配置MPU之前先关闭MPU,配置完成以后在使能MPU

        MPU_Initure.Enable=MPU_REGION_ENABLE;                                //使能该保护区域
        MPU_Initure.Number=rnum;                                            //设置保护区域
        MPU_Initure.BaseAddress=baseaddr;                            //设置基址
        MPU_Initure.Size=size;                                                    //设置保护区域大小
        MPU_Initure.SubRegionDisable=0X00;                      //禁止子区域
        MPU_Initure.TypeExtField=Tex;                           //设置类型扩展域
        MPU_Initure.AccessPermission=(u8)ap;                            //设置访问权限,
        MPU_Initure.DisableExec=MPU_INSTRUCTION_ACCESS_ENABLE;        //允许指令访问(允许读取指令)
        MPU_Initure.IsShareable=sen;                            //是否允许共用
        MPU_Initure.IsCacheable=cen;                            //是否允许cache
        MPU_Initure.IsBufferable=ben;                           //是否允许缓冲
        HAL_MPU_ConfigRegion(&MPU_Initure);                     //配置MPU
        HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT);                                //开启MPU
    return 0;
}

//设置需要保护的存储块
//必须对部分存储区域进行MPU保护,否则可能导致程序运行异常
//比如MCU屏不显示,摄像头采集数据出错等等问题...
void MPU_Memory_Protection(void)   //特意把SRAM4设置为不允许cache,使用DMA的变量可以放在这里。但要注意相应DMA能否访问SRAM4
{
        MPU_Set_Protection(0x20000000,MPU_REGION_SIZE_128KB,MPU_REGION_NUMBER1,MPU_REGION_FULL_ACCESS,0,1,1,MPU_TEX_LEVEL0);        //保护整个DTCM,共128K字节,禁止共用,允许cache,允许缓冲
        MPU_Set_Protection(0x24000000,MPU_REGION_SIZE_512KB,MPU_REGION_NUMBER2,MPU_REGION_FULL_ACCESS,0,1,1,MPU_TEX_LEVEL0);        //保护整个内部SRAM,包括SRAM1,SRAM2和DTCM,共512K字节
        MPU_Set_Protection(0x30000000,MPU_REGION_SIZE_512KB,MPU_REGION_NUMBER3,MPU_REGION_FULL_ACCESS,0,1,1,MPU_TEX_LEVEL0);        //保护整个SRAM1~SRAM3,共288K字节,禁止共用,允许cache,允许缓冲
        MPU_Set_Protection(0x38000000,MPU_REGION_SIZE_64KB ,MPU_REGION_NUMBER4,MPU_REGION_FULL_ACCESS,0,0,1,MPU_TEX_LEVEL0);        //保护整个SRAM4,共64K字节,禁止共用,不允许cache,允许缓冲
        MPU_Set_Protection(0x60000000,MPU_REGION_SIZE_64MB ,MPU_REGION_NUMBER5,MPU_REGION_FULL_ACCESS,0,0,0,MPU_TEX_LEVEL0);        //保护MCU LCD屏所在的FMC区域,,共64M字节,禁止共用,禁止cache,禁止缓冲
        MPU_Set_Protection(0xC0000000,MPU_REGION_SIZE_64MB ,MPU_REGION_NUMBER6,MPU_REGION_FULL_ACCESS,0,1,1,MPU_TEX_LEVEL0);        //保护SDRAM区域,共32M字节,禁止共用,允许cache,允许缓冲
}

使用特权

评论回复
13
铁血丹心LLLL|  楼主 | 2023-5-29 14:37 | 只看该作者
四、其他

        值得一提的是,LTDC也是直接从RAM拿数据的,如果你使用了GUI(比如EMWIN),你的显示数据可能会暂存在Cache,而LTDC直接从RAM拿数据,就可能造成画面撕裂、重影、斑点之类的问题。解决方法是,把显存设置成透写。

使用特权

评论回复
14
铁血丹心LLLL|  楼主 | 2023-5-29 14:37 | 只看该作者
从下面的图可以看到,Cache是在M7那个框里面的。而框外面的外设都可以直接与RAM交换数据,因此使用外设操作数据时都要考虑一下Cache的影响,不然异常可能难以预料。

使用特权

评论回复
15
铁血丹心LLLL|  楼主 | 2023-5-29 14:37 | 只看该作者
参考及复制:

安富莱_STM32-V7开发板_用户手册 http://www.armbbs.cn/forum.php

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

66

主题

487

帖子

1

粉丝