打印
[其他]

mm32-2nd-bootloader技术白皮书—配置软硬件环境

[复制链接]
758|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
本帖最后由 MM灵灵灵 于 2023-3-23 09:38 编辑

mm32-2nd-bootloader技术白皮书—配置软硬件环境

1. 引言
1.1 需求
MM32F5 系列微控制器具备 QSPI 接口,可以外接 QSPI Flash,扩大可使用的 Flash 空间,从而满足那些需要大 Flash 空间应用的需求,让 Flash 空间的大小不再成为限制应用开发的瓶颈。

但使用 QSPI Flash 之前,还需要对 QSPI 接口进行配置,然后才能执行存储在 QSPI Flash 上的代码,这让应用程序的开发变得复杂。

因此,需要一些解决方案,能够让用户尽可能无感地使用 QSPI Flash 存储应用程序。

1.2 案例
以 MM32F5277E9PV 微控制器为例,这个微控制器搭载着 ArmChina STAR-MC1 内核,主频可达 120MHz,拥有 256KB Flash 和 128KB SRAM,使用这块芯片,可以实现一些 “复杂的应用”,例如,运行一个带有 GUI 功能的应用。

在编译这个 “复杂的应用” 时,编译器可能会报错,显示缺少足够 Flash 空间;这个应用可能包含了图片,字库,好几个协议栈,所需要的 Flash 空间非常大,一般微控制器不会拥有这么大的片内 Flash。因此,需要外接一个 QSPI Flash 来解决这个问题。

MM32F5270 系列微控制器带有 QSPI 接口,可以使用 QSPI Flash 来扩展微控制器可使用的 Flash 空间;如果担心外接 QSPI Flash 占据 PCB 空间,则可使用 MM32F5280 系列微控制器,该微控制器合封有一块 1MB ~ 2MB 的 QSPI Flash,无需考虑 QSPI Flash 的电路,节省 PCB 面积。

通过外接 QSPI Flash,就可以拥有足够的空间来实现这个 “复杂的应用”。但开发应用时,仍希望像使用片内 Flash 那样使用 QSPI Flash:下载程序的时候,直接点击 IDE 的下载按钮,就能下载程序;调试代码的时候,直接点击调试按钮,就能进行软件调试;只需少量修改代码,就能让应用程序保存在 QSPI Flash 中,让微控制器直接执行。

为了让 IDE 下载程序到 QSPI Flash 中,需要有一个合适的下载算法。为了让编译器知道应用程序要保存在 QSPI Flash 中,需要修改 Linker 文件,让编译器知道 QSPI Flash 的地址范围。为了让微控制器执行存储在 QSPI Flash 中的程序,还需要实现合适的 2nd Bootloader ,引导微控制器去执行 QSPI Flash 中的程序。

1.3 目标
  • 在 MDK 平台上实现定制化的下载算法,可将应用程序下载到 QSPI Flash 中。
  • 尽可能少地改动应用程序代码,使其能够存储在 QSPI Flash 中。
  • 实现简单的 2nd Bootloader,使其能够引导微控制器执行存储在 QSPI Flash 中的应用程序。
  • 在上述的 2nd Bootloader 的基础上,实现量产下载,更新应用程序等特殊功能。

2. 配置硬件环境
2.1 硬件环境
2.1.1 QSPI Flash
工欲善其事,必先利其器,想在 QSPI Flash 上存储应用程序,就需要选择一款合适的 QSPI Flash 芯片。

选型时,需要重点关注工作电压的范围,部分 QSPI Flash 的工作电压在 1.8V 左右,如果使用 3.3V 供电,是没办法正常工作的,反之亦然。

除了电压范围外,部分 QSPI Flash 芯片在默认情况下,是不允许使用四线模式的,原本 QSPI 的 D2 & D3 引脚会被用于写保护使能(WP)和 HOLD 使能。让 QSPI Flash 允许使用四线模式的方法,需参照使用的 QSPI Flash 芯片手册进行操作。建议使用默认处于四线模式的 QSPI Flash,或者在设计 2nd Bootloader 时,能在跳转到应用程序之前,将四线模式打开。

MM32F5 系列的微控制器支持大多数常见的 QSPI Flash,表1中列举的 QSPI Flash 芯片为经过实际测试可用的 QSPI Flash 芯片:


2.1.2 MCU
硬件电路设计时,需要了解微控制器的哪些引脚可作为 QSPI 接口,表2 是 MM32F5270 系列微控制器的 QSPI 接口引脚:


其引脚配置如下:
  • 引脚模式:复用推挽输出。
  • 引脚速度:高速模式,QSPI 的 SCK 时钟最快可达 60MHz,因此应配置成高速模式。
  • 引脚复用功能号:巧合的是,当引脚作为 QSPI 接口时,复用功能号均为 AF10。

下表为MM32F5280 系列微控制器的引脚:


可以发现,MM32F5280 系列微控制器只有一组引脚可作为 QSPI 接口,并且这些引脚并没有引出到芯片外部,这是由于 MM32F5280 系列微控制器内部合封了 QSPI Flash,其引脚已经在芯片内部与 QSPI Flash 相连,不需要再引出至芯片外部。

虽然 MM32F5280 片内合封了 QSPI Flash,对应的引脚也直接与其相连,但在使用这块 QSPI Flash 时,仍需配置相应的引脚,其配置方法与 MM32F5270 完全一致。

由于 MM32F5280 系列微控制器将其 QSPI Flash 合封在了芯片内部,因此在 PCB 设计时,可减少外围元件的数量,降低了产品成本。

当使用 MM32F5270 + QSPI Flash 的方案时,由于 QSPI 信号线暴露在微控制器外部,易受到外部电磁环境的干扰,可能无法以最快的速度(SCK 的频率为 60MHz)访问 QSPI Flash,但这个问题在 MM32F5280 上就不会出现。

当然,也正是由于 MM32F5280 系列微控制器的 QSPI Flash 合封在了芯片内部,如果想用使用更大的 Flash 时,还是需要使用 MM32F5270 + QSPI Flash 的方案。

2.1.3 Board
PLUS-F5270开发板,如下图所示:


PLUS-F5270 板载华邦的 W25Q64JVSIQ,Flash 大小为 8MB (64Mb),3.3V 供电,默认情况下,四线模式处于打开状态。

MM32F5270 连接该 QSPI Flash 所使用的引脚号如下图所示:


在PLUS-F5270开发板上,MM32F5270芯片与QSPI Flash W25Q64的引脚对应关系如表4所示。


在设计 MM32F5270 + QSPI Flash 的应用时,建议优先采用 PF6(QSPI_CS)、PG7(QSPI_SCK)、PG6(QSPI_D0)、PF8(QSPI_D1)、PF10(QSPI_D2)、PG8(QSPI_D3) 引脚,从而可使用 MM32F5280 MCU 无缝替换 MM32F5270。

2.2 软件工具
在开发调试 MM32F5270 + QSPI Flash 这个 “复杂的应用” 时,需要一些软件工具:

2.2.1 开发平台
嵌入式软件的开发需要一个软件平台,这个软件平台可以是 MDK,IAR,ARMGCC 等,本文将以 MDK 为例,开发并调试所需要的软件。在官网(https://www.keil.com/download/product)页面上,可下载MDK-ARM的安装包并启动安装,使用 MDK 进行工程的调试与下载。

需要注意,MDK 的软件版本最低为 5.37,且需使用 AC6 编译器,旧版本 AC5 编译器不支持编译 STAR-MC1 平台的软件。

2.2.2 下载算法
不同于 SRAM,修改 Flash 中的内容时,需要先将 Flash 中的数据整块擦除,再通过特殊的方法将数据写入到 Flash 中,而不是直接往指定地址进行写操作。因此,需要有一段中间程序,能够帮助调试器将指定位置的数据,写入到 Flash 中。

这段中间程序就叫做下载算法,它运行在 SRAM 中,在修改 Flash 中的内容前,调试器会先将下载算法通过 SWD 或其他调试接口加载到 SRAM 中并执行,然后再加载存放到 Flash 中的数据,让存储在 SRAM 中的下载算法将数据写入到 Flash 中。

获取下载算法有三种方式:
  • 从 MCU 厂商的官网中下载相应 MCU 的 PACK 包中获取。
  • 从 MDK 的 Pack Installer 中获取。
  • 使用开发平台提供的模板文件自行制作。

2.2.3 2nd Bootloader
2nd Bootloader 将会引导微控制器执行存放在 QSPI Flash 中的应用程序,之所以称为 2nd Bootloader,是为了区分固化在微控制器内部的 1st Bootloader。当然,2nd Bootloader 也可以固化到微控制器中,作为 1st Bootloader 来使用,但那样就失去了可定制化的意义。

2nd Bootloader 执行存储在 QSPI Flash 上的应用程序之前,会先初始化 QSPI 外设,以及所用到的 GPIO 引脚,让微控制器能够通过访问地址的形式访问 QSPI Flash,就像访问片内 Flash 那样。当然,这只是 2nd Bootloader 最基本的功能,在此基础上,还可以增加一些定制化的功能,例如为量产而准备的串口 + Ymodem 下载固件功能,或者增加 OTA 升级的方案。

3. SPI,DSPI 和 QSPI
在了解什么是 QSPI 之前,我们先了解下什么是 SPI:

SPI 是英语 Serial Peripheral interface 的缩写,顾名思义就是串行外围设备接口,一种高速的,全双工,同步的通信总线,并且在芯片的管脚上只占用四根线,节约了芯片的管脚,为 PCB 的布局上节省空间,提供方便,主要应用在 EEPROM,Flash,RTC,AD转换,传感器等设备上。

SPI 的四根信号线:
  • CS:片选信号线,每个设备都占用一个片选信号线,当 CS 信号线显低电平时,表示该设备被选中,则 SCK,MOSI 和 MISO 信号有效。每个设备都拥有属于自己的 CS 信号线,主机选中设备时,会拉低指定设备的 CS 线电平。使用 CS 信号线,可以使多个设备共同使用同一份 SCK,MOSI 和 MISO 信号线,减少引脚数量,也可以告诉设备本次访问已结束,方便下次重新发起访问请求。
  • SCK:时钟信号线,为 SPI 通信过程中提供时钟信号,当 SCK 每次产生上升沿或下降沿时,MOSI 和 MISO 传输一比特数据。
  • MOSI:主机发送,从机接收信号线,主机通过该信号线发送数据,从机从该信号线接收到数据。
  • MISO:主机接收,从机发送信号线,与 MOSI 相反,这里主机要接收数据,从机要发送数据。两根串行数据信号线保证了主从机之间可以全双工通信。

SPI 可以实现全双工通信,但与 SPI Flash 通信的时候反而不需要进行全双工通信:在 Host 不把指令和地址发送完之前,SPI Flash 不会知道 Host 要干嘛,自然不会主动向 Host 发送数据;在 SPI Flash 向 Host 发送数据的时候,Host 也没有必要发送任何数据,因此,当 Host 与 SPI Flash 通信时,总是处于半双工状态,也总有一根数据信号线处于空闲状态。如下图所示。


为了把这跟信号线充分利用起来,从而发明了 DSPI 。

当 SPI Flash 准备给 Host 发送数据的时候,如果把 MOSI 也作为 SPI Flash 给 Host 发送数据的数据信号线使用,则每个 SCK 时钟可以发送两比特的数据:原来的MOSI (现在称之为 D0)发送第一个比特,MISO(现在称之为 D1)发送第二个比特,在不增加信号线的基础上,一个时钟发送两个比特数据,相当于传输速率提升了一倍!这就叫做 DSPI,D 是 Dual 的意思。如下图所示。


但 DSPI 的速度好像还是有些慢,如果再增加两条数据线(D3 和 D4),让传输速度提升到 DSPI 的两倍,那么 DSPI 就变成了 QSPI,Q 是 Quad 的缩写。

相比较于 SPI,QSPI 在数据传输的时候,一个 SCK 时钟能传输 4 比特数据,两个 SCK 时钟就能传输一字节的数据,性能提升,让 CPU 直接执行存储在 SPI Flash 的程序变成了可能。如下图所示。


能否再让数据引脚增加一倍,8 根数据线岂不是速度更快,那就了解下 FSMC 吧,直接 16 根数据信号线,速度自然变得更快了,但使用 SPI FLash,不就是图一个线少嘛。

为了方便描述,我们将使用 QSPI 接口连接的 SPI Flash 称之为 QSPI Flash。一般来说,在与 QSPI Flash 通信时,并不是全程都是四根数据信号线传输数据,当同一时间只有一根数据线在传输数据的模式可称为单线模式,两根数据线可称为双线模式,四根数据线可称为四线模式。

4. 通信过程
在使用 QSPI 与 QSPI Flash 通信的过程中,可分为五个阶段:
  • 指令阶段:传输方向为 Host 发送给 QSPI Flash,目的是告诉 QSPI Flash 接下来要做什么事情,其长度只能为 8 bit。
  • 地址阶段:传输方向为 Host 发送给 QSPI Flash,目的是告诉 QSPI Flash 要从哪个地址开始读或写数据,其长度可能为 8 bit,16 bit,24 bit 和 32 bit。
  • 交替字节阶段:传输方向为 Host 发送给 QSPI Flash,具体用法需参考所使用的 QSPI Flash 手册,传输方向由 Host 发送给 QSPI Flash,其长度可能为 8 bit,16 bit,24 bit 和 32 bit。
  • 空指令周期阶段:给 QSPI Flash 缓冲时间准备数据,等待 n 个 SCK 周期,n 取值范围 0 ~ 31,具体值需参考所使用 QSPI Flash 手册。这段时间 Host 只产生特定数量的 SCK 时钟,不从数据信号线中读取或发送任何内容。
  • 数据阶段:读数据或写数据,长度不定,由主机决定发送或接收多少数据。

在与 QSPI Flash 通信时,其通信过程如下图所示:


CS(NSS)信号线拉低,表示 QSPI Flash 器件被微控制器选中,然后发送一个字节大小的指令,紧接着发送地址,然后是交替字节,空指令周期,最后是数据,任意两个阶段之间都是紧挨着的。

一般来说,每次与 QSPI Flash 通信都至少包含指令阶段,其余的阶段都是可选的,例如读写 QSPI Flash 的寄存器值,只需要指令阶段和数据阶段;写使能和写失能,只需要指令阶段;读写数据,需要指令,地址,数据阶段,可能还有空指令周期阶段。

但有一种情况下,可能会省略掉指令阶段,部分 QSPI Flash 支持仅在第一次读数据的时候,需要指令阶段,下一次读数据的时候,直接由地址阶段开始,无需指令阶段。

一般 QSPI Flash 还支持一种叫做 QPI 模式的通信方式,当 QSPI Flash 进入 QPI 模式后,所有的阶段都只能使用四线模式通信,包括指令阶段,通过这种方式,能够极大减少指令阶段和地址阶段花费的 SCK 时钟数。

5. 通信实例
下图是一款型号为 FM25Q16A QSPI Flash 的 Fast Read Quad Output 的传输波形示意图:


从图中可以看到,四线快读数据的过程中分为四个步骤:
  • 指令阶段:Host 发送了一个 8 bit 长度的指令 0x6B,使用单线模式。
  • 地址阶段:一段 24bit 长度的地址,使用单线模式。
  • 空指令周期:8 bit 的空指令周期。
  • 数据阶段:以四线模式连续读取存储在 QSPI Flash 指定位置的数据。

可以发现,除了数据阶段,其它阶段均以单线模式工作,数据阶段则是四线模式,每两个时钟读取一个字节的数据。当读取一个四字节数据时,总共花费了 48 个 SCK 时钟。

6.  通过内存地址访问 QSPI Flash

前文中了解了如何通过 QSPI 接口访问 QSPI Flash,但如果每次通信都要配置 QSPI 外设的寄存器,再通过 QSPI 的数据寄存器获取数据的话,则无法让微控制器直接执行存储在 QSPI Flash 中的程序(XIP)。

因此,可以将 QSPI Flash 映射到一段指定的内存地址空间内,例如,指定到 0x90000000 ~ 0x9FFFFFFF 这段 256MB 大小的空间内,当 CPU 访问 0x90000008 这段地址时,QSPI 模块将会读取 QSPI Flash 中 0x00000008 的数据,如果 CPU 继续访问 0x9000000C 的数据时,QSPI 模块将会读取 QSPI Flash 中 0x0000000C 的数据。对 CPU 而言,访问存储在 QSPI Flash 中的数据,就只是访问某一段地址空间的数据。这种读数据的方式称为 QSPI 的直接读模式,如下图所示。


值得注意的是,32 位的 CPU 一般会连续读取 4 字节的数据,当 CPU 读取 0x90000008 这段地址时,实际读取了 0x90000008 ~ 0x9000000B 四个字节的数据,但 QSPI 不会每读取一字节数据,就发起一次指令阶段+地址阶段+数据阶段的过程,而是以指令阶段+地址阶段+数据阶段读一字节,再读一字节,再读一字节……的方式读数据,当后面 CPU 继续访问 0x0000000C 时,就会跳过指令阶段和地址阶段,直接继续数据阶段再读一字节,再读一字节……直到微控制器访问了一个不连续的地址时,QSPI 才会重新发起指令阶段和地址阶段。

因为地址连续的访问 QSPI Flash,QSPI 无需再次发起指令和地址阶段,所以其访问速度会比地址不连续的访问速度要快。

计算机程序有一个特点,叫做时间局限性和空间局限性:
  • 时间局限性:最近被访问的单元,很可能在不久的将来还要被访问。
  • 空间局限性:最近被访问的单元,很可能它附近的单元也即将被访问。

基于上述的特点,一般支持 QSPI 扩展 Flash 的微控制器会使用 CACHE 来暂存 QSPI Flash 中的内容,当 CPU 再次访问  QSPI Flash 前一段时间曾访问过的地址时,实际上访问的是暂存在 CACHE 中的数据,以此来减少访问 QSPI Flash 所花费的时间,加快程序执行的速度。在实际使用 QSPI Flash 存储应用程序的时候,效果可能不比片内 Flash 差多少。

直接读模式能够读取 QSPI Flash 中的数据,但 QSPI Flash 中的程序不是一直不变的,不管程序员调试代码,还是 OTA 升级,都需要读数据之外的操作,这时候,如果还使用直接读模式访问 QSPI Flash 的话,就显得不太合适了:直接模式下,我们只需要配置一次 QSPI 访问 QSPI Flash 各阶段的配置,就能不断读取 QSPI Flash 中的数据,虽然方便,但缺少一定的自由度,例如无法实现写操作等过程。

因此,QSPI 还提供了间接模式,间接模式下,需要指定每一次数据传输过程的每一个细节:如指令阶段的参数是什么,地址阶段的具体地址值是多少等,虽然复杂,但给了我们充分通过 QSPI 访问 QSPI Flash 的方法,例如,当我们希望写修改 QSPI Flash 中的数据时,就可以使用间接写模式,将数据阶段的传输方向由 QSPI Flash 到 Host 转变为 Host 到 QSPI Flash,而在直接模式下,数据阶段只能是由 QSPI Flash 到 Host。

7. 总结
在本章中,介绍了 SPI,DSPI,QSPI的区别,访问 QSPI Flash 的过程,以及微控制器如何通过 QSPI 的直接读模式访问 QSPI Flash。

微控制器通过 QSPI 的直接读模式访问 QSPI Flash,为直接执行存储在 QSPI Flash 中的应用程序提供了可能,这也是 2nd Bootloader 的目的所在。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

认证:上海灵动微电子股份有限公司
简介:上海灵动微电子股份有限公司成立于 2011 年,是中国本土通用 32 位 MCU 产品及解决方案供应商。 灵动股份的 MCU 产品以 MM32 为标识,基于 Arm Cortex-M 系列内核,自主研发软硬件和生态系统。目前已量产近 300 多款型号,累计交付超 4 亿颗,在本土通用 32 位 MCU 公司中位居前列。

86

主题

104

帖子

5

粉丝