[其他] Cortex-M3 ARM代码编译,链接与启动过程深度分析

[复制链接]
5182|61
 楼主| 米多0036 发表于 2022-12-31 13:35 | 显示全部楼层
对OS如何处理Link&&Loader这些细节感兴趣的,可以参考书籍:

程序员的自我修养—链接、装载与库
Linkers and Loaders
 楼主| 米多0036 发表于 2022-12-31 13:36 | 显示全部楼层
​ 我们这里处理的是裸程序的启动细节问题,首先我们要知道的是通过编译器和链接器之后得到的二进制可执行映像的结构。也就是说得出的那个 *.bin 文件里面长啥样?一图胜万言,上张图先。 989963afca3169c61.png
 楼主| 米多0036 发表于 2022-12-31 13:36 | 显示全部楼层
​ 大家都知道冯.诺依曼架构的计算机,它的基本思想是把“做事情的步骤和所需要的资源都提前编写好,然后让计算机自己根据需要读取操作步骤和资源,实现部分的计算自动化”。计算机的设计思想可谓是精妙的,实现真正的计算自动化也是很多科学家和工程师的夙愿。上面所说的做事情的步骤在计算机领域叫指令,所需要的资源在计算机领域叫数据。从计算机体系结构角度去看可执行映像的话,其实也就分为指令和数据两个大的部分。指令部分还是比较单一的,把各个源文件中的指令部分最后都汇聚到一起,形成所谓的text段。从功能上分,代码段只是需要CPU去读取,不需要修改,因为可以将其放在RO存储器里。数据这个部分从功能上来看,它必须支持读写,也即数据段执行时必须位于RW存储器里。从功能细节上分数据段又分为BSS段,Data段,Stack段,Heap段。从计算机体系结构角度来一一分析,从数据的生存周期角度来看,有的数据的生存周期和程序的生存周期是一致的(全局变量),有的数据的生存周期是根据使用情况即时分配和释放的(局部变量、malloc动态分配的变量)。BSS段和Data段属于全生命周期的数据,在源程序里主要是那些在文件域定义的全局变量和使用static关键字定义的全生命周期变量,Data是那些在程序里定义变量时初始化为固定值的量,BSS段是那些在程序里定义变量时未初始化的变量,这些变量在映像真正执行前会自动初始化为0。
 楼主| 米多0036 发表于 2022-12-31 13:39 | 显示全部楼层
对BSS段再多说一句,BSS段在映像文件里并不占用具体的空间,因为没有任何具体的信息,只需要在映像文件中提供BSS段的起始地址和大小信息即可。
 楼主| 米多0036 发表于 2022-12-31 13:40 | 显示全部楼层
在映像文件实际执行前,把BSS段要求的Data区域在实际RAM中预留出来并把这些区域初始化为0。短生命周期的数据包括Heap和Stack,它们的特点是随用随申请,用完就释放,比较灵活。Heap是一段预留出来的大空间,可以根据需求随时申请和释放,就是我们常见的malloc free函数操作的空间就是Heap 空间,这部分空间在映像里是独立出来的一段空间,见上面的程序映像图。
 楼主| 米多0036 发表于 2022-12-31 13:41 | 显示全部楼层
我们看到RO(RO-CODE/CODE+RO_DATA/CONST+RW_DATA)存储在Flash Memory的地址段是:0x08000000–0x0801FFFF 共128K。
 楼主| 米多0036 发表于 2022-12-31 13:41 | 显示全部楼层
RW存储(RW_CODE+RW_DATA+ZI_DATA)SRAM的地址段是:0x20000000–0x20007FFF 共32K。
 楼主| 米多0036 发表于 2022-12-31 13:44 | 显示全部楼层
​ 我们拿编译好的MAP文件看一下就一目了然了:
  1.     Total RO  Size (Code + RO Data)                12008 (  11.73kB)
  2.     Total RW  Size (RW Data + ZI Data)              2664 (   2.60kB)
  3.     Total ROM Size (Code + RO Data + RW Data)      12068 (  11.79kB)
 楼主| 米多0036 发表于 2022-12-31 13:45 | 显示全部楼层
你可以这么理解RO包含代码段和只读数据段,RW包含数据段和BSS段。
 楼主| 米多0036 发表于 2022-12-31 13:48 | 显示全部楼层
​ MCU的启动配置是从0x08000000地址开始启动。为节约RAM空间,我们启动时映像的代码段不搬运,直接读取Flash Memory,数据段需要可读写,因此需要将所有的数据段搬移到RAM中去。我们再看我们的启动代码startup_ac78xx.s, 我们有CopyDataInit和FillZerobss。
 楼主| 米多0036 发表于 2022-12-31 13:49 | 显示全部楼层
  1. .global  g_pfnVectors
  2. .global  Default_Handler

  3. /* start address for the initialization values of the .data section.
  4. defined in linker script */
  5. .word  _sidata
  6. /* start address for the .data section. defined in linker script */  
  7. .word  _sdata
  8. /* end address for the .data section. defined in linker script */
  9. .word  _edata
  10. /* start address for the .bss section. defined in linker script */
  11. .word  _sbss
  12. /* end address for the .bss section. defined in linker script */
  13. .word  _ebss
  14. /* stack used for SystemInit_ExtMemCtl; always internal RAM used */

  15. /**
  16. * [url=home.php?mod=space&uid=247401]@brief[/url]  This is the code that gets called when the processor first
  17. *          starts execution following a reset event. Only the absolutely
  18. *          necessary set is performed, after which the application
  19. *          supplied main() routine is called.
  20. * @param  None
  21. * @retval : None
  22. */

  23.     .section  .text.Reset_Handler
  24.   .weak  Reset_Handler
  25.   .type  Reset_Handler, %function
  26. Reset_Handler:  

  27. /* Copy the data segment initializers from flash to SRAM */  
  28.   movs  r1, #0
  29.   b  LoopCopyDataInit

  30. CopyDataInit:
  31.   ldr  r3, =_sidata
  32.   ldr  r3, [r3, r1]
  33.   str  r3, [r0, r1]
  34.   adds  r1, r1, #4
  35.    
  36. LoopCopyDataInit:
  37.   ldr  r0, =_sdata
  38.   ldr  r3, =_edata
  39.   adds  r2, r0, r1
  40.   cmp  r2, r3
  41.   bcc  CopyDataInit
  42.   ldr  r2, =_sbss
  43.   b  LoopFillZerobss
  44. /* Zero fill the bss segment. */  
  45. FillZerobss:
  46.   movs  r3, #0
  47.   str  r3, [r2], #4
  48.    
  49. LoopFillZerobss:
  50.   ldr  r3, = _ebss
  51.   cmp  r2, r3
  52.   bcc  FillZerobss

  53. /* Call the clock system intitialization function.*/
  54.   bl  SystemInit   
  55. /* Call static constructors */
  56. /*    bl __libc_init_array    */
  57. /* Call the application's entry point.'*/
  58.   bl  main
  59.   bx  lr   
  60. .size  Reset_Handler, .-Reset_Handler

 楼主| 米多0036 发表于 2022-12-31 13:49 | 显示全部楼层
大致情况见下图:
5806163afcd7908e47.png
 楼主| 米多0036 发表于 2022-12-31 13:50 | 显示全部楼层
Link Script,它控制着如何产生最终的映像文件。在分析具体的Link Script之前,先来说Link Script里最重要的概念,Address && Offset,前面也说了,到了映像文件格式这一层面,也就剩下各种连续的内容(段)和地址(Address)了,因此地址对映像来说是一个十分重要的资源。Link Script无非就是告诉链接器哪段东西放在哪个地址上。那些段需要搬运,当然搬运也是需要地址的。
 楼主| 米多0036 发表于 2022-12-31 13:51 | 显示全部楼层
来看看我们项目中用到的Link Script: 分连个层面来看,一是Memory Map相关的,一是段分配相关的。 先看Memory Map,

/* Specify the memory areas */
MEMORY
{
  FLASH (rx)      : ORIGIN = 0x08000000, LENGTH = 128K
  RAM (xrw)       : ORIGIN = 0x20000000, LENGTH = 32K
  MEMORY_B1 (rx)  : ORIGIN = 0x60000000, LENGTH = 0K
}
# (rx) 表示该区域的属性为只读与可执行属性
# (xrw)表示该区域的属性为读写与可执行属性
 楼主| 米多0036 发表于 2022-12-31 13:52 | 显示全部楼层
所以也可以这么理解RO表示FLASH区域,RW表示RAM区域。

链接脚本定义了上面提到的各种段,.isr_vector,.text, .data, .bss, heap和stack等不同的段。
 楼主| 米多0036 发表于 2022-12-31 13:53 | 显示全部楼层
.isr_vector
  1. /* Define output sections */
  2. SECTIONS
  3. {
  4.   /* The startup code goes first into FLASH */
  5.   /* isr_vector启动代码中断服务向量表区域从所谓的零地址0x0800 0000开始*/
  6.   .isr_vector :
  7.   {
  8.     . = ALIGN(4);
  9.     KEEP(*(.isr_vector)) /* Startup code */
  10.     . = ALIGN(4);
  11.   } >FLASH
  12. ......
  13. ......
  14. }
 楼主| 米多0036 发表于 2022-12-31 13:54 | 显示全部楼层
.text段
  1. /* Define output sections */
  2. SECTIONS
  3. {
  4. ......
  5. ......
  6.   /* The program code and other data goes into FLASH */
  7.   .text :
  8.   {
  9.     . = ALIGN(4);
  10.     *(.text)           /* .text sections (code) */
  11.     *(.text*)          /* .text* sections (code) */
  12.     *(.rodata)         /* .rodata sections (constants, strings, etc.) */
  13.     *(.rodata*)        /* .rodata* sections (constants, strings, etc.) */
  14.     *(.glue_7)         /* glue arm to thumb code */
  15.     *(.glue_7t)        /* glue thumb to arm code */
  16.         *(.eh_frame)

  17.     KEEP (*(.init))
  18.     KEEP (*(.fini))

  19.     . = ALIGN(4);
  20.     _etext = .;        /* define a global symbols at end of code */
  21.   } >FLASH
  22. ......
  23. ......
  24. }
 楼主| 米多0036 发表于 2022-12-31 13:55 | 显示全部楼层
data段和.bss段

.data段保存的是那些已经初始化了的全局静态变量和局部静态变量。.rodata段存放的是只读数据。一般是程序里面的只读变量(如const修饰的变量和字符串变量)。.bss段存放的是未初始化的全局变量和局部变量。
 楼主| 米多0036 发表于 2022-12-31 13:55 | 显示全部楼层
定义了每个段在映像文件中的排布方式,定义了有哪些段需要在运行前从FLASH中搬运到RAM中。我们拿出一个data段来进行说明。
 楼主| 米多0036 发表于 2022-12-31 13:56 | 显示全部楼层
  1. /* Define output sections */
  2. SECTIONS
  3. {
  4. ......
  5. ......
  6. /* used by the startup to initialize data */
  7.   _sidata = .;

  8.   /* Initialized data sections goes into RAM, load LMA copy after code */
  9.   .data : AT ( _sidata )
  10.   {
  11.     . = ALIGN(4);
  12.     _sdata = .;        /* create a global symbol at data start */
  13.     *(.data)           /* .data sections */
  14.     *(.data*)          /* .data* sections */

  15.     . = ALIGN(4);
  16.     _edata = .;        /* define a global symbol at data end */
  17.   } >RAM

  18.   /* Uninitialized data section */
  19.   . = ALIGN(4);
  20.   .bss :
  21.   {
  22.     /* This is used by the startup in order to initialize the .bss secion */
  23.     _sbss = .;         /* define a global symbol at bss start */
  24.     __bss_start__ = _sbss;
  25.     *(.bss)
  26.     *(.bss*)
  27.     *(COMMON)

  28.     . = ALIGN(4);
  29.     _ebss = .;         /* define a global symbol at bss end */
  30.     __bss_end__ = _ebss;
  31.   } >RAM

  32.   PROVIDE ( end = _ebss );
  33.   PROVIDE ( _end = _ebss );
  34. ......
  35. ......
  36. }
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 在线客服 返回列表 返回顶部