九.ARM下的边界未对齐访问的后果
from http://blog.csdn.net/alenwelkin/archive/2006/12/19/1448324.aspx
自行编写了一个程序,定义一个char型数组如下:
char p[] = {0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80};
分别用long型和short型指针去指向p+3的位置,这个地址在编译后是0x10963,明显是一个对long和short来说都不对齐的地址。
程序输出结果如下,括号里为内容,前面是地址。
/mnt $ ./test
l 0x10963(0x30201040), s 0x10963(0x5040), lt 0x30201040, st 0x5040
使用arm-linux-objdump工具反汇编可执行文件发现,对于short指针的引用,编译器做了特殊处理以保证其引用的正确性,而long指针没有做。
unsigned long *l = (p + 3);
83e0: e59f3084 ldr r3, [pc, #132] ; 846c <.text+0x190>
83e4: e50b3010 str r3, [fp, #-16]
unsigned short *s = (p + 3);
83e8: e59f307c ldr r3, [pc, #124] ; 846c <.text+0x190>
83ec: e50b3014 str r3, [fp, #-20]
unsigned long lt = *l;
83f0: e51b3010 ldr r3, [fp, #-16] //变量l->r3
83f4: e5933000 ldr r3, [r3] //l内容->r3
83f8: e50b3018 str r3, [fp, #-24] //r3->lt
unsigned short st = *s;
83fc: e51b3014 ldr r3, [fp, #-20] //变量s->r3
8400: e5d32000 ldrb r2, [r3] //s内容(低位)->r2
8404: e5d33001 ldrb r3, [r3, #1] //s内容(高位)->r3
8408: e1823403 orr r3, r2, r3, lsl #8 //r3左移后与r2拼合成short值->r3
840c: e54b301a strb r3, [fp, #-26] //r3中的short值(低位)->变量st低位
8410: e1a03443 mov r3, r3, asr #8 //r3右移8位->r3
8414: e54b3019 strb r3, [fp, #-25] //r3中的short值(高位)->变量st高位
0x30201040是怎么来的?想了半天也不明白。
查 阅ARM相关书籍发现,如果协处理器CP15:c1:c0中的1位和22位均为0,则ARM指令ldr的返回值是memory(addr & ~3, 4) ROR ((addr & 3) * 8)。前半句的含义是对4边界向下取整,在本例中就是0x10960,再取其内容就是 0x40302010,后半句在本例中是循环右移24位。合起来看就是0x40302010 ROR 24 = 0x30201040,与本例正好吻合! |