C64x 系列一次取指取 8 个指令(8x4 个字节)。L1P Cache 也是直接映射结构的,每一个 cache line 都对应一个在 32 字节边界对齐的取指包(32字节,8个指令)。
可是,如果取指地址不是 32 字节对齐,那么取到的 8 个指令是哪 8 个呢?
例如:流水线 E1 阶段的跳转指令要求跳转到地址 0x00000208,那么 PG 阶段产生的取指地址是 0x00000200 还是 0x00000208?从 SPRU732j 中的指令说明看到,这种情况下 PCE 被置成 0x00000208(也就是跳转目标地址),是否就是说 PG 阶段产生的取指地址就是 0x00000208?
假设取指地址就是 0x00000208,那么在流水线 PR 阶段接收到的指令(32字节)是 0x00000200~0x00000220 (对齐在32字节边界)还是 0x00000208~0x00000228(非对齐)?
如果是 0x00000208~0x00000228(非对齐)的话,那么从此开始的每次取指都会变成非对齐,每次取指都要在 L1P Cache 中进行两次命中,才能取到完整的一个取指包,直到下一次跳转指令跳转到新的地址为止。是这样吗?
请问TI的哪个文档有对这种情况进行过示例或者说明?或者哪个文档有对 C64x 流水线有更详细的说明?
谢谢! |