打印

部分寄存器依赖霓虹灯1

[复制链接]
220|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
肉坨坨|  楼主 | 2018-9-9 14:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我在查找有关部分霓虹灯寄存器依赖项的任何信息时遇到问题。
以下面的代码为例:
ld2 {v0.16b, v1.16b}[0], [x0]
ld2 {v0.16b, v1.16b}[1], [x1]
ld2 {v0.16b, v1.16b}[2], [x2]
...

第二个负载是否必须等待上一个负载完成,还是可以立即继续?
我正在处理需要从256个16位条目表中堆放的图像数据,并且我想使用neon对其进行进一步处理。不幸的是,由于表的大小,tbl指令不是一个选项,因为它将占用所有32个寄存器。首先使用arm进行查找,然后将结果合并并传输到4个64位寄存器中,会更快吗?
如果有帮助,我的目标是Cortex-A57。

使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

419

主题

431

帖子

0

粉丝