打印

st1为什么如此耗时?

[复制链接]
164|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
我的代码模式是:
while(4096){
\"ld1    { v8.4s,  v9.4s,v10.4s, v11.4s}, [%2], #64 n\" // output
\"ld1    {v12.4s, v13.4s,v14.4s, v15.4s}, [%2], #64   n\" // output
\"sub    %1, %1, #128                  n\"
\"ld1    {v0.4s, v1.4s, v2.4s, v3.4s}, [%1], #16  n\"
计算部分;
\"st1    {v12.4s, v13.4s,v14.4s, v15.4s}, [%2], #64 n\" // output
\"st1    { v8.4s,  v9.4s, v10.4s, v11.4s},[%2], #64 n\" // output
}

如图所示,为什么存储st1部分所占耗时的比例将近42%?

使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

437

主题

437

帖子

0

粉丝