Image
Image

9dome猫

+ 关注

粉丝 2     |     主题 141     |     回帖 1577

ST-GCN复现的全过程(详细)
2024-1-18 14:14
  • ST MCU
  • 35
  • 1006
  总结的问题 主要的运行流程就是 处理数据集,训练,测试 遇到的一些问题就是: 远程连接服务器要记得把代 ...  
  这里我之前在3070上跑的时候,训练到70多个epoch,因为网断了,由于远程连接的,所以训练也直接中断了。我 ...  
  ......  
  比如我这次只训练了40个epoch被中断了,然后model放在了work_dir下的recognition下,我就可以直接用训练好 ...  
  改成要测试的就行了 比如 ntu-xsub 如果训练的model没有放在model包下,放在了work_dir下,也可以手动添 ...  
  ......  
  第三步 测试 训练模型时,每10个epoch会保存一次模型,在model包下,训练完毕时使用test命令. ...  
  这个跑的还挺快的,一个epoch用时9分钟左右吧,之前3070一个epoch好像要13分钟左右。(感觉如果用多gpu并行 ...  
  ......  
  然后再输入运行的命令,就开始跑了,batch-size设置的64,epoch为80(之前3070跑的时候batchsize只能设到8, ...  
  ......  
  主要修改的是torchlight包下的gpu.py文件:  
  一开始给我报错了,是cuda设备相关的问题,代码里是如果gpu个数大于1,可以设置并行运行,超算云服务器好 ...  
  ......  
  第二步 训练网络 我先训练的是ntu-xsub ,readme里也有命令  
  ......  
  命令输入完毕后,会开始处理数据集,分别是xsub的train和val 还有xview的train和val,最后如果你没有做其 ...  
  这里遇到我犯了个超蠢的错误: 我一开始无论怎么解析我的地址,都显示找不到该文件夹,我一开始以为是字符 ...  
  这个就是处理的终端命令,是执行tools包下的ntu_gendata.py文件来输出数据集的,data_path是通过参数解析你 ...  
  第一步 处理数据集 终端进入服务器配好的虚拟环境,然后cd到服务器st-gcn代码文件夹的位置 ...  
2
3
近期访客