基本硬件配置:I59400F+
第一天:ubuntu18.04+pytorch源码,编译未果,各种报错,参考了大佬的教程,但是版本不同——>教程
第二天:ubuntu16.04+pytorch源码,编译成功(while compiling, a bunch of warnings were raised).编译成功过后代码跑不起,报错信息好像是llvm的问题。编译成功之前的骚操作还是挺多挺麻烦的,主要是少了个rotcx库还是什么的。
第三天:ubuntu16.04+docker+pytorch编译,编译过程也是一堆warnings,编译过后测试跑不通,跑训练代码其中的.cuda()报错,意思是我没有nvidia显卡。
第四天,重新装了ubuntu18.04(为啥18我也不知道,可能是为了转个运把),决定先尝试docker安装的方式再尝试直接在主机上编译,毕竟直接编译的话要改rocm的一些东西,会比较麻烦。
第五天:终于成了。。原来之前报错是因为batch或显存的问题,先把batch设小跑起来以后,再停止程序把batch调大,居然就可以了??!!!可能是radeon VII的显存太大导致的?(已经将shm设为1G)
目前大概就这样用了,也不折腾在本机直接编译了。。实在么那个闲心











网友评论