现在需要配置参数来达到修改训练的方式,我现在需要新建一个参数来开关wandb的使用。 首先就是在def parse_option():函数里添加上你要使用的变量名 parser.add_argument("--open_wandb",type= bool,default=False,help='open wandb…
问题描述 在训练模型的过程中遇到了apex库的报错IndexError: tuple index out of range导致无法训练。在github查询后找到了解决方法 问题解决 需要修改/apex-master/apex/amp/utils.py这个文件的代码 从93行开始修改 if x in cache: cached_x = cache[x…
Github代码 1 安装需要的环境 需要在虚拟环境中安装onnx和onnxruntime(GPU),环境和自己的cuda版本要对应上查询链接 激活环境,查看环境的cuda版本,我是cuda11.6 +cudnn8302,那就选择1.14吧 conda activate xxxx python import torch # 查询cuda版本 pri…
今天想训练一个restnet,之前我是会用文件夹的方式加载数据集,但是师兄给我的数据是用.txt文件划分的训练集和验证集,知道是要把路径和标签提取出来,搞了半天没搞成,后边找到咋搞了。 我的数据形式是每个类别一个文件夹,路径和类别存到.txt里 首先解决中文类别的问题,将中文类别单独新建一个txt,按顺序给他们赋予数字,在对应起来 # 读取类别文件…