Yolov5的配置+训练(超级详细!!!)

您所在的位置:网站首页 yolo预训练模型的作用 Yolov5的配置+训练(超级详细!!!)

Yolov5的配置+训练(超级详细!!!)

2024-02-22 23:10| 来源: 网络整理| 查看: 265

我本来说只是单纯的记录一下第一次跑代码的流程的,结果看到了这么多大家都收藏和点赞,我决定再稍微改改他的排版,希望更多地朋友能在CV方向迅速上手! 一、NVIDIA驱动安装与更新 首先查看电脑的显卡版本,步骤为:此电脑右击–>管理–>设备管理器–>显示适配器。就可以看到电脑显卡的版本了。如图,可以看到我的是一块NVDIA GeForce MX150显卡。 在这里插入图片描述 有显卡驱动的,可以直接在桌面右键,找到英伟达驱动控制面板打开就好了。 在这里插入图片描述 显卡驱动的下载地址 在这里插入图片描述 安装(更新)好了显卡驱动以后。我们按下win+R组合键,打开cmd命令窗口。输入如下的命令。

nvidia-smi

得到如下图的信息图,可以看到驱动的版本是496.76;最高支持的CUDA版本是11.5版本。得到显卡的最高支持的CUDA版本,我们就可以根据这个信息来安装环境了。 在这里插入图片描述 二、Anaconda 的安装 打开网址,现在是2021年12月,对应的anaconda版本是支持python3.9。如果想下载之前的版本,或者更低python版本的anaconda,可以打开网址。 在这里插入图片描述 双击下载好的anaconda安装包,just me是说只供当前用户使用。all user 是供使用这台电脑的所有用户使用,是权限问题。对空间影响不大。如果你的电脑上只有建了一个用户,all users和just me 的作用是一样的。所以点击just me就好了。 在这里插入图片描述 然后点击next,当让你选择安装安装路径的时候,一定不要选择默认安装位置,因为默认位置是c盘,以后要在anaconda里面创建环境的时候会很占内存,最好在D盘中创建一个文件夹来放anaconda。 在这里插入图片描述 和图中一样将图中的√勾上,虽然出现红色的警告,但是要勾上,将anaconda添加到环境变量中去。然后点击完成就好了。 在这里插入图片描述 安装完成以后,按下开始键(win键)在左边就会出现anaconda3这个文件夹,可以发现anaconda已经安装好了。 在这里插入图片描述 三、Pytorch环境安装 按下开始键(win键),打开anaconda的终端。

创建虚拟环境conda create -n 环境名字(英文) python=x.x(python版本),如下,我就是创建了一个名字叫pytorch,python是3.8版本的环境。

conda create -n pytorch python=3.8

在base环境中执行如上的命令,就会创建一个新的虚拟环境,这个虚拟环境会安装一些基础的包,如下图所示。询问是否安装的时候,输入y。就可以创建环境了。 在这里插入图片描述

当安装好了以后,执行conda env list这个命令,就可以看到比一开始多了一个pytorch这个环境。现在我们可以在这个环境里面安装深度学习框架和一些Python包了。

conda env list

在这里插入图片描述 执行如下命令,激活这个环境。conda activate 虚拟环境名称

conda activate pytorch

安装pytorch-gup版的环境,由于pytorch的官网在国外,下载相关的环境包是比较慢的,所以我们给环境换源。在pytorch环境下执行如下的命名给环境换清华源。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/ conda config --set show_channel_urls yes

在这里插入图片描述 然后打开pytorch的官网,由于开头我们通过驱动检测到我的显卡为 NVDIA GeForce MX150,最高支持cuda11.5版本,所以我们选择cuda11.3版本的cuda,然后将下面红色框框中的内容复制下来,一定不要把后面的-c pytorch -c conda-forge也复制下来,因为这样运行就是还是在国外源下载,这样就会很慢。 在这里插入图片描述 将复制的内容粘贴到pytorch环境下的终端,运行就可以了 在这里插入图片描述 四、paddlepaddle环境安装 创建好了名叫paddle这个环境以后,进入到这个环境中(可以在pytorch环境下进入),执行如下命令。

conda activate paddle

我们在打开paddlepaddle的官网。我们选择cuda11.2版本。 在这里插入图片描述 复制如下的红色框框中的命令,由于这个命令就是在清华源中下载,所以直接复制这个命令到anaconda prompt中去然后运行就可以了。 运行如上的命名以后(中间会询问您是否确定安装,输入y就可以了),就可以安装paddlepaddle框架所需要的基本环境依赖包(如果中间网不好,导致有些包下载失败,从新运行如上的吗,命令就可以断点下载了)。 在这里插入图片描述 至此。pytorch和paddlepaddle的深度学习环境就安装好了。 五、pycharm安装–验证CUDA和cudnn版本 打开这个pycharm网址,可以发现一共有两个版本一个是专业版(Professional),一个是社区版(Community),专业版是需要花钱的,好几百美元一年。而社区版是免费的,但是也够用了,所以就下载安装社区版就好了。 在这里插入图片描述 将下载好的pycharm安装包,双击。安装的地址最好不要放在C盘,我是安装在D盘 在这里插入图片描述 将所有的√都勾上, 在这里插入图片描述 安装好了点击第二个框框,然后点完成就好了 在这里插入图片描述 打开pycharm,创建一个新的工程,来测试anaconda是否在安装pytorch框架的时候也安装了cuda和cudnn。按如下图创建一个工程 在这里插入图片描述 按以上的方式创建了一个工程,这时候我们就要选择我们在anaconda里面安装的环境,在界面的右下角 在这里插入图片描述 在这里插入图片描述 此时刚刚的右下角已经有了我们刚刚选择的pytorch环境中的python了。 在这里插入图片描述 我们在创建的工程里面创建一个python脚本,在脚本中运行如下代码,查看是否anconda在安装pytorch环境的时候也安装了cuda和cudnn。

import torch print(torch.cuda.is_available()) print(torch.backends.cudnn.is_available()) print(torch.cuda_version) print(torch.backends.cudnn.version())

可以发现控制台打印出两个True,可以说明cuda和cudnn已经安装。并且可以得到cuda的版本为11.3和cudnn的版本为8.2版本。 在这里插入图片描述 至此我们的深度学习环境安装就已经完全完成。接下来可以在相对的环境下进行深度学习的实验了。 六、labelimg的安装 这里主要讲的是在window系统中的安装,首先打开cmd命令行(快捷键:win+R)。进入cmd命令行控制台。输入如下的命令:

pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

运行如上命令后,系统就会自动下载labelimg相关的依赖。由于这是一个很轻量的工具,所以下载起来很快。 在这里插入图片描述 七、使用labelimg 首先这里需要准备我们需要打标注的数据集。这里我建议新建一个名为VOC2007的文件夹(这个是约定俗成,不这么做也行),里面创建一个名为JPEGImages的文件夹存放我们需要打标签的图片文件;再创建一个名为Annotations存放标注的标签文件;最后创建一个名为 predefined_classes.txt 的txt文件来存放所要标注的类别名称。 VOC2007的目录结构为:

├── VOC2007 │├── JPEGImages 存放需要打标签的图片文件 │├── Annotations 存放标注的标签文件 │├── predefined_classes.txt 定义自己要标注的所有类别(这个文件可有可无,但是在我们定义类别比较多的时候,最好有这个创建一个这样的txt文件来存放类别) 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述

首先在JPEGImages这个文件夹放置待标注的图片 在这里插入图片描述 然后再 predefined_classes.txt 这个txt文档里面输入定义的类别种类;如下图所示。 在这里插入图片描述 之后打开刚刚下载的labelimg 在这里插入图片描述 下面介绍图中的我们常用的按钮。 在这里插入图片描述待标注图片数据的路径文件夹,这里输入命令的时候就选定了JPEGImages。(当然这是可以换的) 在这里插入图片描述保存类别标签的路径文件夹,这里我们选定了Annotations文件夹。 在这里插入图片描述 这个按键可以说明我们标注的标签为voc格式,点击可以换成yolo或者createML格式。

点击View,会出现如图红色框框中的选项。最好和我一样把勾勾勾上。 Auto Save mode:切换到下一张图的时候,会自动保存标签。 Display Labels:会显示标注框和标签 Advanced Mode:标注的十字架会一直悬浮在窗口。

常用快捷键如下:

A:切换到上一张图片

D:切换到下一张图片

W:调出标注十字架

del :删除标注框框

Ctrl+u:选择标注的图片文件夹

Ctrl+r:选择标注好的label标签存在的文件夹

8、开始标注 由于我们设置标注的十字架一直在标注界面上,这就不需要我们按快捷键w,然后选定我们需要标注的对象。按住鼠标左键拖出框框就可以了。如下图所示,当我们选定目标以后,就会加载出来predefined_classes.txt 定义自己要标注的所有类别(如果类别多,是真的很方便,就不需要自己手打每个类别的名字了)。打好的标签框框上会有该框框的类别(图中由于颜色的原因不太清晰,仔细看会发现的)。然后界面最右边会出现打好的类别标签。打好一张照片以后,快捷键D,就会进入下一张,这时候就会自动保存标签文件(voc格式会保存xml,yolo会保存txt格式)。 在这里插入图片描述 标签打完以后可以去Annotations 文件下看到标签文件已经保存在这个目录下。在这里插入图片描述 自此labelimg使用讲解就结束了。 9、VOC标签格式转yolo格式并划分训练集和测试集 我们经常从网上获取一些目标检测的数据集资源标签的格式都是VOC(xml格式)的,而yolov5训练所需要的文件格式是yolo(txt格式)的,这里就需要对xml格式的标签文件转换为txt文件。同时训练自己的yolov5检测模型的时候,数据集需要划分为训练集和验证集。这里提供了一份代码将xml格式的标注文件转换为txt格式的标注文件,并按比例划分为训练集和验证集。先上代码再讲解代码的注意事项。

import xml.etree.ElementTree as ET import pickle import os from os import listdir, getcwd from os.path import join import random from shutil import copyfile classes = ["hat", "person"] #classes=["ball"] TRAIN_RATIO = 80 def clear_hidden_files(path): dir_list = os.listdir(path) for i in dir_list: abspath = os.path.join(os.path.abspath(path), i) if os.path.isfile(abspath): if i.startswith("._"): os.remove(abspath) else: clear_hidden_files(abspath) def convert(size, box): dw = 1./size[0] dh = 1./size[1] x = (box[0] + box[1])/2.0 y = (box[2] + box[3])/2.0 w = box[1] - box[0] h = box[3] - box[2] x = x*dw w = w*dw y = y*dh h = h*dh return (x,y,w,h) def convert_annotation(image_id): in_file = open('VOCdevkit/VOC2007/Annotations/%s.xml' %image_id) out_file = open('VOCdevkit/VOC2007/YOLOLabels/%s.txt' %image_id, 'w') tree=ET.parse(in_file) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) for obj in root.iter('object'): difficult = obj.find('difficult').text cls = obj.find('name').text if cls not in classes or int(difficult) == 1: continue cls_id = classes.index(cls) xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) bb = convert((w,h), b) out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n') in_file.close() out_file.close() wd = os.getcwd() wd = os.getcwd() data_base_dir = os.path.join(wd, "VOCdevkit/") if not os.path.isdir(data_base_dir): os.mkdir(data_base_dir) work_sapce_dir = os.path.join(data_base_dir, "VOC2007/") if not os.path.isdir(work_sapce_dir): os.mkdir(work_sapce_dir) annotation_dir = os.path.join(work_sapce_dir, "Annotations/") if not os.path.isdir(annotation_dir): os.mkdir(annotation_dir) clear_hidden_files(annotation_dir) image_dir = os.path.join(work_sapce_dir, "JPEGImages/") if not os.path.isdir(image_dir): os.mkdir(image_dir) clear_hidden_files(image_dir) yolo_labels_dir = os.path.join(work_sapce_dir, "YOLOLabels/") if not os.path.isdir(yolo_labels_dir): os.mkdir(yolo_labels_dir) clear_hidden_files(yolo_labels_dir) yolov5_images_dir = os.path.join(data_base_dir, "images/") if not os.path.isdir(yolov5_images_dir): os.mkdir(yolov5_images_dir) clear_hidden_files(yolov5_images_dir) yolov5_labels_dir = os.path.join(data_base_dir, "labels/") if not os.path.isdir(yolov5_labels_dir): os.mkdir(yolov5_labels_dir) clear_hidden_files(yolov5_labels_dir) yolov5_images_train_dir = os.path.join(yolov5_images_dir, "train/") if not os.path.isdir(yolov5_images_train_dir): os.mkdir(yolov5_images_train_dir) clear_hidden_files(yolov5_images_train_dir) yolov5_images_test_dir = os.path.join(yolov5_images_dir, "val/") if not os.path.isdir(yolov5_images_test_dir): os.mkdir(yolov5_images_test_dir) clear_hidden_files(yolov5_images_test_dir) yolov5_labels_train_dir = os.path.join(yolov5_labels_dir, "train/") if not os.path.isdir(yolov5_labels_train_dir): os.mkdir(yolov5_labels_train_dir) clear_hidden_files(yolov5_labels_train_dir) yolov5_labels_test_dir = os.path.join(yolov5_labels_dir, "val/") if not os.path.isdir(yolov5_labels_test_dir): os.mkdir(yolov5_labels_test_dir) clear_hidden_files(yolov5_labels_test_dir) train_file = open(os.path.join(wd, "yolov5_train.txt"), 'w') test_file = open(os.path.join(wd, "yolov5_val.txt"), 'w') train_file.close() test_file.close() train_file = open(os.path.join(wd, "yolov5_train.txt"), 'a') test_file = open(os.path.join(wd, "yolov5_val.txt"), 'a') list_imgs = os.listdir(image_dir) # list image files prob = random.randint(1, 100) print("Probability: %d" % prob) for i in range(0,len(list_imgs)): path = os.path.join(image_dir,list_imgs[i]) if os.path.isfile(path): image_path = image_dir + list_imgs[i] voc_path = list_imgs[i] (nameWithoutExtention, extention) = os.path.splitext(os.path.basename(image_path)) (voc_nameWithoutExtention, voc_extention) = os.path.splitext(os.path.basename(voc_path)) annotation_name = nameWithoutExtention + '.xml' annotation_path = os.path.join(annotation_dir, annotation_name) label_name = nameWithoutExtention + '.txt' label_path = os.path.join(yolo_labels_dir, label_name) prob = random.randint(1, 100) print("Probability: %d" % prob) if(prob if name == ‘main’: > opt模型主要参数解析: > --weights:初始化的权重文件的路径地址 > --cfg:模型yaml文件的路径地址 > --data:数据yaml文件的路径地址 > --hyp:超参数文件路径地址 > --epochs:训练轮次 > --batch-size:喂入批次文件的多少 > --img-size:输入图片尺寸 > --rect:是否采用矩形训练,默认False > --resume:接着打断训练上次的结果接着训练 > --nosave:不保存模型,默认False > --notest:不进行test,默认False > --noautoanchor:不自动调整anchor,默认False > --evolve:是否进行超参数进化,默认False > --bucket:谷歌云盘bucket,一般不会用到 > --cache-images:是否提前缓存图片到内存,以加快训练速度,默认False > --image-weights:使用加权图像选择进行训练 > --device:训练的设备,cpu;0(表示一个gpu设备cuda:0);0,1,2,3(多个gpu设备) > --multi-scale:是否进行多尺度训练,默认False > --single-cls:数据集是否只有一个类别,默认False > --adam:是否使用adam优化器 > --sync-bn:是否使用跨卡同步BN,在DDP模式使用 > --local_rank:DDP参数,请勿修改 > --workers:最大工作核心数 > --project:训练模型的保存位置 > --name:模型保存的目录名称 > --exist-ok:模型目录是否存在,不存在就创建

parser = argparse.ArgumentParser() parser.add_argument('--weights', type=str, default='yolov5s.pt', help='initial weights path') parser.add_argument('--cfg', type=str, default='', help='model.yaml path') parser.add_argument('--data', type=str, default='data/coco128.yaml', help='data.yaml path') parser.add_argument('--hyp', type=str, default='data/hyp.scratch.yaml', help='hyperparameters path') parser.add_argument('--epochs', type=int, default=300) parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs') parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='[train, test] image sizes') parser.add_argument('--rect', action='store_true', help='rectangular training') parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training') parser.add_argument('--nosave', action='store_true', help='only save final checkpoint') parser.add_argument('--notest', action='store_true', help='only test final epoch') parser.add_argument('--noautoanchor', action='store_true', help='disable autoanchor check') parser.add_argument('--evolve', action='store_true', help='evolve hyperparameters') parser.add_argument('--bucket', type=str, default='', help='gsutil bucket') parser.add_argument('--cache-images', action='store_true', help='cache images for faster training') parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training') parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu') parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%%') parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class') parser.add_argument('--adam', action='store_true', help='use torch.optim.Adam() optimizer') parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode') parser.add_argument('--local_rank', type=int, default=-1, help='DDP parameter, do not modify') parser.add_argument('--workers', type=int, default=8, help='maximum number of dataloader workers') parser.add_argument('--project', default='runs/train', help='save to project/name') parser.add_argument('--entity', default=None, help='W&B entity') parser.add_argument('--name', default='exp', help='save to project/name') parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment') parser.add_argument('--quad', action='store_true', help='quad dataloader') parser.add_argument('--linear-lr', action='store_true', help='linear LR') parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon') parser.add_argument('--upload_dataset', action='store_true', help='Upload dataset as W&B artifact table') parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval for W&B') parser.add_argument('--save_period', type=int, default=-1, help='Log model after every "save_period" epoch') parser.add_argument('--artifact_alias', type=str, default="latest", help='version of dataset artifact to be used') opt = parser.parse_args() 训练自己的模型需要修改如下几个参数就可以训练了。首先将weights权重的路径填写到对应的参数里面,然后将修好好的models模型的yolov5s.yaml文件路径填写到相应的参数里面,最后将data数据的hat.yaml文件路径填写到相对于的参数里面。这几个参数就必须要修改的参数。 parser.add_argument('--weights', type=str, default='weights/yolov5s.pt', help='initial weights path') parser.add_argument('--cfg', type=str, default='models/yolov5s_hat.yaml', help='model.yaml path') parser.add_argument('--data', type=str, default='data/hat.yaml', help='data.yaml path') ***这就是刚刚三个文件的相对路径!这就是刚刚三个文件的相对路径!这就是刚刚三个文件的相对路径!*** 还有几个需要根据自己的需求来更改的参数: 首先是模型的训练轮次,这里是训练的300轮。 parser.add_argument('--epochs', type=int, default=300) 其次是输入图片的数量和工作的核心数,这里每个人的电脑都不一样,所以这里每个人和自己的电脑的性能来。这里可以根据我的电脑的配置做参考,我的电脑,cpu的核心数是8核。我的电脑按默认的参数输入图片数量为16,工作核心为8的话就会出现GPU显存溢出的报错。报错信息如下:

在这里插入图片描述 这里就要调小这两个参数了,每个人的电脑配置不一样,所以可以根据自己的电脑配置来修改参数。(如果这样改了之后依然报这个错误,那么就要将他调的更小) 在这里插入图片描述

parser.add_argument(‘–batch-size’, type=int, default=8, help=‘total batch size for all GPUs’) parser.add_argument(‘–workers’, type=int, default=8, help=‘maximum number of dataloader workers’) 以上都设置好了就可以训练了。但是pycharm的用户可能会出现如下的报错。这是说明虚拟内存不够了。 在这里插入图片描述 可以根据如下的操作来修改,在utils路径下找到datasets.py这个文件,将里面的第81行里面的参数nw改完0就可以了。 在这里插入图片描述 在这里插入图片描述 至此,就可以运行train.py函数训练自己的模型了。 15、推理测试 等到数据训练好了以后,就会在主目录下产生一个run文件夹,在run/train/exp/weights目录下会产生两个权重文件,一个是最后一轮的权重文件,一个是最好的权重文件,一会我们就要利用这个最好的权重文件来做推理测试。除此以外还会产生一些验证文件的图片等一些文件。 在这里插入图片描述 找到主目录下的detect.py文件,打开该文件。在这里插入图片描述 然后找到主函数的入口,这里面有模型的主要参数。模型的主要参数解析如下所示。 f name == ‘main’: “”" –weights:权重的路径地址 –source:测试数据,可以是图片/视频路径,也可以是’0’(电脑自带摄像头),也可以是rtsp等视频流 –output:网络预测之后的图片/视频的保存路径 –img-size:网络输入图片大小 –conf-thres:置信度阈值 –iou-thres:做nms的iou阈值 –device:是用GPU还是CPU做推理 –view-img:是否展示预测之后的图片/视频,默认False –save-txt:是否将预测的框坐标以txt文件形式保存,默认False –classes:设置只保留某一部分类别,形如0或者0 2 3 –agnostic-nms:进行nms是否也去除不同类别之间的框,默认False –augment:推理的时候进行多尺度,翻转等操作(TTA)推理 –update:如果为True,则对所有模型进行strip_optimizer操作,去除pt文件中的优化器等信息,默认为False –project:推理的结果保存在runs/detect目录下 –name:结果保存的文件夹名称 “”" parser = argparse.ArgumentParser() parser.add_argument(‘–weights’, nargs=‘+’, type=str, default=‘yolov5s.pt’, help=‘model.pt path(s)’) parser.add_argument(‘–source’, type=str, default=‘data/images’, help=‘source’) # file/folder, 0 for webcam parser.add_argument(‘–img-size’, type=int, default=640, help=‘inference size (pixels)’) parser.add_argument(‘–conf-thres’, type=float, default=0.25, help=‘object confidence threshold’) parser.add_argument(‘–iou-thres’, type=float, default=0.45, help=‘IOU threshold for NMS’) parser.add_argument(‘–device’, default=‘’, help=‘cuda device, i.e. 0 or 0,1,2,3 or cpu’) parser.add_argument(‘–view-img’, action=‘store_true’, help=‘display results’) parser.add_argument(‘–save-txt’, action=‘store_true’, help=‘save results to *.txt’) parser.add_argument(‘–save-conf’, action=‘store_true’, help=‘save confidences in --save-txt labels’) parser.add_argument(‘–nosave’, action=‘store_true’, help=‘do not save images/videos’) parser.add_argument(‘–classes’, nargs=‘+’, type=int, help=‘filter by class: --class 0, or --class 0 2 3’) parser.add_argument(‘–agnostic-nms’, action=‘store_true’, help=‘class-agnostic NMS’) parser.add_argument(‘–augment’, action=‘store_true’, help=‘augmented inference’) parser.add_argument(‘–update’, action=‘store_true’, help=‘update all models’) parser.add_argument(‘–project’, default=‘runs/detect’, help=‘save results to project/name’) parser.add_argument(‘–name’, default=‘exp’, help=‘save results to project/name’) parser.add_argument(‘–exist-ok’, action=‘store_true’, help=‘existing project/name ok, do not increment’) opt = parser.parse_args() 这里需要将刚刚训练好的最好的权重传入到推理函数中去。然后就可以对图像视频进行推理了。 parser.add_argument(‘–weights’, nargs=‘+’, type=str, default=‘runs/train/exp/weights/best.pt’, help=‘model.pt path(s)’) 对图片进行测试推理,将如下参数修改成图片的路径,然后运行detect.py就可以进行测试了。 parser.add_argument(‘–source’, type=str, default=‘01407.jpg’, help=‘source’) 在这里插入图片描述 推理测试结束以后,在run下面会生成一个detect目录,推理结果会保存在exp目录下。如图所示。 在这里插入图片描述

图片的推理结果如下所示。效果还是很不错的。

在这里插入图片描述

对视频进行测试,和如上的图片的测试是一样的,只不过是将图片的路径改为视频的路径而已。利用摄像头进行测试只需将路径改写为0就好了。但是好像还是会报错,这一点卡了我很久。报错如下。 在这里插入图片描述 解决方法:首先找到datasets.py这个py文件。 在这里插入图片描述 打开文件,找到第279行代码,给两个url参数加上str就可以了,如图所示,就可以完美运行电脑的摄像头了。 在这里插入图片描述 至此yolov5训练自己的模型就完全搞定了。

最后觉得有帮助的,请给我个一键三连,栓Q!

参考博文: 训练自己的目标检测模型 训练集和验证集划分 安装pytorch和paddle深度学习环境 利用labelimg制作自己的深度学习目标检测数据集



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3