yolov3 v4 v5的对比

您所在的位置:网站首页 yolov3改进renset50 yolov3 v4 v5的对比

yolov3 v4 v5的对比

2024-01-25 02:36| 来源: 网络整理| 查看: 265

以下将以v3、v4、v5的顺序进行介绍并比对:

1、输入端

yolov4:Mosaic数据增强、(cmBN、SAT自对抗训练)

yolov5:Mosaic数据增强、自适应锚框计算、自适应图片缩放

Yolov5会自动按照新的数据集的labels自动学习anchors的尺寸。采用 k 均值和遗传学习算法对自定义数据集进行分析,获得适合自定义数据集中对象边界框预测的预设锚定框。

2、backbone

yolov3 、v4网络结构,参考:https://zhuanlan.zhihu.com/p/143747206

 yolov3网络结构

yolov4网络结构

yolov5s网络结构

 yolov3:Darknet53,借鉴了ResNet的残差结构,使用这种结构可以让网络结构更深。

 yolov4:将各种新的方式结合起来,包括:CSPDarknet53、Mish激活函数、Dropblock。      

        CSPDarknet53,CSP就是CSPNet论文里面跨阶段局部融合网络,CSP结构在每个res_block残差块的头尾增加连接,使特征更好的向后传递,对小目标有好处。CSPNet仿照的是Densenet密集跨层跳层连接思想,但是考虑到内存消耗过大,故修改为部分局部跨层融合做法.

yolov5:Focus结构,CSP结构。

        Focus结构使用切片并concat的方式替换尺化操作,减少尺寸的同时不减少特征。由于减少了卷积层,所以可以减少计算量,同时不损失精度。

        Yolov5与Yolov4不同点在于,Yolov4中只有主干网络使用了CSP结构。而Yolov5中设计了两种CSP结构,以Yolov5s网络为例,CSP1_X结构应用于Backbone主干网络,另一种CSP2_X结构则应用于Neck中。

3、neck

yolov3:FPN

yolov4: SPP模块、FPN+PAN结构

        采用SPP模块的方式,比单纯的使用k*k最大池化的方式,更有效的增加主干特征的接收范围,显著的分离了最重要的上下文特征。

yolov5:与yolov4一样的FPN+PAN结构,不同点在于Yolov4的Neck结构中,采用的都是普通的卷积操作。而Yolov5的Neck结构中,采用借鉴CSPnet设计的CSP2结构,加强网络特征融合的能力。

Prediction创新

yolov3:

        一个是目标框位置x,y,w,h(左上角和长宽)带来的误差,也即是 box 带来的 loss。

而在 box 带来的 loss 中又分为x,y 带来的 BCE Loss 以及w,h带来的 MSE Loss。

        一个是目标置信度带来的误差,也就是 obj 带来的 loss(BCE Loss)。

        最后一个是类别带来的误差,也就是 class 带来的 loss(类别数个 BCE Loss)

yolov4: CIOU_loss、DIOU_nms

        Bounding Box Regeression的Loss近些年的发展过程是:Smooth L1 Loss-> IoU Loss(2016)-> GIoU Loss(2019)-> DIoU Loss(2020)->CIoU Loss(2020)

        nms时将IOU替换成DIOU,提高对密集及遮挡目标的效果。

yolov5:GIOU_loss、加权nms(不如yolov4)

yolov4:https://zhuanlan.zhihu.com/p/143747206  写的太详细了

              https://zhuanlan.zhihu.com/p/150127712

yolov5:https://zhuanlan.zhihu.com/p/172121380



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3