yolov3 v4 v5的对比

2024-01-25 02:36| 来源: 网络整理| 查看: 265

以下将以v3、v4、v5的顺序进行介绍并比对：

1、输入端

yolov4：Mosaic数据增强、(cmBN、SAT自对抗训练)

yolov5：Mosaic数据增强、自适应锚框计算、自适应图片缩放

Yolov5会自动按照新的数据集的labels自动学习anchors的尺寸。采用 k 均值和遗传学习算法对自定义数据集进行分析，获得适合自定义数据集中对象边界框预测的预设锚定框。

2、backbone

yolov3 、v4网络结构，参考：https://zhuanlan.zhihu.com/p/143747206

yolov3网络结构

yolov4网络结构

yolov5s网络结构

yolov3：Darknet53，借鉴了ResNet的残差结构，使用这种结构可以让网络结构更深。

yolov4：将各种新的方式结合起来，包括：CSPDarknet53、Mish激活函数、Dropblock。

CSPDarknet53，CSP就是CSPNet论文里面跨阶段局部融合网络，CSP结构在每个res_block残差块的头尾增加连接，使特征更好的向后传递，对小目标有好处。CSPNet仿照的是Densenet密集跨层跳层连接思想，但是考虑到内存消耗过大，故修改为部分局部跨层融合做法.

yolov5：Focus结构，CSP结构。

Focus结构使用切片并concat的方式替换尺化操作，减少尺寸的同时不减少特征。由于减少了卷积层，所以可以减少计算量，同时不损失精度。

Yolov5与Yolov4不同点在于，Yolov4中只有主干网络使用了CSP结构。而Yolov5中设计了两种CSP结构，以Yolov5s网络为例，CSP1_X结构应用于Backbone主干网络，另一种CSP2_X结构则应用于Neck中。

3、neck

yolov3：FPN

yolov4: SPP模块、FPN+PAN结构

采用SPP模块的方式，比单纯的使用k*k最大池化的方式，更有效的增加主干特征的接收范围，显著的分离了最重要的上下文特征。

yolov5：与yolov4一样的FPN+PAN结构，不同点在于Yolov4的Neck结构中，采用的都是普通的卷积操作。而Yolov5的Neck结构中，采用借鉴CSPnet设计的CSP2结构，加强网络特征融合的能力。

Prediction创新

yolov3：

一个是目标框位置x,y,w,h（左上角和长宽）带来的误差，也即是 box 带来的 loss。

而在 box 带来的 loss 中又分为x,y 带来的 BCE Loss 以及w,h带来的 MSE Loss。

一个是目标置信度带来的误差，也就是 obj 带来的 loss（BCE Loss）。

最后一个是类别带来的误差，也就是 class 带来的 loss（类别数个 BCE Loss）

yolov4: CIOU_loss、DIOU_nms

Bounding Box Regeression的Loss近些年的发展过程是：Smooth L1 Loss-> IoU Loss（2016）-> GIoU Loss（2019）-> DIoU Loss（2020）->CIoU Loss（2020）

nms时将IOU替换成DIOU，提高对密集及遮挡目标的效果。

yolov5：GIOU_loss、加权nms(不如yolov4)

yolov4：https://zhuanlan.zhihu.com/p/143747206 写的太详细了

https://zhuanlan.zhihu.com/p/150127712

yolov5：https://zhuanlan.zhihu.com/p/172121380

【本文地址】

今日新闻