农妇山泉一亩田 发表于 2024-8-21 18:12:39

目标检测算法:对比YOLOv3、YOLOv5、YOLOv8

目标检测

YOLOv3

数据处理



[*]可输入任意大小的图片(特征图大小最好是32倍数)
[*]Anchor:K-Means聚类+IOU+NMS
模型结构



[*]Backbone

[*]Darknet53

[*]无最大池化,步长2卷积层举行下采样
[*]每个Conv后 + BN + LeakyReLU
[*]引入残差结构
[*]中心层和某一层上采样拼接

[*]模块

[*]CBL = Conv + BN + LeakyReLU
[*]ResUnit = CBL + 残差
[*]ResX = CBL + N个ResUnit


[*]Head

[*]Conf置信度:Logistic分类器(逻辑回归猜测每个框的置信度分数)
[*]Cls分类:BCELoss
[*]Bbox目标框:MSELoss

YOLOv5

数据处理



[*]马赛克加强
[*]Anchor-Based,K-means计算锚框(自适应锚框)
模型结构



[*]Backbone

[*]输入举行特征提取
[*]CSPDarkNet53或ResNet网络
[*]模块

[*]CBS = Conv2d + BN + SILU
[*]C3 = Conv + ResNet + Add + Concat
[*]SPPF = Conv + Maxpool + Concat


[*]Neck

[*]FPN特征金字塔:上采样+下采样+横向连接,多标准特征融合
[*]自顶向下:上采样融合不同层次特征融合
[*]自底向上:卷积层融合不同层次特征图

[*]Head

[*]Conf置信度:BCELoss
[*]Cls分类:BCELoss
[*]Bbox目标框:CIOU

迭代



[*]300
YOLOv8

数据处理



[*]Mosaic加强
[*]CutMix、Mixup加强
[*]Anchor-Free无锚框
模型结构



[*]Backbone

[*]CSPDarkNet
[*]C3–>C2f

[*]Neck

[*]PANet,一个双向通路网络,引入了自下向上的路径

[*]Head

[*]Cls分类:BCELoss
[*]Bbox目标框:CIOU + DFL(Distribution Focal Loss)

迭代



[*]500
[*]末了10轮,Mosaic加强替换为推理式的Letter box

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 目标检测算法:对比YOLOv3、YOLOv5、YOLOv8