目标检测算法:对比YOLOv3、YOLOv5、YOLOv8
目标检测YOLOv3
数据处理
[*]可输入任意大小的图片(特征图大小最好是32倍数)
[*]Anchor:K-Means聚类+IOU+NMS
模型结构
[*]Backbone
[*]Darknet53
[*]无最大池化,步长2卷积层举行下采样
[*]每个Conv后 + BN + LeakyReLU
[*]引入残差结构
[*]中心层和某一层上采样拼接
[*]模块
[*]CBL = Conv + BN + LeakyReLU
[*]ResUnit = CBL + 残差
[*]ResX = CBL + N个ResUnit
[*]Head
[*]Conf置信度:Logistic分类器(逻辑回归猜测每个框的置信度分数)
[*]Cls分类:BCELoss
[*]Bbox目标框:MSELoss
YOLOv5
数据处理
[*]马赛克加强
[*]Anchor-Based,K-means计算锚框(自适应锚框)
模型结构
[*]Backbone
[*]输入举行特征提取
[*]CSPDarkNet53或ResNet网络
[*]模块
[*]CBS = Conv2d + BN + SILU
[*]C3 = Conv + ResNet + Add + Concat
[*]SPPF = Conv + Maxpool + Concat
[*]Neck
[*]FPN特征金字塔:上采样+下采样+横向连接,多标准特征融合
[*]自顶向下:上采样融合不同层次特征融合
[*]自底向上:卷积层融合不同层次特征图
[*]Head
[*]Conf置信度:BCELoss
[*]Cls分类:BCELoss
[*]Bbox目标框:CIOU
迭代
[*]300
YOLOv8
数据处理
[*]Mosaic加强
[*]CutMix、Mixup加强
[*]Anchor-Free无锚框
模型结构
[*]Backbone
[*]CSPDarkNet
[*]C3–>C2f
[*]Neck
[*]PANet,一个双向通路网络,引入了自下向上的路径
[*]Head
[*]Cls分类:BCELoss
[*]Bbox目标框:CIOU + DFL(Distribution Focal Loss)
迭代
[*]500
[*]末了10轮,Mosaic加强替换为推理式的Letter box
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]