SSD目的检测
模子简介
SSD (Single Shot MultiBox Detector) 是 Wei Liu 在 ECCV 2016 上提出的一种目的检测算法。使用 Nvidia Titan X 在 VOC 2007 测试集上,SSD 对于输入尺寸 300x300 的网络,到达 74.3% mAP 和 59 FPS;对于 512x512 的网络,到达 76.9% mAP,逾越当时最强的 Faster RCNN (73.2% mAP)。
目的检测算法可以分为两种类型:
- Two-stage 方法:RCNN 系列,通过算法产生候选框,然后再对这些候选框举行分类和回归。
- One-stage 方法:YOLO 和 SSD,直接通过主干网络给出类别位置信息,不需要地区天生。
SSD 采用卷积神经网络举行特性提取,通过多尺度的特性层举行检测输出,预设不同长宽比例的 anchor,每一个输出特性层基于 anchor 预测多个检测框。
模子结构
SSD 采用 VGG16 作为基础模子,然后在其基础上新增了卷积层以得到更多的特性图用于检测。SSD 利用多尺度特性图举行检测,不同于 YOLO,SSD 是通过卷积得到最后的边界框,而 YOLO 通过全连接情势得到一维向量。
模子特点
- 多尺度检测:浅层检测小目的,深层检测大目的。
- anchor 策略:预设不同比例的 anchor,举行多框检测。
- 卷积实现检测:通过卷积层直接输出检测结果。
数据集和预处置惩罚
使用 VOC2012 数据集举行训练,举行数据加强和图像预处置惩罚,调解图像尺寸并尺度化。
模子训练
训练时设置 epoch 次数为 60,batch_size 为 5,图像尺寸为 300x300。使用位置丧失函数和置信度丧失函数的加权和作为丧失函数,优化器为 Momentum,初始学习率为 0.001。每训练 10 个 epoch 保存一次模子。
评估
使用自定义的 eval_net() 类对训练好的模子举行评估,盘算在不同 IoU 阈值、area 和 maxDets 设置下的 AP 和 AR。使用 COCO Metrics 类盘算 mAP。模子在测试集上的评估指标包括 mAP、IoU 等。
准确率和召回率
- TP:IoU > 阈值的检测框数量
- FP:IoU <= 阈值的检测框数量或多余检测框数量
- FN:未检测到的 GT 数量
AP 和 AR 的盘算公式分别为:
- AP:正样本预测精确结果与正样本预测总结果的比值。
- AR:正样本预测精确结果与正样本实际数量的比值。
训练输出指标
- mAP:各类别 AP 的平均值
- IoU=0.5 的 mAP:反映算法框的位置精准水平
- AR:检出率,反映模子的检测性能
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |