首页 > 编程语言 > 详细

目标检测YOLO算法-学习笔记

时间:2018-12-08 21:53:18      阅读:371      评论:0      收藏:0      [点我收藏+]

算法发展及对比:

17年底,mask-R CNN

技术分享图片

 YOLO

YOLO最大的优势就是快

原论文中流程,可以检测出20类物体.

技术分享图片

红色网格-张量,在这样一个1×30的张量中保存的数据

技术分享图片

横纵坐标中心点缩放到0-1之间

技术分享图片

 

 

 每一个小网格矩形对应两个不同尺寸比例的物体:竖条,长条;单数是竖着的苗条框,偶数是横着的宽框.

bb1和bb2,两个box 分别保存中心点坐标,宽度,高度,置信度

技术分享图片

张量后20为,认为其是某一类的当前概率值,置信

技术分享图片

后20:是20个之中的哪一类,打个分.

技术分享图片

bb1和bb2中也有个置信度,是其box中是否有物体的置信度.(待定)

技术分享图片

技术分享图片

循环遍历7*7=49个网格grid cell,每个网格两种矩形去预测bb1和bb2,存是不是物体*物体哪一类,两个值相乘:

 

技术分享图片

共7*7=49,*2=98个

技术分享图片

 

检测过程

 技术分享图片

细节过程

98个box,20类物体

对,是狗的打分

设定阈值是0.2,即如果里面预测类别置信的值小于0.2,令其=0

技术分享图片

概率排序(降序)大在前:

技术分享图片

对排序后的某些类别...

技术分享图片

NMS:非极大值抑制

技术分享图片

不同位置的框内,概率不同:

技术分享图片

技术分享图片

技术分享图片

 比较,比它小的非0值

 技术分享图片

IOU:两个区域交集和并集的比例

技术分享图片

IOU>0.5认为两个框重合的比较多.置为0.之后迭代循环

技术分享图片

 

 

 技术分享图片

 

技术分享图片

 (二)递归,以0.2

 技术分享图片

技术分享图片

(三)

技术分享图片

 

 

 技术分享图片

技术分享图片

对bb3(20×1)类别的分数,找分数对应最大类别的索引.---->class

bb3(20×1)中最大的分---->score

技术分享图片

技术分享图片

 

技术分享图片

 

YOLO很快,tiny更快

端到端的

可以和Fast R-CNN合并

YOLO v.1 v.2

主要应用

智能驾驶

医疗

链接

Arxiv:https://arxiv.org/abs/1506.02640

Blog:http://pjreddie.com/publications/yolo/

Darknet:https://github.com/pjreddie/darknet

Caffe:https://github.com/xingwangsfu/caffe-yolo

Tensorflow:

  Test+train:https://github.com/thtrieu/yolotf

  Test:https://github.com/gliese581gg/YOLO_tensorflow

 技术分享图片

 

目标检测YOLO算法-学习笔记

原文:https://www.cnblogs.com/wxl845235800/p/10089127.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!