首页 > 编程语言 > 详细

目标检测YOLO算法-学习笔记

时间：2018-12-08 21:53:18 阅读：371 评论：0 收藏：0 [点我收藏+]

算法发展及对比:

17年底,mask-R CNN

技术分享图片

YOLO

YOLO最大的优势就是快

原论文中流程,可以检测出20类物体.

技术分享图片

红色网格-张量,在这样一个1×30的张量中保存的数据

技术分享图片

横纵坐标中心点缩放到0-1之间

技术分享图片

每一个小网格矩形对应两个不同尺寸比例的物体:竖条,长条;单数是竖着的苗条框,偶数是横着的宽框.

bb1和bb2,两个box 分别保存中心点坐标,宽度,高度,置信度

技术分享图片

张量后20为,认为其是某一类的当前概率值,置信

技术分享图片

后20:是20个之中的哪一类,打个分.

技术分享图片

bb1和bb2中也有个置信度,是其box中是否有物体的置信度.(待定)

技术分享图片

技术分享图片

循环遍历7*7=49个网格grid cell,每个网格两种矩形去预测bb1和bb2,存是不是物体*物体哪一类,两个值相乘:

技术分享图片

共7*7=49,*2=98个

技术分享图片

检测过程

技术分享图片

细节过程

98个box,20类物体

对,是狗的打分

设定阈值是0.2,即如果里面预测类别置信的值小于0.2,令其=0

技术分享图片

概率排序(降序)大在前:

技术分享图片

对排序后的某些类别...

技术分享图片

NMS:非极大值抑制

技术分享图片

不同位置的框内,概率不同:

技术分享图片

技术分享图片

技术分享图片

比较,比它小的非0值

技术分享图片

IOU:两个区域交集和并集的比例

技术分享图片

IOU>0.5认为两个框重合的比较多.置为0.之后迭代循环

技术分享图片

技术分享图片

技术分享图片

(二)递归,以0.2

技术分享图片

技术分享图片

(三)

技术分享图片

技术分享图片

技术分享图片

对bb3(20×1)类别的分数,找分数对应最大类别的索引.---->class

bb3(20×1)中最大的分---->score

技术分享图片

技术分享图片

技术分享图片

YOLO很快,tiny更快

端到端的

可以和Fast R-CNN合并

YOLO v.1 v.2

主要应用

智能驾驶

医疗

链接

Arxiv:https://arxiv.org/abs/1506.02640

Blog:http://pjreddie.com/publications/yolo/

Darknet:https://github.com/pjreddie/darknet

Caffe:https://github.com/xingwangsfu/caffe-yolo

Tensorflow:

　　Test+train:https://github.com/thtrieu/yolotf

　　Test:https://github.com/gliese581gg/YOLO_tensorflow

技术分享图片

目标检测YOLO算法-学习笔记

原文：https://www.cnblogs.com/wxl845235800/p/10089127.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！