这篇论文[1]提出了Histogram of Template(HOT)主要是针对图像中的每一个像素,进行各种样板的定义,每个样板包括了此像素及其相邻二个像素。如果这样一个三个像素组成的测试单元在特点和梯度值上满足预设的方程,那么称此中心像素为这个方程的一个样板。这种技术的主要特点和优势在于不仅仅针对一个像素,而是同时考虑三个像素之间的关系。同时,考虑了像素本身的特性和梯度。
对于人物识别的主要的识别方法有两种,即:提取特点和瞄准识别。提取特点是人物识别技术正被广泛使用,但目前仍有许多难题,最为显著的三个问题。第一、 人物呈现的不确定性很大;第二、 衣服和皮肤对于识别的影响。 第三、 背景,灯光等因素的影响。梯度信息和特点信息两者对于人物识别非常重要,但当两者独自实现时却不能得到较好的效果: 前者在背景较为复杂、图像像素较低的条件下难易识别; 后者则必须在与其他方法合用的条件下才能识别。
另外一种是瞄准识别方法。它关键部件有两个。第一、SVM ,其优点是易于瞄准,全局优化被保证。 第二、增压法,与级联策略一同使用,节约检测时间,多运用于实时检测。对于本文的主要针对寻找更多趋于特点加以区分地研究方向,从特点中提取信息并将其一致化,优点在于可以有更强的区分能力和在一个样板中体现多像素,获得高识别率;以及计算机的复杂度降低。
早先的人脸检测中特征提取主要的方法有两种:第一是HOG,将图像分为“块”,每一块有4个单元组成,每个单元是一个9维的向量。第二、COV,它计算一个8维的向量。两者的特点就是都是通过对于斜率,坡度的信息进行图像的分析处理。缺点是仅仅关注于斜率信息,忽略了图像本身的特点。此外,对于同一斜率,会出现多种情况,无法进行判断。
首先,HOT算法结合了斜率信息和图像特点信息,具体算法分析是图像特点信息:首先设置不同的模块,本文中基本模块为8个,实际模块为12个,为了提高精确度。
其次根据方程(7)寻找出模块中的最大值(像素)。最后通过统计每种模块的个数来分析图像的形状和特点。
方程(8)是选择出所有模块中值最大的(图像信息中最基本的,最明显的,如人的外形轮廓),其余的模块则是用来进一步精确并细化图像。斜率信息特点:其算法原则基本与图像特点相同。它地优点是不仅关注斜率信息,同时关注图像特点。更为宏观,从原先的像素级提高到了模块级。亮度恒定,不需要正规化。为了保证实验中,不同特点的平等性,需要运用瞄准技术,本实验中运用的是SVM。其优点在于在高维度小样本的中,通过核心函数寻找适合的参数,瞄准时间短等。缺点在于只能运用在子窗口固定的实时应用中。
测试相同条件下,三种技术的对比如下表所示:
当子窗口大小变化时,时使得模块和块间线条的影响减到最小,结果仍为HOT有最好的特性
模板越多,性能越优,因为模板多,得到的信息多,自然准确性上去,错误率下降。不过需要注意的是,当模块过多时,会导致计算计算机复杂度上升,运算时间加大,因此需要在两者时间折中,实验给出的答案是8模块或者12模块最佳。
主要测量的参数有两个:子窗口的大小和子窗口之间线条的数量。 主要的瞄准方法有两个:标准化和非平衡化。
[1]Shaopeng Tang, Non Member,Satoshi Goto Fellow,"Histogram of Template for Pedestrian Detection‘,IEICE TRANSACTIONS on Information and Systems Vol.E93-D No.7 pp.1737-1744.
关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
原文:http://blog.csdn.net/songzitea/article/details/20210923