HOG+SVM与C4两种行人检测技术比较

时间:2022-08-28 11:04:43

HOG+SVM与C4两种行人检测技术比较

摘要 随着社会的发展,安防监控已成为维护我国社会安定的关键环节。行人检测无疑是安防监控中的重要方面,也是计算机视觉领域非常具有挑战性的热点,目前国内外已有很多有关行人检测方面的报道。HOG+SVM是当前使用最为广泛的行人检测方法,很多行人检测技术都是对经典的HOG+SVM方法进行改进,其中对视频中的行人检测速度较快有C4行人检测算法。对两种行人检测技术进行了比较研究。

关键词 安防监控;行人检测;HOG;SVM;C4

DOI DOI: 10.11907/rjdk.162336

中图分号: TP302

文献标识码: A 文章编号 文章编号: 16727800(2017)002002204

0 引言

当前,随着中国社会的不断发展,城市化进程也不断加快,居民们的人身安全和财物安全已成为广受关注的问题。安防监控是现阶段维护我国社会安定的关键环节之一,因此对于相关技术也提出了更高要求。例如:安防监控应该有人工智能的视频分析能力,能够实现“发现可疑人员并报警”及“自动跟踪可疑人员”等功能。其中,行人检测是安防监控中的重要环节,是实现“发现可疑人员并报警”及“自动跟踪可疑人员”的前提。

行人检测是机器视觉、图像处理等领域中相关应用的关键技术之一,在安防监控、无人汽车驾驶、机器人以及多媒体分析等方面具有广泛的应用前景和潜在的经济价值,因此成为了近年来的研究热点。目前行人检测技术已涌现出一批经典算法,但是受姿态、遮挡、环境等干扰因素的影响,行人检测技术在检测的精确度、速度等方面仍有较大提升空间。

1 行人检测技术现状

行人检测指获取视频或图片信息,然后从其中检测出行人位置。由于行人检测涉及到服饰变化、姿态变化、遮挡等因素,还要考虑天气、光线、路况变化,对算法的鲁棒

性要求高,并且要满足实时性要求。因此,行人检测技术的研究很有价值,也非常具有挑战性。

2005年Dalal等提出基于统计训练的方法,是经典行人检测方法,该方法利用梯度方向直方图――HOG(Histogram of Oriented Gradient)来刻画图像局部梯度幅值和方向,然后利用支持向量机(SVM)分类器对待测图像进行检测。如今,行人检测技术趋于大规模和实用化,但也存在着检测速度和检测准确度不高等缺点。在如何提高检测速度和检测准确度方面,仍存在以下问题:①行人高度问题;②复杂场景问题;③分类器问题;④多特征融合问题。

2 HOG+SVM与C4两种行人检测技术分析

目前安防监控领域的行人检测技术较多,但很多都是对经典的HOG+SVM方法进行改进,其中C4行人检测算法对视频中行人检测速度较快。经典的HOG+SVM方法与C4行人检测算法两种技术都是基于SVM的,只是特征上有些差异,下面对这两种技术作简要介绍。

2.1 HOG+SVM人体检测

Navneet Dalal和Bill Triggs在2005年的CVPR上发表的文章中首次提出了HOG特征,同时采用SVM分类器对HOG特征进行分类,这种结合使行人检测技术趋于实用化。由于基于该特征的行人检测方法效果很好,吸引了众多研究者关注。Dalal等最初只是用此方法检测静态图像中的行人,但后来也用于在视频和电影中检测行人,以及检测静态图像中的车辆、常见动物等。HOG特征具有很多优势,其有效性主要来源于它对光照变化和少量偏移不敏感,同时还能描述局部形状信息,能够很好地刻画人体的边缘特征及其轮廓。

HOG描述子是在包含大小统一的细胞单元(Dense Grid of Uniformly Spaced Cells)的稠密网格上进行计算,还采用了局部方向直方图对比度归一化。HOG特征提取方法的流程是:先输入图像,然后对其伽玛和颜色进行归一化;计算梯度,对细胞单元的空间和方向进行加权投票;对重叠空间块进行对比归一化,再在检测窗口收集描述子,用线性支持向量机对描述子进行分类;最后由分类器识别人与非人,如图1所示。

2.2 C4行人检测算法

C4行人检测算法对经典的HOG+SVM方法进行了算法上的改进,能够进行快速行人检测,实时视频处理效果好、速度快。

由于Sobel[1]图像能很好地计算边缘信息,先计算Sobel图像(见图2),再进行CT(Census Transform)[2]变换(见图3)。所谓的C4是Human Contour Using a Cascade Classifier and the CENTRIST Visual Descriptor。

C4训练时采用线性SVM和HIK SVM。如图4所示,与HOG特征提取时所设置的cell和block关系一样,把窗口分成9*4个block,其中每个block大小为12*9,把邻近的2*2个block作为一个Super block。因此,每个窗口则有8*3个Super block,得到的向量应为24*256=6144维。

采用式(6)可以快速计算CENTRIST描述符,如图5所示。图5(a)表示式(2)的计算方法,Super block中的值代表CT图像变换后的值,图5(b)表示式(6)的快速计算方法,Super block中的值代表在分类器ω中前者CT图像变换后的值。

3 对比实验与分析

基于Opencv的行人检测方法,利用开源的跨平台计算机视觉库Opencv在Visual Studio进行开发、调试及应用。通过提取行人的梯度方向直方图(HOG)特征,并利用事先准备的样本训练出来线性支持向量机(SVM)分类器对提取的行人特征进行分类,建立一种基于梯度方向直方图特征的行人检测系统。实验结果表明,该系统符合要求,能够有效地检测出行人。

3.1 开发平台

Visual Studio 2010作为代码编写与编译的平台,其开发语言为C++。OpenCV2.4.4为微软开源计算机视觉库,OpenCV高效的矩阵运算能力以及对通用视觉算法的 完美实现,都有助于项目开发。

3.2 实验数据介绍

实验数据分为3种:①三张多行人的图片;②一些MIT行人库的行人图片,一些INRIA行人库的正样本,一些INRIA行人库的负样本;③十字路口的O控图片。

(1)先采用三张多行人的图片分别对两种方法进行检测,并将经典的HOG+SVM和C4行人检测算法在Opencv+VS2010中加以实现。实验结果如图6所示,经典的HOG+SVM实验结果为:a1、a2、a3、C4行人检测算法实验结果为:b1、b2、b3。

实验结果表明,两种方法都可以检测行人,但有误报,也有漏检。相比经典的HOG+SVM, C4行人检测算法的检测准确率有所提高(误报与漏检较少)。由此可见,C4行人检测算法在监控中检测行人具有一定优势。

(2)采用一些MIT行人库的行人图片、一些INRIA行人库的正样本,以及一些INRIA行人库的负样本进行检测。

一些MIT行人库的行人图片检测结果如图7所示,经典HOG+SVM方法实验结果为:c1、c2、c3、c4、c5,C4行人检测算法实验结果为:d1、d2、d3、d4、d5。实验结果表明,两种方法都可以检测行人,效果都比较好。

一些INRIA行人库的正样本的检测结果如图8所示,经典HOG+SVM方法实验结果为:e1、e2、e3、e4、e5,C4行人检测算法实验结果为:f1、f2、f3、f4、f5。实验结果表明,两种方法都可以检测行人,其中HOG+SVM漏检多一点。

一些INRIA行人库的负样本的检测结果如图9所示,经典HOG+SVM方法实验结果为:g1、g2、g3、g4、g5,C4行人检测算法实验结果为:h1、h2、h3、h4、h5。实验结果表明,两种方法都可以检测行人,其中HOG+SVM误检多一点。

(3)采用十字路口的监控图片进行检测,实验结果如图10所示。经典HOG+SVM方法实验结果为:g1、g2,C4行人检测算法实验结果为:h1、h2。实验结果表明,两种方法都可以检测行人。可能是因为图片较大,情景较复杂,两种方法检测行人的效果都不太好,都有较多误检和漏检。综合以上3种实验数据:可以看出C4行人检测算法要比经典的HOG+SVM方法检测行人的准确率高,误检与漏检更少。

4 结语

本文比较了经典的HOG+SVM方法和C4行人检测算法,并利用Visual Studio 2010开发平台及OpenCV计算机视觉库进行实验。实验结果表明,C4行人检测算法性能较好,在检测率、漏检率等方面均优于经典的基于方向梯度直方图算法的行人检测系统。

参考文献:

[1] 李新江,龚勋,李天瑞,等.面向视频监控的自动行人检测[J].计算机科学,2014,41(12):264268.

[2] 李广春,罗扬. 基于CENTRIST特征的实时行人检测算法的实现[J].电脑知识与技术,2013,9(2):370372.

[3] 贾慧星,章毓晋.车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J].自动化学报,2007,33(1):8590.

[4] 张阳.复杂交通场景中基于视频的行人检测与跟踪若干关键问题研究[D].广州:华南理工大学,2013.

[5] 洪传文,张建龙,李洁.多模版匹配及加权融合的行人检测方法[J].济南大学学报:自然科学版,2016,30(3):216219.

[6] WU J,REGH J M.CENTRIST:a visual descriptor for scene categorization[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(8):14891501.

[7] 苏松志,李绍滋,陈淑媛,等.行人检测技术综述[J].电子学报,2012,40(4):814820.

[8] BENENSON R,MATHIAS M, TIMOFTE R, et al. Fast stixel computation for fast pedestrian detection[C].Proceedings ECCV,2012:1120.

上一篇:杯托“花期依赖” 乡村游淡季不淡 下一篇:蔬菜集约化嫁接育苗技术