使用稀疏表达和机器学习的行人检测技术探讨

时间:2022-05-01 11:42:45

使用稀疏表达和机器学习的行人检测技术探讨

摘 要:机器学习是现在一个很热门的研究方向,利用机器深度学习来进行行人的检测是一个科学有效的办法。文章通过对于图像提取与压缩的方案探讨,结合信号的稀疏表达的技术,对行人的检测方法进行了分析,结果表明,机器学习的检测方案是准确而有效的。

关键词:机器学习;稀疏表达;行人检测

1 图像提取的方法

1.1 分割

在计算机视觉中,图像分割是将数字图像分割成多个片段或者像素集合的过程,分割的目标是将图像的表示简化和改变为更有意义和更容易分析的东西。图像分割通常用于定位图像中的对象和边界。更精确地,图像分割是向图像中的每个像素分配标签,使得具有相同标签的像素共享某些特性的过程。图像分割的结果是集合地覆盖整个图像或从图像提取的一组轮廓的集合的片段。区域中的每个像素相对于某些特性或计算的属性是相似的。相对于相同的特征,相邻区域是不同的。当应用于成像中的图像堆叠时,在图像分割之后产生的轮廓可以采用插值算法生成。常见的是阈值分割,使用这种成像技术可以精确地进行黑白和彩色图像的自适应图像分割。

1.2 滤波

迭代过滤算法是用于对观察的图像进行最大似然推断的工具,对未知参数的随机扰动用于探索参数空间。将顺序蒙特卡罗粒子滤波器应用于该扩展模型导致选择与数据更一致的参数值。适当构造的程序,迭代与连续减少的扰动,收敛到最大似然估计。迭代过滤方法迄今为止被广泛用于研究图像的提取与滤波。首先,它们平滑了似然面,使算法能够克服全局搜索早期阶段可能出现的小规模特征。其次,蒙特卡罗变化允许搜索从局部最小值逃脱。第三,迭代过滤更新使用扰动的参数值来构建最大似然的导数近似值,即使该量通常不是以闭合形式可用。第四,参数扰动有助于克服在顺序蒙特卡罗期间可能出现的数值估计困难。

2 基于稀疏表达的图像特征压缩

稀疏表达可以理解为将一个原始信号用一组字典元素的线性组合进行表示,将一段时间内的信号中的每一个作为一个向量输入到矩阵中,进行矩阵分解,可以得到其低秩部分、稀疏部分和噪声部分。信号的稀疏表示近年来引起了研究人员相当大的兴趣,假设自然信号(例如图像)允许在冗余字典上进行稀疏分解,导致处理这种数据源的有效算法。特别地,用于图像的良好适应的字典的设计已经是一个主要的挑战。K-SVD最近已经被提出用于这个任务并且被示为对于各种灰度图像处理任务执行得很好。为解决学习彩色图像的字典的问题,并扩展基于K-SVD的灰度图像去噪算法。来自稀疏信号表示的技术通常在非传统应用上开始在计算机视觉中看到显著影响,其中目标不仅是获得观察信号的高保真表示,而且还提取语义信息。词典的选择在弥合这种差距中起着关键作用,由训练样本组成或从训练样本本身学习的非常规词典是获得最先进结果和将语义含义附加到稀疏信号表示的关键。理解这种非常规字典的良好性能又需要新的算法和分析技术,这项工作提出了处理非均匀噪声和丢失信息的方法,为如彩色图像去噪、去马赛克和修复等应用中的最先进的结果铺平了道路。

由于提取到的图像特征数据的维数过高、数量过大,不利于存储和进一步的机器学习,因此需要进行相应的压缩。对于特征提取,我们显示如果识别问题中的稀疏性正确利用,特征的选择不再是关键。然而,关键的是特征的数量是否足够大以及稀疏表示是否被正确地计算。非常规特征,例如下采样图像和随机投影,以及常规特征,例如特征面和拉普拉斯面,只要特征空间的维度超过某一阈值,由稀疏表示的理论预测。该框架可以通过利用这些误差相对于标准(像素)基础常常是稀疏的事实来统一地处理由于遮挡和破坏引起的错误。稀疏表示的理论有助于预测识别算法可以处理多少遮挡以及如何选择训练图像以最大化遮挡的鲁棒性。

3 基于机器学习的行人检测

3.1 机器学习技术

机器学习是计算机科学的子领域,它使计算机能够学习而不用明确编程。从模式识别和计算学习理论在人工智能的研究演变而来,机器学习探索学习对数据进行预测算法的研究和构建,这样的算法克服了严格的静态程序指令数据驱动的预测或决策,通过从样本输入来建立一个模型。机器学习在一系列计算任务中使用,其中有着明确算法的设计和编程是不可行的,比如垃圾邮件过滤、检测网络入侵者或恶意内部人员、光学字符识别、搜索引擎和计算机视觉,这些方面都没有明确的算法表示。机器学习与计算统计密切相关,并且经常与计算统计重叠,计算统计也集中在通过使用计算机的预测中。它与数学优化有着紧密的联系,它将方法、理论和应用领域传递到现场。机器学习有时与数据挖掘相结合,后者的子领域更侧重于探索性数据分析。机器学习也可以是全自动化的,用来学习和建立各种实体的行为预测,然后用于发现有价值的异常情况。在数据分析领域,机器学习是一种用于设计适合预测的复杂模型和算法的方法,在商业应用中,这被称为预测分析。这些分析模型允许研究人员、数据科学家、工程师和分析师通过学习数据中的历史关系和趋势来产生可靠的、可重复的决策和结果并揭示隐藏的规律。

3.2 支持向量机技术

支持向量机(SVM)表示一组从训练数据创建函数的受监督学习技术,训练数据通常包括输入对象(通常是向量)和期望输出的对象。学习的函数可以用于预测新对象的输出。SVM通常用于其中函数输出有限类之一的分类。SVM也用于回归和偏好学习,为此他们分别称为支持向量回归SVR和排名SVM。SVM属于一类广义线性分类器,其中分类(或边界)函数是特征空间中的超平面。SVM的特殊性质是SVM可以实现高度的泛化,泛化表示学习函数对测试数据或在训练中排除的未知数据的性能。

将表征图像梯度特征的HOG特征和图像纹理特征的LTP特征相结合,发挥二者的优势,并利用稀疏表达的方法进行特征数据的压缩,利用二者相结合训练的SVM分类器进行了行人检测的测试。检测时,首先对图像进行预处理,例如图像仿射纠正几何形变、图像去噪、曝光过度图像的滤除;然后进行前景提取,因为行人在图像中是以前景的形式出现,所以可以得到行人的候选区域;再对输入图片进行尺度缩放,对于每一油枷瘢采用大小为128×64的窗口进行滑动计算,提取出每个滑动窗口的HOG特征和LTP特征,并利用SVM分类器进行判别,可以得到该窗口中是否有目标。如果当前窗口符合行人的HOG特征和LTP特征,就将其存储作为目标区域;如果没有,则检测下一个窗口。

4 结束语

本文利用基于HOG特征和LTP特征相结合训练的SVM分类器进行行人检测,该方法可以应用于静止摄像头的监控场景中,将前景图像、背景图像和噪声分离,理论意义和实际应用价值都比较高。前景提取方法可以很好地抵抗噪声,并将图像的3个组成部分:低秩部分、稀疏部分和噪声部分进行有效地分离。实验结果表明提出的算法有精度高、速度快等优点。然而,实验中的前景提取和行人检测是相分离的,如何将二者进行结合将是下一步的研究方向。

参考文献

[1]李紫微.浅析计算机图像处理技术的应用[J].通讯世界,2016(06).

[2]闫凤,石磊,张国英,等.计算机图像处理技术的应用[J].电子技术与软件工程,2016(20).

作者简介:徐政超(1984,12-),男,汉族,籍贯:河南沁阳,当前职务:实验技术人员,当前职称:助理工程师,学历:硕士,研究方向:计算机科学与应用。

上一篇:航空涡轮轴发动机构型项选择 下一篇:潜油电泵井下温度压力监测系统研究