基于图像识别的网上阅卷系统的设计

时间:2022-09-08 03:59:25

基于图像识别的网上阅卷系统的设计

摘 要

在网上阅卷系统中,需要将纸质的试卷和答题卡扫描成数字化图像数据,以此提取考生答题及其个人的信息特征。本文针对扫描后的数字化图像数据,运用Hough变换,提出一种新的图像倾斜角检测算法,以此为基础,对网上阅卷系统进行重新设计,将系统核心功能分为答题卡图像信息预处理和答题卡信息识别两大模块。该系统的设计,能够有效地降低评卷误差,提高系统的检测率,促进了评卷的科学化和规范化。

【关键词】图像识别 网上阅卷系统 图像处理技术 Hough变换

1 引言

网上阅卷是借助计算机网络技术,将纸质的试卷和答题卡通过电子扫描技术和图像处理技术转化为数字化的形式,呈现给特定的教师进行评阅,已经成为高效、准确、公平的现代化阅卷方式。较之传统阅卷方式,网上阅卷具有很多优点,比如成绩“多评制”、全程计算机管理、实时高效监控和管理阅卷的质量和进度、实现了考试信息的数字化和阅卷工作的科学化管理。本文针对扫描后的数字化图像数据,提出了一个新的基于图像边缘检测的倾斜角检测算法,以此为基础对网上阅卷系统进行设计,构建了基于图像识别的网上阅卷系统。

2 相关技术

2.1 网上阅卷的核心分析

网上阅卷的流程与传统阅卷非常相似,有所不同的是需要对图像化的试卷进行切割处理,以便实现任务的分发和指配。其核心流程如图1所示。

下面对这些核心步骤进行说明:

2.1.1 图像数字化

在网上阅卷中,通过网络传输的是数字化的图像信息,所以,首先需要借助扫描设备对纸质的考生试卷和答题卡进行扫描,生成数字化的图像信息。

2.1.2 图像预处理

为了后续的处理,需要对图像进行预处理,包括消除图像中无关的信息、增强图像信息的可检测性等。

2.1.3 获取图像信息

通过对图像进行分析处理,以确定不同图像信息代表不同的考试信息数据。

2.1.4 信息处理

在上述工作的基础上,对图像信息进行加工、匹配、整理,完成图像信息的处理。

2.1.5 特征提取

通过阅卷系统建立的标识信息,从而正确地获取试卷信息和答题卡信息等之间的对应,实现图像信息的特征提取。

2.2 数字图像处理

数字图像处理是计算机研究领域一个非常重要的内容,主要是对图像进行去噪、增强、复原等操作所涉及到的具体技术和方法,其主要目的是提高图像的视感质量、获取图像的特殊信息以及图像的编码压缩。在实际应用中,数字图像处理常用的方法有:图像编码压缩、图像增强和旋转、图像分割、和图像识别等。

3 图像边缘检测算法的设计

将答题卡通过扫描生成数字图像后,数字图像或多或少会产生一定角度的倾斜,为了确保后续工作的正确性,需要对数字图像进行倾斜角度检测和图像矫正处理。目前,在图像倾斜角检测上,应用较多的是以Hough变换为基础的系列优化算法,在功能和性能上都有不错的表现效果。为了最大程度的保证边缘点的平滑,本节提出基于图像边缘检测的倾斜检测算法,以达到优化图像矫正流程的目的,能够满足实际应用的要求。

3.1 基于图像边缘检测的倾斜检测研究

本节在基于垂直边缘提取的Hough优化算法和基于邻域统计分析的Hough优化算法的基础上,结合两种算法的优点,实现图像边缘的倾斜检测。

3.1.1 图像的边缘检测

边缘检测主要目的是利用导数及微分的性质,确定图像上的一组曲线,即图像的边缘,该边缘是图像上那些在亮度上急剧变化、中间有间断的像素点所形成的集合,通过此边缘可以提取图像的一些关键信息,比如图像表面方向的不连续等,在一定程度上简化了图像的处理过程。以答题卡定位区域为例,如图2所示。

通过对该区域的分析就可以判定考生个人信息和其答题区域。通过对图像的边缘进行检测,可以大大降低计算量,有效弥补基于邻域统计分析的Hough优化算法计算量大的缺点。

3.1.2 图像的边缘检测方法

图像边缘检测的步骤一般包含滤波、增强、检测、定位。从目前的检测方法来看,大部分基于图像亮度之上的导数计算,以此来判定图像中的边缘位置。该方法对于图像边缘的检测跟设定的阀值有关系,阀值大小会影响到判定结果。事实上,边缘检测是通过算法来提取图像中对象和背景间的交界线,通过图像灰度分布的梯度来获得边缘检测算子。以下是几种常见的图像边缘检测算子:

(1)Roberts算子:Roberts 算子是一种最简单的算子,适用于边缘明显且噪声较少的图像分割,对具有陡峭的低噪声的图像效果最好,但处理后结果边缘不是很平滑。

(2)Prewitt算子:利用像素点上下、左右邻点的灰度差,在边缘处达到极值检测边缘,去掉部分伪边缘,对噪声具有平滑作用。该算子对噪声有抑制作用,但对边缘的定位仍不够理想。

(3)Sobel算子:是一个离散的一阶差分算子,对靠近中心的点加权以突出边缘点。该算子通过梯度与差分原理实现,用来运算图像亮度函数的梯度的近似值。当精度要求很高时,该算子提取的图像轮廓仍然不甚理想。

(4)Canny算子:是一个多阶段的优化算子,在滤波、增强和检测方面要优于其他的算子,是一种既能抗噪又能保持弱边缘的算子,但实现起来较为麻烦。

3.2 基于图像边缘检测的倾斜检测算法

3.2.1 矩形连通域检测

在检测图像的倾斜角度时,需要提取一个典型的定位块,以此定位块来分析整个答题卡的倾斜角度。这里采用邻域跟踪法识别出一个完整的矩形连通区域,其工作过程如下:

(1)以从上到下和从左到右的顺序以此扫描二值化图像,这里令起始边界点为W(x0,y0),以此点为基础跟踪下一个边界点。为了下面描述的方面,这里假定首次跟踪邻域方向为d=0。

(2)在W的邻域内判断是否有跟W同像素的点(这里假定W为黑色像素),如果没有,调整跟踪方向d=(d+1) mod 8,如果有,则该点为下一个边界点。在跟踪方向的选定上,如果(d mod 2)==0,则调整方向d=(d + 6) mod 8;否则,d=(d + 7)mod 8。

(3)重复步骤(2),直到找到四个矩形边界点为止,那么该矩形块就是一个完好的定位块。

3.3 矩形边缘Hough检测

利用Hough变换,能快速实现倾斜角的检测和图像矫正。其思想是把图像平面上的点对应到参数平面上的线,对原始图像子抽样处理和边缘线提取,最后通过统计特性来解决问题。

3.4 图像倾斜矫正

通过Hough变换找到图像倾斜角度θ后,就可以进行坐标的变换,实现图像倾斜的矫正。其变换公式为:

4 基于图像扫描识别的网上阅卷系统的处理流程设计

作为网上阅卷系统而言,要在短时间内实现大批量的阅卷,这对系统要求很高,需要具备准确性、稳定性、可靠性、易用性、实时性和安全性等特征。在功能上,要求对扫描后的数字化图像文件进行存储、切割,以便实现试卷的评阅。本文侧重网上阅卷系统的基础数据收集部分,主要是通过图像识别完成对扫描后的数字化图像数据的加工处理,这也是网上阅卷系统的核心。因此,可以将系统分为两大核心模块,分别是答题卡图像信息预处理和答题卡信息识别,二者在业务流程上是相互关联的。在图像存入缓存后,流程会转向答题卡图像预处理,预处理完成之后才转向答题卡信息识别模块处理,需要说明的是,二者处理完后都需要进行异常的检测。

其中,答题卡图像预处理包括一系列的过程,比如图像的灰度化处理、二值化处理、去噪处理和图像矫正,以增强答题卡图像特征信息可分辨能力和可提取能力,预处理的结果最终得到一幅经过Hough变换后的二值化图像;而答题卡信息识别主要是利用图像定位技术,根据答题卡模板中的设置对答题卡图像进行区域分割,以便完成考生基本信息识别、客观题识别、主观题识别等操作。

5 结束语

本文对基于图像识别的网上阅卷系统进行了设计,包括算法和系统两个方面的设计。通过图像识别和图像处理技术,可以准确地对扫描后的数字化图像数据进行切割,高效完成答题卡及试卷上不同信息的识别。由于网上阅卷系统主要是对数字化图像数据进行处理,所以本文运用Hough变换,提出了一种基于图像边缘检测的倾斜角检测算法,以此为基础设计系统的业务处理流程。该系统的设计,使得阅卷工作更加规范化、制度化、科学化、现代化,有效提高阅卷的效率和准确性。

参考文献

[1]滕今朝,邱杰.利用Hough变换实现直线的快速精确检测[J].中国图象图形学报,2008(02).

[2]李清.基于图像识别的网上阅卷系统的设计实现与优化[D].长春:东北师范大学,2013.

[3]张站,刘政怡,吴建国等.基于图像识别的阅卷系统的设计与实现[J].微型机与应用,2011(04).

[4]杨青燕,彭延军.基于灰度图像的答题卡识别技术[J].山东科技大学学报(自然科学版),2009(03).

作者单位

1.长春工业大学信息化建设工作办公室 吉林省长春市 130012

2.中国移动通信集团吉林有限公司长春分公司 吉林省长春市 130000

上一篇:基于物联网的智能交通系统中的车辆通信网络 下一篇:监控理论视角下独立学院艺术专业英语教学探析