正则表达式在网页表单验证中的应用

时间:2022-06-20 02:55:33

正则表达式在网页表单验证中的应用

摘要:在网站制作,尤其是应用B/S(Browser/Server,浏览器/服务器)架构的动态网站,表单扮演了非常重要的角色,它是客户端向服务器提交数据的载体。为了保证表单提交数据的合法性,需要对提交的某些关键数据进行验证。本文主要论述如何应用正则表达式验证表单数据,并给出了几类常用的表单验证正则表达式。

关键词:表单;正则表达式;网站制作

中图分类号:TP31 文献标识码:A 文章编号:1007-9416(2017)01-0236-01

正则表达式是用于模式匹配和替换的有力工具,它既可以用于数据有效性验证,如测试字符串是否匹配某种模式;又可以用于替换文本,即在文档中使用正则表达式查找标识特定文字,然后进行替换或删除;还可以根据模式匹配从字符串中提取一个子字符串,用来在指定文本或输入数据中查找特定文字。正则表达式功能十分强大,但是又非常简洁。本文主要阐述正则表达式的基本内涵,及它在网站表单数据验证中的应用。

1 正则表达式概述

正则表达式,又称正规表示法、常规表示法(Regular Expression,常简写为regex、regexp或RE),在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,即用事先定义好的一些特定字符及这些字符的组合,组成一个“规则字符串”,用来表达对字符串的一种过滤逻辑。所谓匹配,是指在给定的字符串中,查找与给定的正则表达式相匹配的部分,满足条件的可能不止一个,每一个满足条件的部分都被称为一个匹配。例如,最简单正则表达式"is"可以匹配“this”、“his”等字符串,但是不能匹配"Island"。

给定一个正t表达式和另一个字符串,可以验证给定的字符串是否符合正则表达式的过滤逻辑(又称“匹配”),或者可以从字符串中获取我们想要的特定部分。在编写处理字符串的程序或网页时,经常需要验证或查找符合某些复杂规则的字符串,正则表达式就非常适用于描述这些复杂的文本规则。因为正则表达式的主要应用对象是文本,所以可以说正则表达式是用于文本匹配的工具。

2 正则表达式语法

正则表达式主要由普通字符和特殊字符(又称元字符)组成。普通字符主要包含英文字母a-z/A-Z、数字0-9等,而特殊字符都具有特殊的含义,比如,特殊字符“\d”可以匹配任意一位数字,而“\w”则可以匹配字母、数字或下划线字符,还有匹配子表达式出现次数的“*”(任意次)、“+”(至少一次)、“?”(零次或一次)等特殊字符。

例如查找“is”,可以使用最简单的由普通字符组成的正则表达式“is”,匹配含有“is”的字符串,但是很多单词如this、his、kiss等都包含“is”,因此若要精确匹配查找“is”,不能只用“is”正则查找,而是应该使用正则表达式“\bis\b”(“\b”是一个特殊字符,它用来匹配一个单词的边界,即匹配单词的开头或结尾)。

3 应用正则表达式验证表单数据

在网站开发,尤其是动态网站开发方面,表单是客户端向服务器提交数据的重要载体,扮演者非常重要的角色。如何验证表单提交数据的合法性也成为一个大问题。为了验证提交数据的合法性,开发人员可能需要写很多的验证函数,这给开发工作带来很大的困扰,而应用正则表达式验证提交数据则很大提高了代码的可重用性,并提高了开发效率。

通常表单数据的验证主要有两方面:一方面是判断用户输入的数据是否合法;另一方面是提示用户的数据为什么是不合法的。在表单数据中,通常需要验证的内容有字符串(如以字母开头、规定长度等)、邮政编码、电话号码、电子邮件、手机号码、身份证号码等。

4 常用的表单验证正则表达式

在网站开发时,复杂的表单验证经常需要使用正则表达式,在实际应用中,表单中常用的几类正则表达式如下。

(1)/^[a-zA-Z][\w -]{n,m}$/:验证以字母开头、包含字母、数字、下划线、连接符- ,且长度在(n+1)-(m+1)之间的字符串。

(2)/^[\u4E00-\u9FA5]+$/:验证输入的数据只能为中文。

(3)/^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$/:验证输入的Email格式是否正确。

(4)/^\d{15}$|^\d{17}([0-9]|X)$/或者/^\d{15}$|^\d{17}([0-9]|X)$:验证身份证号码(身份证号码为15位或者18位,15位时全为数字,18位时前17位为数字,最后一位是校验位,可能为数字或字符X)。

(5)/^[1-9]\d{5}$/:验证中国邮政编码。

(6)/^[1-9][0-9]{4,}$/:用于验证QQ号码,QQ号码最少是5位。

(7)/^1\d{10}$/:验证大陆手机号码。

5 结语

正则表达式是用来操作文本和数据的强大工具,它具有易用、灵活、功能强大的优点,而且还可以将那些原本复杂、繁琐的文本处理过程变成可自动处理的工作。应用正则表达式处理复杂字符操作,不仅可以提高工作效率,而且也可以在一定程度上节省代码量。

但是,对于初学者来说,正则表达式的语法比较晦涩难懂,原理比较复杂,不容易被学习和掌握。而且,如果正则表达式写得不合理,很容易导致性能问题,所以只有清楚地理解正则引擎的执行方式,才能写出好的正则表达式。

参考文献

[1]Jeffrey E.F.Friedl著,余晟译.精通正则表达式(第3版).电子工业出版社,2012.

[2]Micbael Fitzgerald.正则表达式入门.东南大学出版社,2013.

[3]Jan Goyvaerts Steven Levithan著 郭耀 迟骋译.正则表达式经典实例(第2版).人民邮电出版社,2014.

上一篇:瞬变电磁、EH4在新疆伊南煤田阿尔玛勒煤矿采空... 下一篇:基于高分辨率遥感影像的道路特征信息提取方法