JSP中URL重写的实现

时间:2022-09-09 10:07:00

(吉首大学 软件服务外包学院,湖南 张家界 427000)

摘要:针对搜索引擎对动态网页抓取率不高的问题,提出使用URL重写技术优化网页URL地址解决方法。分析了JSP实现URL重写的机制,并重点论述了用JSP进行URL重写的技术实现。

关键词:JSP;URL重写;过滤器;正则表达式

中图分类号:TP301文献标识码:A文章编号:1672-7800(2012)003-0024-02

作者简介:颜一鸣(1976-),男,湖南张家界人,硕士,吉首大学讲师,研究方向为软件工程。

0引言

随着互联网的飞速发展,越来越多的企业选择建立网站进行企业宣传和网络办公。JSP(Java Server Pages)技术作为当前较为热门的Web开发技术,具有安全性高和可移植性等特点,很多企业选择用此技术来开发网站。网站建成后最重要的是进行推广,大多数企业选择利用搜索引擎进行网站推广。要增强网站中地址的可读性和让搜索引擎快速收录网站,就需要优化网页的URL地址,也就是使用URL重写技术。

1URL重写的优劣

URL重写实质上是截取传入的Web请求并自动将请求重定向到其它URL的过程,用户通过相应的虚拟URL(Virtual URL)访问网页资源。使用Url重写有以下优点:

(1)易于被搜索引擎收录。大部分搜索引擎抓取动态网页的优先度远远低于静态网页。而URL重写很大程度上可将动态链接转换成静态链接,这将使得搜索引擎尽可能深地抓取网站子栏目的内容,使网页在搜索结果中排名靠前。

(2)增加用户访问时的友好和方便。很少有用户去关心网站的页面和地址,但对一般的大中型网站增强可读性还是必须的。比如原来可以把配置如下:

^/(\\w+)/(\\w+)/page_(\\d+)\.html$

/$1.jsp?category=$2&page=$3

在示例1的from节点中,使用了正则表达式描述重写后的URL规则。正则表达式由一些普通字符和一些元字符(metacharacters)组成,普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。一个正则表达式,就是用某种模式去匹配一类字符串的一个公式。常用的正规表达式元字符含义如表1所示。

实例1中的$1,$2代表与配置正规表达式^/(\\w+)/(\\w+)/相对应的参数。

rule结点中from规则默认使用正则表达式来匹配,当用户访问服务器的URL会与该配置相比较,如果符合规则就会按照下面to结点中的配置对其进行跳转,其默认是forward跳转,forward方式只能跳转到同一个Web应用中的页面上,如果想连接外部的网站,则使用redirect跳转,格式为:。

4结束语

本文详细阐述了URL重写的优劣,以及在JSP中通过过滤器实现URL重写的原理和方法。利用开源框架UrlRewriteFilter实现URL重写不需要复杂的Web容器配置,只需将过滤器与特定的servlet关联,关键是通过正则表达式描述重写后的URL规则,这个规则可自定义,从而使得URL地址规范化和可阅读化,达到便于搜索引擎收录的目的。

参考文献:

\[1\]URL rewrites and 301 redirects-how does it all work\[EB/OL\]. www.省略/blog/url-rewrites-and-301-redirects-how-does-it-all-work.

\[2\]URl rewrite filter\[EB/OL\]. www.省略/.

\[3\]\[美\]MARTY HALL, LARRY BROWN,YAAKOV CHAIKIN. Servlet与JSP核心编程\[M\].胡书敏,译.北京:清华大学出版社,2009.

In the realization of JSP URL rewrite

Abstract:For the low recalling of search result on dynamic pages, making use of URL rewriting technology to optimize the web page URL address. We analyze the mechanism of using JSP to implement URL rewriting, and focus on how to realize URL rewriting.

Key Words: JSP; URL rewrite; Filter; RegExp

上一篇:基于语义的文献检索系统研究 下一篇:设计模式对软件开发过程的优化探讨