CN104065736B - 一种url重定向方法、装置及*** - Google Patents

一种url重定向方法、装置及*** Download PDF

Info

Publication number
CN104065736B
CN104065736B CN201410314533.7A CN201410314533A CN104065736B CN 104065736 B CN104065736 B CN 104065736B CN 201410314533 A CN201410314533 A CN 201410314533A CN 104065736 B CN104065736 B CN 104065736B
Authority
CN
China
Prior art keywords
url
redirection
rule
class catalogue
data dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410314533.7A
Other languages
English (en)
Other versions
CN104065736A (zh
Inventor
廖青松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Che Zhi Interconnect (beijing) Technology Co Ltd
Original Assignee
Che Zhi Interconnect (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Che Zhi Interconnect (beijing) Technology Co Ltd filed Critical Che Zhi Interconnect (beijing) Technology Co Ltd
Priority to CN201410314533.7A priority Critical patent/CN104065736B/zh
Publication of CN104065736A publication Critical patent/CN104065736A/zh
Application granted granted Critical
Publication of CN104065736B publication Critical patent/CN104065736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种URL重定向方法、装置及***。所述URL重定向方法包括:获取客户端请求的URL,从该URL中获取请求路径的一级目录;根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则集合;以及将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向。本发明提高了服务器端进行URL重定向的处理速度,进而提高了客户端访问服务器中资源的速度。

Description

一种URL重定向方法、装置及***
技术领域
本发明涉及互联网领域,具体涉及一种URL重定向方法、装置及***。
背景技术
URL(Uniform Resource Locator,统一资源定位符)是因特网上标准的资源地址,用于完整地描述因特网上的网页和其他资源。URL由一系列字符组成,格式为protocol://[username:password]@host[/path][?query]。其中,protocol域指定传输协议;username和password域指定连接到服务器所需的用户名和密码;host域指定存放资源的服务器的主机名或IP地址;path域指定主机上资源的存储路径;query域指定给动态网页传递的参数。客户端请求访问服务器的信息资源时,需要确定请求使用的协议、请求的服务器、请求资源的存储路径(本发明中称之为请求路径)等信息,上述信息都由URL地址提供。
URL重定向又称为URL重写(URL Rewrite),是指服务器截取传入的URL地址,将该URL地址重定向到其他URL的过程。比如浏览器发送的URL地址为www.autohome.com.cn/364/,服务器根据URL重定向的配置文件,自动将这个URL地址重定向到www.autohome.com.cn/XXX.aspx?id=364,客户端看到的还是发出请求时的URL地址,但实际访问的是重定向后的URL地址(对于该URL地址中的资源存储路径,本发明中称之为应用路径)。URL重定向的优点在于:缩短URL地址的长度,隐藏实际路径提高安全性;易于用户记忆和键入;易于被搜索引擎收录;便于网站更新。
现有URL重定向的实现方案为,首先获取URL重定向的配置文件,例如为:
上述配置文件为xml文件,该xml文件中包括多条重定向规则(为正则表达式规则),每条重定向规则由<RewriterRule>元素表达,每个<RewriterRule>元素包括<LookFor>元素和<SendTo>元素,要在被请求的URL中查找的模式由<LookFor>元素表示,要替换所找到的模式的字符串由<SendTo>元素表示。
然后,服务器截获到文件请求例如aaa.xml时,在配置文件中从上向下寻找匹配的重定向规则,采用正则表达式(regular expression)匹配,结果匹配到了上述的一条重定向规则,因此将aaa.xml重定向到/aaa/bbb.aspx。
正则表达式是指用一个“字符串”来描述一个特征,以验证另一个“字符串”是否符合这个特征。例如表达式“mn*”描述一个字符串的特征,该特征由一个“m”和任意个“n”组成,如果待验证的字符串是“mn”、“mnn”或“mnnnnnn”,则这些字符串均符合这个特征。
但是,采用正则表达式匹配的速度较慢,且消耗的***资源也较高。特别是对于复杂的网站,其用于URL重定向的配置文件中的重定向规则很多,采用正则表达式匹配的方式进行URL重定向会使得客户端访问服务器资源的速度较慢,使得用户的体验效果不佳。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的URL重定向方法、装置及***。
根据本发明的一个方面,提供了一种URL重定向方法,包括:
获取客户端请求的URL,从该URL中获取请求路径的一级目录;
根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则集合;以及
将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向。
可选地,所述方法还包括步骤:根据URL重定向的配置文件生成所述数据字典,包括:
从配置文件中逐条读取重定向规则;
对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。
可选地,所述根据URL重定向的配置文件生成所述数据字典,包括:从配置文件中逐条读取重定向规则;对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。
可选地,所述将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中,包括:判断请求路径的一级目录是否存在于数据字典中;当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据条目添加到数据字典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录相关联的重定向规则集合中。
可选地,当配置文件的重定向规则的请求路径为多个一级目录构成的一级目录集合时,所述将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中为,分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典中。
可选地,所述将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向,包括:从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规则时,将该请求路径重定向到重定向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL进行重定向。
根据本发明的另一方面,提供了一种URL重定向装置,包括:
一级目录获取单元,适于获取客户端请求的URL,从该URL中获取请求路径的一级目录;
字典查找单元,适于根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则集合;以及
重定向单元,适于将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向。
可选地,所述装置还包括数据字典生成单元,适于:
从配置文件中逐条读取重定向规则;
对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。
可选地,所述数据字典生成单元进一步适于:判断请求路径的一级目录是否存在于数据字典中;当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据条目添加到数据字典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录相关联的重定向规则集合中。
可选地,当配置文件的重定向规则的请求路径为多个一级目录构成的一级目录集合时,所述数据字典生成单元分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典中。
可选地,所述重定向单元进一步适于:从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规则时,将该请求路径重定向到重定向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL进行重定向。
根据本发明的又一方面,提供了一种URL重定向***,包括多个客户端、为这些客户端提供各种网络资源的服务器端,客户端和服务器端经由互联网络而相互通信,其中,所述服务器端包括上述的URL重定向装置。
本发明通过预先将配置文件中的重定向规则按照请求路径的一级目录进行归类,并采用数据字典进行保存,在进行URL重定向时,先通过数据字典查找一级目录,查找到了再进行正则表达式匹配,否则不进行正则表达式匹配,避免了直接进行正则表达式匹配失败的情况,从而提高了匹配命中的效率,进而提高了URL重定向的处理速度和客户端访问服务器中资源的速度。而且,进行正则表达式匹配的仅是所有重定向规则的一个子集,进一步提高了URL重定向的处理速度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的URL重定向***的结构图;
图2示出了根据本发明一个实施例的URL重定向装置的结构图;以及
图3示出了根据本发明一个实施例的URL重定向方法的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的URL重定向***的结构图。如图1所示,URL重定向***包括多个客户端110(图中示出了3个)、为这些客户端110提供各种网络资源的服务器端120,客户端110和服务器端120经由互联网络而相互通信。
在本发明实施例中,客户端110可以是本领域任何可以呈现从服务器端120获取的网络资源的设备,包括但不限于桌面型计算机、笔记本式计算机、个人数字助理、智能移动终端和平板电脑等。客户端110具有操作***,操作***上运行有浏览器,所述浏览器能够呈现从服务器端120获取的网络资源,例如网页文件。
服务器端120应客户端110的请求(例如http请求)而将所请求的网络资源返回给客户端110。客户端110请求访问服务器端120的网络资源时,需要确定请求使用的协议、请求的服务器、请求资源的存储路径(本发明中称之为请求路径)等信息,上述信息都由URL地址提供。例如,客户端110的请求URL为http://www.autohome.com.cn/aaa/20/article.html,则该URL中的请求路径为/aaa/20/article.html,且该请求路径的一级目录为/aaa。
在一些情况下,服务器端120需要对客户端110所请求的URL进行重定向,即将URL中的请求路径重写为服务器端120中的其他路径(本发明中称之为应用路径),因此,服务器端120还包括URL重定向装置200,由URL重定向装置200来执行URL的重定向。例如,URL重定向装置200将上述的URL重定向为http://www.autohome.com.cn/ccc.aspx?id=20,即将请求路径/aaa/20/article.html重定向到应用路径/ccc.aspx?id=20。经URL重定向后,客户端110实际访问的URL为http://www.autohome.com.cn/ccc.aspx?id=20,客户端110看到URL的仍然是http://www.autohome.com.cn/aaa/20/article.html,这样,就缩短了用户输入的URL地址的长度,隐藏了实际路径从而提高了网络资源的安全性。
图2示出了根据本发明一个实施例的URL重定向装置200的结构图。所述URL重向装置200设置在服务器端120中,适于对客户端110所请求的URL进行重定向。
参照图2,所述URL重定向装置200包括数据字典生成单元210、一级目录获取单元220、字典查找单元230和重定向单元240。
数据字典生成单元210适于根据URL重定向的配置文件生成数据字典。所生成的数据字典包括一个或多个数据条目,每一数据条目包括目录名称和与该目录名称相关联的重定向规则(为基于正则表达式的规则)集合,所述目录名称为配置文件的重定向规则中请求路径的一级目录,与该目录名称相关联的重定向规则集合为配置文件中具有该一级目录的请求路径对应的重定向规则的集合,该集合为配置文件所包括的所有重定向规则的一个子集。也就是说,数据字典生成单元210将配置文件中的重定向规则按照请求路径的一级目录进行归类,将一级目录相同的请求路径对应的重定向规则归为一类,并将其存储为数据字典的一个数据条目。
服务器端120例如网站服务器中存储有用于进行URL重定向的配置文件,所述配置文件中包括一些重定向规则,所述重定向规则为基于正则表达式的重定向规则。该配置文件例如可以由网站设计人员设置好后,存储到网站服务器中。
例如,服务器端120中存储的配置文件如下:
上述配置文件为xml文件,该xml文件中包括4条重定向规则(为正则表达式规则),每条重定向规则由<RewriterRule>元素表达,每个<RewriterRule>元素包括<LookFor>元素和<SendTo>元素,要在被请求的URL中查找的模式由<LookFor>元素表示,要替换所找到的模式的字符串由<SendTo>元素表示。
例如,在上述配置文件中,第一条重定向规则的<LookFor>元素中“~/aaa/(\d+)/”表示要查找的模式为:URL请求路径的一级目录为/aaa/,二级目录为/(\d+),其中“\d+”表示一个或多个数字;第一条重定向规则的<SendTo>元素中“~/bbb.aspx?id=$1”表示当URL请求路径与“~/aaa/(\d+)/”匹配时,将该URL种的请求路径替换为应用路径“/bbb.aspx?id=$1”,其中$1表示“~/aaa/(\d+)/”中第一个括号中正则表达式的值。
数据字典生成单元210可以按照如下方式来根据URL重定向的配置文件生成数据字典:从配置文件中逐条读取重定向规则;对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。具体地,对于读取到的每条重定向规则,首先判断该重定向规则的请求路径的一级目录是否存在于数据字典中(即判断数据字典中是否存在与该请求路径对应的数据条目);然后,当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则的关联关系作为一个数据条目添加到数据字典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录相关联的重定向规则集合中(即更新数据字典中与该一级目录对应的数据条目,将该重定向规则添加到该数据条目所包括的重定向规则集合中)。
另外,所述配置文件中的重定向规则的请求路径可能为多个一级目录构成的一级目录集合。例如,对于上述配置文件中的最后一条重定向规则的<LookFor>元素中,请求路径的第一部分/(a1|a2|a3)即为3个一级目录构成的集合,分别为/a1、/a2和/a3。此种情况下,数据字典生成单元210是分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典中,即对于上述例子,在数据字典中添加3个数据条目,这三个数据条目的目录名称分别为/a1、/a2和/a3,相关联的重定向规则均为:
<LookFor>~/(a1|a2|a3)/\ad{6}/(\d+)12\.html</LookFor>
<SendTo>~/mmm/ddd.aspx?id=$2</SendTo>
另外,所述配置文件中的重定向规则的请求路径的一级目录还可能为数字字符串变量,例如为/(\d+),此种情况下,数据字典中数据条目的目录名称为该数字字符串变量。
数据字典中的数据条目具体可以以键-值(key-value)对方式存储。例如,根据上述配置文件生成的数据字典对应的key分别为:aaa、ddd、a1、a2、a3,aaa对应的value包括两条重定向规则,分别为:
ddd对应的value包括一条重定向规则,如下:
a1、a2、a3对应的value相同,包括一条重定向规则,如下:
一级目录获取单元220适于获取客户端110请求的URL,从该URL中获取请求路径的一级目录。客户端110需要访问服务器端120中的网络资源时,发送请求(例如http请求)到服务器端120,该请求中包括该网络资源对应的URL,一级目录获取单元220可以获取该URL中的请求路径,并获取该请求路径中的一级目录。
例如,客户端110请求的URL中的请求路径为/mmm/20/,则对应的一级目录为mmm;又例如,客户端110请求的URL中的请求路径为/aaa/20/article.html,则对应的一级目录为aaa。
字典查找单元230适于根据一级目录获取单元220获取的一级目录从数据字典中查找相关联的重定向规则集合。例如,当获取到的一级目录为mmm时,根据mmm查找数据字典,数据字典中不存在目录名称为mmm的数据条目,则查找失败;又例如,当获取到的一级目录为aaa时,根据aaa查找数据字典,数据字典中存在目录名称为aaa的数据条目,该数据条目中与aaa关联的重定向规则集合包括两条重定向规则,如下:
另外,当所获取到的一级目录为数字字符串时,则该数字字符串直接与数据字典中的数字字符串变量匹配。
重定向单元240适于将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配(正则表达式匹配),并根据匹配到的重定向规则对URL进行重定向。重定向单元240可以从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规则时,将该请求路径重定向到所匹配到的重定向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL进行重定向。
当然,如果字典查找单元230根据一级目录获取单元220获取的一级目录查找数据字典时,如果查找失败,则重定向单元240也不对该URL进行重定向。
例如,客户端110请求的URL中的请求路径为/mmm/20/,根据一级目录mmm查找失败,则不对该URL进行重定向。
又例如,客户端110请求的URL中的请求路径为/aaa/20/article.html,根据一级目录aaa查找到的上述两条重定向规则进行正则表达式匹配,结果匹配到第二条重定向规则:
于是,根据该第二条重定向规则,将请求的URL中的请求路径/aaa/20/article.html重定向到应用路径/ccc.aspx?id=20。
根据本发明实施例的URL重定向装置,预先将配置文件中的重定向规则按照请求路径的一级目录进行归类,并采用数据字典进行保存,在进行URL重定向时,先通过数据字典查找一级目录,查找到了再进行正则表达式匹配,否则不进行正则表达式匹配,避免了直接进行正则表达式匹配失败的情况,从而提高了匹配命中的效率,进而提高了URL重定向的处理速度和客户端访问服务器中资源的速度。而且,进行正则表达式匹配的仅是所有重定向规则的一个子集,进一步提高了URL重定向的处理速度。
例如,对于上述包括请求路径为/mmm/20/的URL,根据现有的URL重定向方案,即使配置文件中不存在与/mmm/20/对应的重定向规则,也需要对配置文件中的所有重定向规则依次进行正则表达式匹配处理过程,浪费了大量的服务器处理资源,并造成了客户端访问服务器中网络资源的速度也较慢;而根据本发明实施例的URL重定向方案,在根据数据字典查找不到与一级目录mmm对应的正则表表达式集合时,不继续进行正则表达式的匹配,直接决定不对该URL进行重定向,显著提高了URL重定向的处理速度。
需要说明的是,上述的数据字典生成单元210为可选单元,即所述URL重定向装置200中可以不包括所述数据字典生成单元210,数据字典可以预先配置好后输入到服务器端120,由URL重定向装置200使用。
图3示出了根据本发明一个实施例的URL重定向方法的流程图,该URL重定向方法由服务器端执行。
参照图3,该URL重定向方法始于步骤S302。在步骤S302中,根据URL重定向的配置文件生成数据字典。所生成的数据字典包括一个或多个数据条目,每一数据条目包括目录名称和与该目录名称相关联的重定向规则(为基于正则表达式的规则)集合,所述目录名称为配置文件的重定向规则中请求路径的一级目录,与该目录名称相关联的重定向规则集合为配置文件中具有该一级目录的请求路径对应的重定向规则的集合,该集合为配置文件所包括的所有重定向规则的一个子集。也就是说,是将配置文件中的重定向规则按照请求路径的一级目录进行归类,将一级目录相同的请求路径对应的重定向规则归为一类,并将其存储为数据字典的一个数据条目。
在步骤S302中,可以按照如下方式来根据URL重定向的配置文件生成数据字典:从配置文件中逐条读取重定向规则;对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。具体地,对于读取到的每条重定向规则,首先判断该重定向规则的请求路径的一级目录是否存在于数据字典中(即判断数据字典中是否存在与该请求路径对应的数据条目);然后,当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则的关联关系作为一个数据条目添加到数据字典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录相关联的重定向规则集合中(即更新数据字典中与该一级目录对应的数据条目,将该重定向规则添加到该数据条目所包括的重定向规则集合中)。
另外,所述配置文件中的重定向规则的请求路径可能为多个一级目录构成的一级目录集合。此种情况下,是分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典中。另外,所述配置文件中的重定向规则的请求路径的一级目录还可能为数字变量变量,例如为/(\d+),此种情况下,数据字典中数据条目的目录名称为该数字变量变量。其中,数据字典中的数据条目具体可以以键-值(key-value)对方式存储。
需要说明的是,步骤S302中所执行的处理与数据字典生成单元210所执行的处理相同,具体可参照上文对数据字典生成单元210的描述,这里不做赘述。
通过步骤S302预先生成了数据字典之后,方法进入步骤S304。在步骤S304中,获取客户端请求的URL,从该URL中获取请求路径的一级目录。需要说明的是,步骤S304中所执行的处理与一级目录获取单元220所执行的处理相同,具体可参照上文对一级目录获取单元220的描述,这里不做赘述。
在获取到请求路径的一级目录之后,方法进入步骤S306。在步骤S306中,根据获取的一级目录从数据字典中查找相关联的重定向规则集合。
需要说明的是,步骤S306中所执行的处理与字典查找单元230所执行的处理相同,具体可参照上文对字典查找单元230的描述,这里不做赘述。
在查找到相关联的重定向规则集合之后,方法进入步骤S308。在步骤S308中,将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向。可以从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规则时,将该请求路径重定向到所匹配到的重定向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL进行重定向。当然,如果在步骤S304中查找失败时,则在步骤S306中也不对该URL进行重定向。
需要说明的是,步骤S308中所执行的处理与重定向单元240所执行的处理相同,具体可参照上文对重定向单元240的描述,这里不做赘述。
根据本发明实施例的URL重定向方法,预先将配置文件中的重定向规则按照请求路径的一级目录进行归类,并采用数据字典进行保存,在进行URL重定向时,先通过数据字典查找一级目录,查找到了再进行正则表达式匹配,否则不进行正则表达式匹配,避免了直接进行正则表达式匹配失败的情况,从而提高了匹配命中的效率,进而提高了URL重定向的处理速度和客户端访问服务器中资源的速度。而且,进行正则表达式匹配的仅是所有重定向规则的一个子集,进一步提高了URL重定向的处理速度。
需要说明的是,上述的步骤S302为可选步骤,即所述URL重定向方法可以不包括所述步骤S302,数据字典可以预先配置好后输入到服务器端中,由所述URL重定向方法使用。
根据本发明实施例的URL重定向方法及装置,为便于代码的实现,在进行网站设计时,可以将该网站对应的用于URL重定向的配置文件中的一级目录限定为:
1、数字字符串变量:例如为(\d+)。
2、字符串常量(一般由数字和字母构成):
(1)集合
文件集合:以“.”为文件特征,例如,(news_site.xml|bbs_site.xml)(news.xml)。
目录集合:例如,(photo|newbran)、(audi)。
(2)非集合(单个)
单个文件:以“.”为文件特征,例如,a.html,a.Xml。
单个目录:例如,chezhan,ExpertBlog。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的URL重定向装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (11)

1.一种URL重定向方法,包括:
获取客户端请求的URL,从该URL中获取请求路径的一级目录,所述请求路径为URL中的path域;
根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则集合,所述目录名称为配置文件的重定向规则中请求路径的一级目录,与该目录名称相关联的重定向规则集合为URL重定向的配置文件中具有该一级目录的请求路径对应的重定向规则的集合,其中所述重定向规则为将URL中的请求路径改写为服务器中的其他路径的规则;
将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向;以及
如果根据获取的一级目录查找数据字典时查找失败,则不对该URL进行重定向。
2.如权利要求1所述的URL重定向方法,还包括步骤:
根据URL重定向的配置文件生成所述数据字典,包括:
从配置文件中逐条读取重定向规则;
对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。
3.如权利要求2所述的URL重定向方法,其中,所述将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中,包括:
判断请求路径的一级目录是否存在于数据字典中;
当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据条目添加到数据字典中;
当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录相关联的重定向规则集合中。
4.如权利要求3所述的URL重定向方法,其中,当配置文件的重定向规则的请求路径为多个一级目录构成的一级目录集合时,所述将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中为,分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典中。
5.如权利要求1所述的URL重定向方法,其中,所述将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向,包括:
从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;
当匹配到某条重定向规则时,将该请求路径重定向到重定向规则中的应用路径;
当所有重定向规则均不匹配时,不对该URL进行重定向。
6.一种URL重定向装置,包括:
一级目录获取单元,适于获取客户端请求的URL,从该URL中获取请求路径的一级目录,所述请求路径为URL中的path域;
字典查找单元,适于根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则集合,所述目录名称为配置文件的重定向规则中请求路径的一级目录,与该目录名称相关联的重定向规则集合为URL重定向的配置文件中具有该一级目录的请求路径对应的重定向规则的集合,其中所述重定向规则为将URL中的请求路径改写为服务器中的其他路径的规则;以及
重定向单元,适于将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向;
其中如果字典查找单元根据一级目录获取单元获取的一级目录查找数据字典时查找失败,则重定向单元不对该URL进行重定向。
7.如权利要求6所述的URL重定向装置,其中,还包括数据字典生成单元,适于:
从配置文件中逐条读取重定向规则;
对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。
8.如权利要求7所述的URL重定向装置,其中,所述数据字典生成单元进一步适于:
判断请求路径的一级目录是否存在于数据字典中;
当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据条目添加到数据字典中;
当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录相关联的重定向规则集合中。
9.如权利要求8所述的URL重定向装置,其中,当配置文件的重定向规则的请求路径为多个一级目录构成的一级目录集合时,所述数据字典生成单元分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典中。
10.如权利要求6所述的URL重定向装置,其中,所述重定向单元进一步适于:
从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;
当匹配到某条重定向规则时,将该请求路径重定向到重定向规则中的应用路径;
当所有重定向规则均不匹配时,不对该URL进行重定向。
11.一种URL重定向***,包括多个客户端、为这些客户端提供各种网络资源的服务器端,客户端和服务器端经由互联网络而相互通信,其中,所述服务器端包括如权利要求6至10中任一项所述的URL重定向装置。
CN201410314533.7A 2014-07-03 2014-07-03 一种url重定向方法、装置及*** Active CN104065736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410314533.7A CN104065736B (zh) 2014-07-03 2014-07-03 一种url重定向方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410314533.7A CN104065736B (zh) 2014-07-03 2014-07-03 一种url重定向方法、装置及***

Publications (2)

Publication Number Publication Date
CN104065736A CN104065736A (zh) 2014-09-24
CN104065736B true CN104065736B (zh) 2017-11-28

Family

ID=51553263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410314533.7A Active CN104065736B (zh) 2014-07-03 2014-07-03 一种url重定向方法、装置及***

Country Status (1)

Country Link
CN (1) CN104065736B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547524A (zh) * 2015-09-18 2017-03-29 百度在线网络技术(北京)有限公司 一种用于软件调用的方法和装置
CN107181779B (zh) * 2016-03-10 2021-09-10 阿里巴巴集团控股有限公司 访问请求的处理方法、装置和***
CN107733972B (zh) 2017-08-28 2020-09-08 阿里巴巴集团控股有限公司 一种短链接解析方法、装置及设备
CN110519656B (zh) * 2018-05-22 2021-11-26 中国电信股份有限公司 自适应流媒体的播放方法、***以及服务器
CN109471858A (zh) * 2018-09-28 2019-03-15 沈文策 地址转换方法、文章访问方法、装置及电子设备
CN112804373B (zh) * 2020-12-30 2022-10-14 微医云(杭州)控股有限公司 接口域名确定方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242336A (zh) * 2008-03-13 2008-08-13 杭州华三通信技术有限公司 远程访问内网Web服务器的方法及Web代理服务器
CN101452483A (zh) * 2008-12-25 2009-06-10 阿里巴巴集团控股有限公司 网站访问方法及***
CN101727447A (zh) * 2008-10-10 2010-06-09 浙江搜富网络技术有限公司 基于url的正则表达式的生成方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8073829B2 (en) * 2008-11-24 2011-12-06 Microsoft Corporation HTTP cache with URL rewriting

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242336A (zh) * 2008-03-13 2008-08-13 杭州华三通信技术有限公司 远程访问内网Web服务器的方法及Web代理服务器
CN101727447A (zh) * 2008-10-10 2010-06-09 浙江搜富网络技术有限公司 基于url的正则表达式的生成方法和装置
CN101452483A (zh) * 2008-12-25 2009-06-10 阿里巴巴集团控股有限公司 网站访问方法及***

Also Published As

Publication number Publication date
CN104065736A (zh) 2014-09-24

Similar Documents

Publication Publication Date Title
CN104065736B (zh) 一种url重定向方法、装置及***
US6714934B1 (en) Method and system for creating vertical search engines
CN100367276C (zh) 用于在计算机网络内搜索的方法和设备
US9760632B2 (en) URL rescue by execution of search using information extracted from invalid URL
US9584580B2 (en) URL rescue by identifying information related to an item referenced in an invalid URL
US7701944B2 (en) System and method for crawl policy management utilizing IP address and IP address range
CN106254325B (zh) 网站认证信息的显示方法及浏览器
US8438279B2 (en) Identifying content that is responsive to a request for an invalid URL
WO2012125601A1 (en) Methods and systems for providing content provider-specified url keyword navigation
CN105939313B (zh) 状态码重定向方法及装置
US20180131708A1 (en) Identifying Fraudulent and Malicious Websites, Domain and Sub-domain Names
CN102833258A (zh) 网址访问方法及***
US20070162524A1 (en) Network document management
CN106709073A (zh) 一种浏览器中进行消息推送的方法和一种浏览器终端
CN110266661A (zh) 一种授权方法、装置及设备
CN104679798B (zh) 网页检测方法及装置
CN103810268A (zh) 加载搜索结果推荐信息、网址检测的方法、装置和***
US9825907B2 (en) Transfer of a domain name through mobile devices
US9953105B1 (en) System and method for creating subdomains or directories for a domain name
CN106790593A (zh) 一种页面处理方法和装置
EP2711852A1 (en) Methods and systems for providing content provider-specified URL keyword navigation
CN103984747B (zh) 屏幕信息处理方法和装置
CN106294848A (zh) 一种网页解析、获取方法及装置
US20160098153A1 (en) Card interface for managing domain name projects
CN102867056A (zh) 关键词搜索方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant