CN102346736B - 一种网页数字信息的保护方法及*** - Google Patents

一种网页数字信息的保护方法及*** Download PDF

Info

Publication number
CN102346736B
CN102346736B CN201010240246.8A CN201010240246A CN102346736B CN 102346736 B CN102346736 B CN 102346736B CN 201010240246 A CN201010240246 A CN 201010240246A CN 102346736 B CN102346736 B CN 102346736B
Authority
CN
China
Prior art keywords
rectangular area
area
pixel
image
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010240246.8A
Other languages
English (en)
Other versions
CN102346736A (zh
Inventor
孙翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201010240246.8A priority Critical patent/CN102346736B/zh
Publication of CN102346736A publication Critical patent/CN102346736A/zh
Priority to HK12104212A priority patent/HK1163855A1/zh
Application granted granted Critical
Publication of CN102346736B publication Critical patent/CN102346736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

本申请公开了一种网页数字信息的保护方法及***。一种网页数字信息保护方法包括:将数字信息文本转换为图像,所述数字信息包含的数字字符个数N≥2;将所述图像分割为n个矩形区域,每个矩形区域中包括至少一个数字字符的图像,其中2≤n≤N;对每个矩形区域分别进行随机几何形变;组合所有形变后的区域得到变形图像,所述变形图像用于在网页发布。应用上述技术方案,对多个区域进行几何形变的计算开销与对整个图像进行几何形变的计算开销基本相当;但是对于识别者而言,由于每个区域使用的变换函数都不相同,破解难度将成倍增加。而采用随机几何形变的方式,可以使得每次刷新网页时都使用不同的变换函数,进一步增加了破解难度。

Description

一种网页数字信息的保护方法及***
技术领域
本申请涉及互联网技术领域,特别是涉及一种网页数字信息的保护方法及***。
背景技术
网络爬虫是搜素引擎***在数据准备之前的一个核心子***,网络爬虫通常充当为搜索引擎收集数据的角色;爬虫的主要工作,是对网页进行抓取(下载),然后对网页内包含或隐藏的数据进行提取或识别,整理为搜索引擎接受的格式或数据结构,供搜索引擎建立索引。由于网络爬虫具有对网页内的数据进行提取与识别的功能,因此也经常用于收集网站内容。
另一方面,作为拥有数据的网站,从网站发展战略的角度出发,未必希望自己的数据被大量收集,特别是当某些信息具有同行业内的竞争价值时,这些网站就面临着对信息进行保护,以防止被同行业使用网络爬虫大量抓取的技术需求。
其中,在各种类别的信息中,数字信息作用往往较为关键。以口碑网(www.koubei.com)为例,店铺相关信息包括“店名”、“地址”、“电话”、“评论”等等,其中,电话信息是相当一部分用户关注的目标,并且还有其他一些基于电话信息的数据质量保证的应用,如利用电话号码确定所有人或企业的地理位置、作为纠错与地理位置推演的依据等等。可见,一条准确的电话号码信息,对数据的质量与有效性的贡献很大,相反,即便其他方面的信息比较完整,但唯独缺少电话信息,也会显得数据本身的完整性缺失比较明显;因此,对于数字信息的保护也尤其重要。
数字信息本质上是由***数字组成的文本字符串,现有技术中比较常用的保护措施是将数字文本转换成图像在网页上展现,一般用户往往不会关注信息到底是文本还是图像,因此这种方式并不会影响用户的阅读,但是对于一般的网络爬虫而言,只能够从网页上直接获取图像却无法自动识别其中的文本信息,从而大大提高了网络爬虫获取信息的难度,起到了信息保护的作用。
然而随着OCR(Optical Character Recognition,光学字符识别)等图像识别技术的发展,越来越多的网络爬虫也集成了图像识别功能,可以从图像中识别出文本信息。只是单纯地将数字信息转换为图像已经难以实现信息保护的效果
发明内容
为解决上述技术问题,本申请实施例提供一种网页数字信息的保护方法及***,以提高数字信息的抗识别能力,技术方案如下:
一种网页数字信息保护方法,包括:
将数字信息文本转换为图像,所述数字信息包含的数字字符个数N≥2;
将所述图像分割为n个矩形区域,每个矩形区域中包括至少一个数字字符的图像,其中2≤n≤N;
对每个矩形区域分别进行随机几何形变;
组合所有形变后的区域得到变形图像,所述变形图像用于在网页发布。
一种网页数字信息保护***,包括:
信息转换单元,用于将数字信息文本转换为图像,所述数字信息包含的数字字符个数N≥2;
分割单元,用于将所述图像分割为n个矩形区域,每个矩形区域中包括至少一个数字字符的图像,其中2≤n≤N;
形变单元,用于对每个矩形区域分别进行随机几何形变;
组合单元,用于组合所有形变后的区域得到变形图像,所述变形图像用于在网页发布。
本申请实施例提供的技术方案,将数字信息文本转换为图像之后,进一步按照数字分布将图像分割为若干矩形区域,然后分别对每个矩形区域进行随机几何形变,形变后的图像可用于网页上发布,从而对网络爬虫的图像识别功能产生干扰效果。此外,对于提供数据的网页而言,对多个区域进行几何形变的计算开销与对整个图像进行几何形变的计算开销基本相当;但是对于识别者而言,由于每个区域使用的变换函数都不相同,破解难度将成倍增加。而采用随机几何形变的方式,可以使得每次刷新网页时都使用不同的变换函数,进一步增加了破解难度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例对图像进行几何形变的示意图;
图2a和图2b为本申请实施例对图像进行校正的示意图;
图3为本申请实施例一种网页数字信息保护方法的流程图;
图4为本申请实施例对图像进行区域分割的示意图;
图5为本申请实施例对矩形区域进行随机几何形变的方法流程图;
图6为本申请实施例对矩形区域取顶点的示意图;
图7为本申请实施例对矩形区域顶点进行坐标随机变换的示意图;
图8为本申请实施例从矩形区域变换为四边形区域的示意图;
图9为本申请实施例从矩形区域变换为四边形区域的另一种示意图;
图10为本申请实施例网页数字信息保护***的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请保护的范围。
为了应对OCR等图像识别技术,可以采取对图像进行几何形变的方法,例如,对图像进行扭曲、缩放和/或旋转等操作,从而对图像识别产生干扰效果。如图1所示,含有数字序列信息123456的原始图像为标准的矩形,通过形变将矩形转换为如图1右侧所示的形状。对提供数据的网页而言,对图像做几何变换,仅仅是套用一定的公式,但对于识别者而言,由于并不知道准确的变换公式,因此识别的难度也相应增加。
当然,针对上述几何形变的信息保护方法,识别者也可以通过一定的手段对形变后的图像校正后再进行识别,如图2a所示,首先,通过像素分布情况,可以找图2a左侧图像中包围数字信息的边界,那么,校正的目标是,将图2a左侧的不规则边界转换到一个如图2a右侧所示的矩形。可以假设存在以下的线性变换公式,能够将如图2a右侧的图像转换为图2a左侧的图像:
x′=f(x,y)=a1x3+a2y3+a3x2y+…+ak-2x+ak-1y+ak
y′=g(x,y)=b1x3+b2y3+b3x2y+…+bk-2x+bk-1y+bk
上式中,其中,(x,y)是图2a右侧的像素点坐标,(x′,y′)是像素点在图2a左侧对应的坐标,参数{a}与{b}是两组常数。如图2b所示,通过在图中选取一些采样点解确定常数{a}与{b},也就得到了图像的变换关系。
上式中,假设线性变换的最高幂次为3,如果在保护时采用了更高幂次的变换公式,则无法成功拟合变换公式,当然,在假设变换公式时,也可以选择更高的幂次,这样需要求解的常数{a}与{b}的数量也会相应增加,并且需要更多的采样点。但是真正可靠的采样点个数也是有限的(一般位于图像的边、角等特殊位置),因此上述根据采样点拟合变换公式的方法仅适用于幂次较低的变换。
可见,对于提供数据的网页而言,采用幂次越高的变换公式,则对信息的保护效果越好。但是由于信息最终是要展示在网页上的,为了不影响展示速度,必须要考虑信息保护的处理效率。对图像的进行几何形变,需要对图像中每一个像素点都进行运算,当网页需要展现多条数字信息时(例如电话号码的list页),计算量是相当大的,因此在几何形变的变换公式也多采用线性公式,并且线性变换的最高幂次也不宜过大,在实际应用中,采用3次或4次的变换函数已经需要很大的计算开销了。
综上所述,采用上述几何形变的信息保护方法,存在计算复杂度与被识别难度的矛盾,追求识别难度时,计算复杂度加大,可能无法满足网页展现数据的性能要求;追求性能时,过于简单的变换又容易被破解。
在本申请的另一个实施例中,提供一种网页数字信息保护方法,能够以较低的计算开销实现较好的抗识别效果,参见图3所示,该方法包括以下基本步骤
S101,将数字信息文本转换为图像;
将文本转换为图像,在现有技术中有多种实现方式,本实施例对此不作详细说明。
S102,将所述图像分割为n个矩形区域;
首先根据数字字符将图像划分为若干矩形区域,参见图4所示,含有数字信息“123”图像按照字符被分割为3个矩形区域。
本申请所提供的方案,是将一幅完整图像分割成若干区域分别进行几何形变处理,并且,为了保证形变后的图像不影响普通用户的阅读,每个矩形区域中应保证包括至少一个完整数字字符的图像。因此,仅当要保护的数字信息包含的数字字符个数N≥2时,对图像的分割操作才有意义,并且,分割出的矩形数目n应满足2≤n≤N。当然,可以理解的是,每个矩形中所包括的完整数字字符个数也并不一定是相同的,例如数字信息“123”可以按照“12”、“3”进行分割,也可以按照“1”、“23”进行分割,这些都不影响本实施例技术方案的实现。
S103,对每个矩形区域分别进行随机几何形变;
在图像处理领域,常用的几何形变包括扭曲、缩放、旋转等等,当然也包括对上述操作的联用。本实施例方案中,分别对每个矩形区域进行随机几何形变。在具体实施时,对各个矩形区域可以采用一致的形变方案,例如,分别对每个矩形区域进行随机幅度的缩放;也可以对各个矩形区域分别采用不用的形变方案,例如,对矩形区域1采用扭曲形变方案,对矩形区域2采用缩放形变方案……等等,这些并不影响本实施例方案的实现。
S104,组合所有形变后的区域得到变形图像;
对每个矩形区域分别进行随机几何形变之后,按照原始数字信息中的数字排列顺序,对所有形变后的区域进行组合。组合后得到的图像,即可用于在网页中发布。
上述方案中,将数字信息文本转换为图像之后,进一步按照数字分布将图像分割为若干矩形区域,然后分别对每个矩形区域进行随机几何形变。由于对图像进行几何形变的实质是对图像的每个像素点做一次函数变换运算,因此,对于提供数据的网页而言,对多个区域进行几何形变的计算开销与对整个图像进行几何形变的计算开销基本相当;但是对于识别者而言,由于每个区域使用的变换函数都不相同,破解难度将成倍增加。而采用随机几何形变的方式,可以使得每次刷新网页时都产生不同的变换函数,进一步增加了破解难度。
以电话号码为例,一般的电话号码位数都在8位以上,如果将每一个数字分割为一个矩形区域进行变换,那么对于识别者而言,需要将这8个以上的变换函数全部破解,才能得到一条电话号码信息。
事实上,当数字信息所包含的数字字符较多时,由于每个区域所使用的变换函数都不相同,因此仅对每个区域使用较为简单的变换函数就可以达到很好的抗识别效果。在本申请的另一个实施例中,针对上述步骤S103,具体给出了一种将矩形区域随机变换为不规则四边形区域的方案,参见图5所示,该方法包括以下步骤:
S103a,对矩形区域4个顶点像素点的坐标值进行随机变换;
参见图6所示,首先标出各个矩形区域的顶点像素点,在本实施例中,由于所划分的矩形区域是连续的,因此相邻的矩形区域共用两个顶点。
针对所标出的每一个顶点像素点,分别对其坐标值进行做一定横竖范围内的随机变换,以产生扰动效果,坐标变换的范围将对最终变换图像的视觉效果产生影响,可以根据实际图像的大小进行设置,例如:将横、纵向坐标的变换范围分别设置为不大于矩形区域的宽、高的1/4。图7为对矩形区域顶点进行随机坐标变换的一种示意图。
S103b,根据4个顶点像素点变换前后的坐标值,得到矩形区域与四边形区域的变换函数;
如图8所示,几何形变的目的,就是将图8左侧所示的每个矩形区域,分别变换为图8右侧所示的四边形区域,一般来说,经过坐标随机变换以后的顶点所构成的四边形区域是不规则的,虽然理论上也存在变换后的四边形区域为矩形、平行四边形的可能,但是这并不影响本实施例方案的实现。
参见图9所示,对于任意一个矩形区域,其变换是一个二维线性变换,可以假设该变换的函数形式为:
x′=f(x,y)=a1x+a2y+a3xy+a4
y′=g(x,y)=b1x+b2y+b3xy+b4
其中,(x,y)对应四边形区域的像素点坐标,(x’,y’)对应矩形区域的像素点坐标;通过将4个顶点像素点变换前后的坐标值分别代入上式,可以求解得到系数值a1、a2、a3、a4以及b1、b2、b3、b4,进而也就得到了一组确定的四边形区域与矩形区域之间的变换关系。
S103c,根据所述变换函数,确定所述四边形区域内像素点的颜色特征值。
参见图9所示,要将矩形区域变换为四边形区域,实际上需要求得四边形区域内每个像素点的颜色特征值,本实施例所采用的方法是:
根据变换函数,求得四边形区域内的坐标值为(x0,y0)的像素点在原始矩形区域内的对应的坐标值(x0’,y0’),则矩形区域内坐标值为(x0’,y0’)像素点的颜色特征值即为四边形区域内的坐标值为(x0,y0)的像素点的颜色特征值。应用以上方法,依次求得四边形区域内每个像素点的颜色特征值后,即可完成四边形区域的绘制。
当然,在实际应用中,根据函数计算出的(x0’,y0’)可能不是整数,即无法对应到原始矩形区域中的某个实际存在的像素点,这种情况下,可以根据计算出的(x0’,y0’),使用插值法得到(x0,y0)的颜色特征值。其中,插值法可以采用最邻近插值、线性插值等方式,本实施例对此并不进行限定。特别是当数字信息仅采用黑白二值展现时,使用哪种具体的插值法对视觉效果的影响差别都不大,因此可以选择计算量较小的最邻近插值算法。
本实施例所提供的方案中,对每个矩形区域使用的仅是2次幂的线性变换函数,因此图像计算量很少,与对图像整体进行2次幂线性变换的计算量基本相当,但是对于识别者而言,由于每个区域使用的变换函数都不相同,破解难度将成倍增加,而采用随机扰动的策略,可以使得每次刷新网页时都产生不同变换函数,进一步增加了破解难度。
此外,由于本实施例方案是逐字符的矩形区域的变换,每个矩形区域的顶点都不在字符上(都是没有内容的白色点),使得识别者无法通过像素的分布统计来获得图像的边界,由于无法探知图像的边界,因此无法找到足够的采样点,也就无法采用拟合变换公式的方式逆向进行破解。
相应于上面的方法实施例,本申请还提供一种网页数字信息保护***,参见图10所示,包括:
信息转换单元110,用于将数字信息文本转换为图像,所述数字信息包含的数字字符个数N≥2;
分割单元120,用于将所述图像分割为n个矩形区域,每个矩形区域中包括至少一个数字字符的图像,其中2≤n≤N;
形变单元130,用于对每个矩形区域分别进行随机几何形变;
组合单元140,用于组合所有形变后的区域得到变形图像,所述变形图像用于在网页发布。
其中,所述形变单元130具体可以用于将每个矩形区域随机变换为四边形区域。所述形变单元130可以包括:
顶点变换子单元,用于对矩形区域4个顶点像素点的坐标值进行随机变换;
变换函数获得子单元,用于根据4个顶点像素点变换前后的坐标值,得到矩形区域与四边形区域的变换函数;
像素值确定子单元,用于根据所述变换函数,确定所述四边形区域内像素点的颜色特征值。
所述变换函数获得子单元,将4个顶点像素点变换前后的坐标值分别代入预设的变换函数表达式:
x′=f(x,y)=a1x+a2y+a3xy+a4
y′=g(x,y)=b1x+b2y+b3xy+b4
得到系数a1、a2、a3、a4以及b1、b2、b3、b4的值;
其中,(x,y)对应四边形区域的像素点坐标,(x’y’)对应矩形区域的像素点坐标。
所述像素点变换子单元可以包括:
计算模块,用于利用所述变换函数,计算得到四边形区域内像素点在矩形区域内的对应坐标值;
特征值确定模块,用于根据计算得到的坐标值,使用插值法确定该像素点的颜色特征值。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (8)

1.一种网页数字信息保护方法,其特征在于,包括:
将数字信息文本转换为图像,所述数字信息包含的数字字符个数N≥2;
将所述图像分割为n个矩形区域,每个矩形区域中包括至少一个数字字符的图像,其中2≤n≤N,相邻的矩形区域共用两个顶点;
对每个矩形区域分别进行随机几何形变;
组合所有形变后的区域得到变形图像,所述变形图像用于在网页发布;
所述对矩形区域进行随机几何形变包括:
将矩形区域随机变换为四边形区域,所述四边形区域为与所述矩形区域不相同的四边形区域。
2.根据权利要求1所述的方法,其特征在于,所述将矩形区域随机变换为四边形区域包括:
对矩形区域4个顶点像素点的坐标值进行随机变换;
根据4个顶点像素点变换前后的坐标值,得到矩形区域与四边形区域的变换函数;
根据所述变换函数,确定所述四边形区域内像素点的颜色特征值。
3.根据权利要求2所述的方法,其特征在于,所述根据4个顶点像素点变换前后的坐标值,得到矩形区域与四边形区域的变换函数,包括:
设四边形区域与矩形区域的变换函数形式为:
x′=f(x,y)=a1x+a2y+a3xy+a4
y′=g(x,y)=b1x+b2y+b3xy+b4
其中,(x,y)对应四边形区域的像素点坐标,(x’,y’)对应矩形区域的像素点坐标;
将4个顶点像素点变换前后的坐标值分别代入上式,得到系数a1、a2、a3、a4以及b1、b2、b3、b4的值。
4.根据权利要求3所述的方法,其特征在于,所述根据变换函数,确定四边形区域内像素点的颜色特征值,包括:
利用所述变换函数,计算得到四边形区域内像素点在矩形区域内的对应坐标值;
根据计算得到的坐标值,使用插值法确定该像素点的颜色特征值。
5.一种网页数字信息保护***,其特征在于,包括:
信息转换单元,用于将数字信息文本转换为图像,所述数字信息包含的数字字符个数N≥2;
分割单元,用于将所述图像分割为n个矩形区域,每个矩形区域中包括至少一个数字字符的图像,其中2≤n≤N,相邻的矩形区域共用两个顶点;
形变单元,用于对每个矩形区域分别进行随机几何形变;
组合单元,用于组合所有形变后的区域得到变形图像,所述变形图像用于在网页发布;
所述形变单元用于将每个矩形区域随机变换为四边形区域,所述四边形区域为与所述矩形区域不相同的四边形区域。
6.根据权利要求5所述的***,其特征在于,所述形变单元包括:
顶点变换子单元,用于对矩形区域4个顶点像素点的坐标值进行随机变换;
变换函数获得子单元,用于根据4个顶点像素点变换前后的坐标值,得到矩形区域与四边形区域的变换函数;
像素值确定子单元,用于根据所述变换函数,确定所述四边形区域内像素点的颜色特征值。
7.根据权利要求6所述的***,其特征在于,所述变换函数获得子单元,
将4个顶点像素点变换前后的坐标值分别代入预设的变换函数表达式:
x′=f(x,y)=a1x+a2y+a3xy+a4
y′=g(x,y)=b1x+b2y+b3xy+b4
得到系数a1、a2、a3、a4以及b1、b2、b3、b4的值;
其中,(x,y)对应四边形区域的像素点坐标,(x’,y’)对应矩形区域的像素点坐标。
8.根据权利要求7所述的***,其特征在于,所述像素值确定子单元,包括:
计算模块,用于利用所述变换函数,计算得到四边形区域内像素点在矩形区域内的对应坐标值;
特征值确定模块,用于根据计算得到的坐标值,使用插值法确定该像素点的颜色特征值。
CN201010240246.8A 2010-07-28 2010-07-28 一种网页数字信息的保护方法及*** Active CN102346736B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201010240246.8A CN102346736B (zh) 2010-07-28 2010-07-28 一种网页数字信息的保护方法及***
HK12104212A HK1163855A1 (zh) 2010-07-28 2012-04-28 種網頁數字信息的保護方法及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010240246.8A CN102346736B (zh) 2010-07-28 2010-07-28 一种网页数字信息的保护方法及***

Publications (2)

Publication Number Publication Date
CN102346736A CN102346736A (zh) 2012-02-08
CN102346736B true CN102346736B (zh) 2014-04-09

Family

ID=45545422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010240246.8A Active CN102346736B (zh) 2010-07-28 2010-07-28 一种网页数字信息的保护方法及***

Country Status (2)

Country Link
CN (1) CN102346736B (zh)
HK (1) HK1163855A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595583B (zh) * 2018-04-18 2022-12-02 平安科技(深圳)有限公司 动态图表类页面数据爬取方法、装置、终端及存储介质
CN111339548B (zh) * 2018-12-18 2023-11-03 北京京东尚科信息技术有限公司 反爬虫的数据处理方法、装置、计算机设备及存储介质
CN111666515B (zh) * 2019-03-07 2024-04-26 深圳市茁壮网络股份有限公司 页面元素变换方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197678B (zh) * 2007-12-27 2011-04-06 腾讯科技(深圳)有限公司 图片验证码生成方法和图片验证码生成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458770A (zh) * 2008-12-24 2009-06-17 北京文通科技有限公司 一种文字识别的方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Web验证码的生成与识别;李颖;《中国优秀硕士学位论文全文数据库信息科技辑》;20090115(第1期);第26-41页 *
李颖.Web验证码的生成与识别.《中国优秀硕士学位论文全文数据库信息科技辑》.2009,(第1期),第26-41页.

Also Published As

Publication number Publication date
CN102346736A (zh) 2012-02-08
HK1163855A1 (zh) 2012-09-14

Similar Documents

Publication Publication Date Title
CN101923702B (zh) 一种图片验证码的生成方法
EP2536122B1 (en) Image processing method, image processing device and scanner
JP5845728B2 (ja) コンテンツ・プライバシー保護のためのマイクロタスクを生成する技術
CN101727580B (zh) 图像处理装置、图像处理单元和图像处理方法
CN107944324A (zh) 一种二维码畸变校正方法及装置
US20130194272A1 (en) Placing pixels according to attribute values in positions in a graphical visualization that correspond to geographic locations
CN107870911B (zh) 一种数据可视化展示方法和设备
CN102346736B (zh) 一种网页数字信息的保护方法及***
US20130035081A1 (en) Semantic magazine pages
Chen et al. Screen-Cam robust image watermarking with feature-based synchronization
WO2022127384A1 (zh) 文字识别方法、电子设备和计算机可读存储介质
CN108268258A (zh) 一种用于获取网页代码的方法、装置及电子设备
CN113506305A (zh) 三维点云数据的图像增强方法、语义分割方法及装置
CN112991274A (zh) 一种人群计数方法、装置、计算机设备及存储介质
Hou et al. Scanned binary image watermarking based on additive model and sampling
Wang et al. Image authentication based on perceptual hash using Gabor filters
Hwang et al. A method of identifying digital images with geometric distortion
CN112287325A (zh) 操作验证方法、装置和存储介质及电子装置
CN110544073A (zh) 出入境信息获取方法、装置及终端设备
Zhou et al. Improved single image super-resolution based on edge directed interpolation
KR101064683B1 (ko) 휴대용 전자지도 장치
Wang et al. A fast mosaic method for airborne images: the new Template-Convolution Speed-Up Robust Features (TSURF) algorithm
Vasudevan et al. A basic study of image processing and its application areas
CN103778398A (zh) 图像模糊度估计方法
She et al. Local terrain modification method considering physical feature constraints for vector elements

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1163855

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1163855

Country of ref document: HK