CN117290845A - 网页篡改的检测方法、装置及计算机可读存储介质 - Google Patents

网页篡改的检测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN117290845A
CN117290845A CN202311590921.3A CN202311590921A CN117290845A CN 117290845 A CN117290845 A CN 117290845A CN 202311590921 A CN202311590921 A CN 202311590921A CN 117290845 A CN117290845 A CN 117290845A
Authority
CN
China
Prior art keywords
page
image
comparison result
dynamic
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311590921.3A
Other languages
English (en)
Inventor
马丽
赵磊
刘百川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cctv International Network Co ltd
Original Assignee
Cctv International Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cctv International Network Co ltd filed Critical Cctv International Network Co ltd
Priority to CN202311590921.3A priority Critical patent/CN117290845A/zh
Publication of CN117290845A publication Critical patent/CN117290845A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/562Static detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Virology (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种网页篡改的检测方法、装置及计算机可读存储介质。该方法包括:获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,其中,第一图像集合和第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成;依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果;依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果;依据第一比对结果和第二比对结果确定目标网页是否被篡改。本发明解决了相关技术中进行网页防篡改检测时,存在占用***资源多的技术问题。

Description

网页篡改的检测方法、装置及计算机可读存储介质
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页篡改的检测方法、装置及计算机可读存储介质。
背景技术
随着互联网的快速发展,网站的重要性越来越突出。目前,常有网络攻击者通过篡改网站内容、破坏网站***、盗取网站信息等手段对网站进行攻击,从而对网站运营造成重大损失。篡改网站内容是攻击者常用的攻击方法之一,因此,如何有效地保护网站安全,防止网站被篡改,成为了互联网安全领域的一个重要问题。
目前,在相关技术中,通常使用云平台、区块链、多模块等高资源占用的方法进行网页篡改的检测,从而存在占用***资源多的问题,无法在海量的终端上运行,很容易被攻击者绕过,进而影响网站的安全防护。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种网页篡改的检测方法、装置及计算机可读存储介质,以至少解决相关技术中进行网页防篡改检测时,存在占用***资源多的技术问题。
根据本发明实施例的一个方面,提供了一种网页篡改的检测方法,包括:获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,其中,第一图像集合和第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成;依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果;依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果;依据第一比对结果和第二比对结果确定目标网页是否被篡改。
进一步地,网页篡改的检测方法还包括:对规范页面进行多次图像截取,得到多个规范页面图像;从任意一张规范页面图像中提取属于规范页面的静态区域的图像,得到第一图像;对于规范页面的每个动态区域,从多个规范页面图像中提取属于动态区域的图像,得到动态区域匹配的多个第二图像;由第一图像和所有动态区域匹配的第二图像组成第一图像集合。
进一步地,网页篡改的检测方法还包括:对真实页面进行多次图像截取,得到多个真实页面图像;从任意一张真实页面图像中提取属于真实页面的静态区域的图像,得到第三图像;对于真实页面的每个动态区域,从多个真实页面图像中提取属于动态区域的图像,得到动态区域匹配的多个第四图像;由第三图像和所有动态区域匹配的第四图像组成第二图像集合。
进一步地,网页篡改的检测方法还包括:对第一图像和第三图像中处于相同位置的像素的像素值进行比对,得到每个位置对应的第一子比对结果;依据所有第一子比对结果确定第一比对结果,其中,第一比对结果用于表征规范页面的静态区域和真实页面的静态区域是否相同。
进一步地,网页篡改的检测方法还包括:对于真实页面的每个动态区域,从规范页面的动态区域中确定与真实页面的动态区域匹配的目标动态区域;对于真实页面的动态区域匹配的每个第四图像,将目标动态区域匹配的每个第二图像与第四图像进行比对,得到每个第二图像与第四图像之间的第二子比对结果;依据所有第四图像的第二子比对结果确定第二比对结果。
进一步地,网页篡改的检测方法还包括:对于每个第四图像,判断第四图像的第二子比对结果中是否存在目标子比对结果,其中,目标子比对结果表征第四图像与第二图像相同;在所有第四图像均存在对应的目标子比对结果的情况下,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域相同;在存在第四图像不存在对应的目标子比对结果的情况下,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域不同。
进一步地,网页篡改的检测方法还包括:若第一比对结果表征规范页面的静态区域和真实页面的静态区域相同,并且第二比对结果表征规范页面的动态区域和真实页面的动态区域相同,则确定目标网页未被篡改;若第一比对结果表征规范页面的静态区域和真实页面的静态区域不同,或者第二比对结果表征规范页面的动态区域和真实页面的动态区域不同,则确定目标网页被篡改。
进一步地,网页篡改的检测方法还包括:在依据第一比对结果和第二比对结果确定目标网页是否被篡改之后,在目标时间点与参考时间点之间的时间间隔达到预设值的情况下,获取目标网页的真实页面的新的第二图像集合,其中,参考时间点是指获取第二图像集合的时间点;依据新的第二图像集合和第一图像集合确定目标网页是否被篡改。
根据本发明实施例的另一方面,还提供了一种网页篡改的检测装置,包括:第一获取模块,用于获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,其中,第一图像集合和第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成;第一比对模块,用于依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果;第二比对模块,用于依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果;第一确定模块,用于依据第一比对结果和第二比对结果确定目标网页是否被篡改。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的网页篡改的检测方法。
在本发明实施例中,采用依据页面图像对规范页面和真实页面的动态区域和静态区域进行比对,以确定网页是否被篡改的方式,通过获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,然后依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果,并依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果,从而依据第一比对结果和第二比对结果确定目标网页是否被篡改。
在上述过程中,通过获取第一图像集合和第二图像集合,并依据第一图像集合和第二图像集合确定目标网页是否被篡改,使得本申请涉及的算力只有图像比对,涉及的存储内容只有页面图像,从而只需占用相对较少的存储空间和***资源,便于部署在任意多个网络终端,形成多终端检测。此外,通过依据图像比对的方式确定目标网页是否被篡改,提高了对网页篡改检测的准确性,避免了依据页面元素进行判断时,页面元素所表征的信息可能与页面的实际内容存在差异,从而容易存在漏检测、误检测的现象。
由此可见,本申请所提供的方案达到了依据页面图像对规范页面和真实页面的动态区域和静态区域进行比对,以确定网页是否被篡改的目的,从而实现了减少占用的***资源的技术效果,进而解决了相关技术中进行网页防篡改检测时,存在占用***资源多的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的网页篡改的检测方法的流程图一;
图2是根据本发明实施例的一种可选的网页篡改的检测方法的流程图二;
图3是根据本发明实施例的一种可选的网页篡改的检测装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
实施例1
根据本发明实施例,提供了一种网页篡改的检测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的网页篡改的检测方法的流程图一,如图1所示,该方法包括如下步骤:
步骤S101,获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,其中,第一图像集合和第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成。
可选的,可以将电子设备、应用***、服务器等装置作为本申请的执行主体。在本实施例中,将目标检测***作为执行主体以获取上述的第一图像集合和第二图像集合。
其中,在一种可选的应用场景中,目标检测***可以应用于目标机构的各个终端上,目标网页可以是目标机构所开发的,目标检测***通过对目标网页是否被篡改进行检测,以保证目标机构中的工作人员访问目标网页时的安全性。可选的,规范页面可以是相关工作人员预先指定的,第一图像集合可以包含与规范页面的静态区域匹配的第一图像以及与规范页面的各个动态区域匹配的多个第二图像,第二图像集合可以包含与真实页面的静态区域匹配的第三图像以及与真实页面的各个动态区域匹配的多个第四图像。其中,规范页面的同一动态区域匹配的多个第二图像中不同的第二图像属于不同的图像帧,真实页面的同一动态区域匹配的多个第四图像中不同的第四图像属于不同的图像帧。
步骤S102,依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果。
可选的,目标检测***可以对第一图像集合和第二图像集合中与静态区域匹配的图像进行比对,也即对上述的第一图像和第三图像进行比对,得到第一比对结果。其中,第一比对结果至少用于表征规范页面的静态区域和真实页面的静态区域是否相同,第一比对结果可以包含规范页面的静态区域和真实页面的静态区域之间的差异信息,差异信息可以用于指示像素值不同的像素位置。
例如,目标检测***可以将第一图像和第三图像输入至预先训练好的图像处理模型,然后通过图像处理模型对第一图像和第三图像进行比对,从而得到第一比对结果。又例如,目标检测***也可以将第一图像和第三图像中处于相同位置的像素的像素值进行比对,从而依据各个位置的像素值的比对结果确定第一比对结果。
步骤S103,依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果。
可选的,目标检测***可以对第一图像集合和第二图像集合中与动态区域匹配的图像进行比对,也即对上述的第二图像和第四图像进行比对,得到第二比对结果。其中,第二比对结果至少用于表征规范页面的动态区域和真实页面的动态区域是否相同。第二比对结果可以包含规范页面的动态区域和真实页面的动态区域之间的差异信息。
例如,对于每个第四图像,目标检测***可以将该第四图像与所有的第二图像进行比对,然后依据所有第四图像对应的比对结果,确定第二比对结果。又例如,对于每个第四图像,目标检测***可以先从所有第二图像中筛选出该第四图像所属的动态区域所对应的第二图像,然后将该第四图像与筛选出的每个第二图像进行比对,从而依据所有第四图像对应的比对结果,确定第二比对结果。
可选的,在确定第二比对结果的过程中,可以在根据比对结果确定每个第四图像都能找到与其相同的第二图像的情况下,确定规范页面的动态区域和真实页面的动态区域相同,在根据比对结果确定存在第四图像无法找到与其相同的第二图像的情况下,确定规范页面的动态区域和真实页面的动态区域不同。
步骤S104,依据第一比对结果和第二比对结果确定目标网页是否被篡改。
例如,在依据第一比对结果和第二比对结果确定规范页面的静态区域、动态区域分别与真实页面的静态区域、动态区域相同的情况下,确定目标网页未被篡改,反之,确定目标网页被篡改。
又例如,在依据第一比对结果确定规范页面的静态区域和真实页面的静态区域之间的差异信息的信息内容属于预设的可忽略内容的情况下,确定目标网页未被篡改,反之,确定目标网页被篡改。
可选的,在确定目标网页被篡改之后,目标检测***可以产生页面篡改告警信号通知网站管控人员,以便及时维护目标网页的安全。
基于上述步骤S101至步骤S104所限定的方案,可以获知,在本发明实施例中,采用依据页面图像对规范页面和真实页面的动态区域和静态区域进行比对,以确定网页是否被篡改的方式,通过获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,然后依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果,并依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果,从而依据第一比对结果和第二比对结果确定目标网页是否被篡改。
在上述过程中,通过获取第一图像集合和第二图像集合,并依据第一图像集合和第二图像集合确定目标网页是否被篡改,使得本申请涉及的算力只有图像比对,涉及的存储内容只有页面图像,从而只需占用相对较少的存储空间和***资源,便于部署在任意多个网络终端,形成多终端检测。此外,通过依据图像比对的方式确定目标网页是否被篡改,提高了对网页篡改检测的准确性,避免了依据页面元素进行判断时,页面元素所表征的信息可能与页面的实际内容存在差异,从而容易存在漏检测、误检测的现象。
由此可见,本申请所提供的方案达到了依据页面图像对规范页面和真实页面的动态区域和静态区域进行比对,以确定网页是否被篡改的目的,从而实现了减少占用的***资源的技术效果,进而解决了相关技术中进行网页防篡改检测时,存在占用***资源多的技术问题。
在一种可选的实施例中,在获取目标网页的规范页面的第一图像集合的过程中,目标检测***可以对规范页面进行多次图像截取,得到多个规范页面图像从任意一张规范页面图像中提取属于规范页面的静态区域的图像,得到第一图像,对于规范页面的每个动态区域,从多个规范页面图像中提取属于动态区域的图像,得到动态区域匹配的多个第二图像,从而由第一图像和所有动态区域匹配的第二图像组成第一图像集合。
可选的,目标检测***可以利用截图工具对规范页面进行多次图像截取,得到多个规范页面图像。其中,在规范页面因为过大而无法完整显示在显示窗口的情况下,截图工具可以采用滚动截屏的方式以截取完整的规范页面。此外,前述的多次图像截取的截取方式可以是按预设频率截取,例如,每秒截取一次。
可选的,为保证在多次图像截取的过程中,能够有效截取到规范页面的各动态区域的所有图像,目标检测***可以将预设频率设置的相对较小,并在每次截图后将得到的规范页面图像与第一张规范页面图像中的图像进行比对,直至得到的规范页面图像与第一张规范页面图像相同,并且得到的规范页面图像与第一张规范页面图像之间存在目标规范页面图像的情况下,确定不再对规范页面进行图像截取。其中,目标规范页面图像是指与第一张规范页面图像不同的规范页面图像。可选的,目标检测***也可以获取人工预先设置的截取次数和频率,并依据该截取次数和频率截取得到多个规范页面图像。
可选的,当得到多个规范页面图像之后,由于规范页面的静态区域的内容始终保持不变,因此,目标检测***可以从任意一张规范页面图像中提取属于规范页面的静态区域的图像,得到第一图像。更进一步地,由于规范页面的动态区域的内容始终在变动,因此,对于规范页面的每个动态区域,目标图像可以从每个规范页面图像中提取属于该动态区域的图像,得到该动态区域匹配的多个第二图像。其中,规范页面的同一动态区域匹配的多个第二图像中不同的第二图像属于不同的图像帧。
其中,规范页面的静态区域和动态区域可以是预先标注好的,目标检测***可以依据静态区域匹配的坐标信息对规范页面图像进行提取,得到第一图像,并依据动态区域匹配的坐标信息对规范页面图像进行提取,得到第二图像。其中,坐标信息可以包含对应的静态区域或动态区域的各个顶点坐标值。
需要说明的是,通过从规范页面图像中提取出第一图像和第二图像,实现了对规范页面的静态区域、动态区域中的内容的有效区分,从而便于后续得到准确的第一比对结果和第二比对结果。
在一种可选的实施例中,在获取目标网页的真实页面的第二图像集合的过程中,目标检测***可以对真实页面进行多次图像截取,得到多个真实页面图像,然后从任意一张真实页面图像中提取属于真实页面的静态区域的图像,得到第三图像,对于真实页面的每个动态区域,从多个真实页面图像中提取属于动态区域的图像,得到动态区域匹配的多个第四图像,从而由第三图像和所有动态区域匹配的第四图像组成第二图像集合。
可选的,目标检测***可以利用截图工具对真实页面进行多次图像截取,得到多个真实页面图像。其中,在对真实页面进行截取之前,目标检测***可以判断真实页面的页面分辨率和规范页面的页面分辨率是否相同,从而在不相同的情况下,将真实页面的页面分辨率先调整至与规范页面的页面分辨率相同,再进行图像截取。在真实页面因为过大而无法完整显示在显示窗口的情况下,截图工具可以采用滚动截屏的方式以截取完整的真实页面。此外,前述的多次图像截取的截取方式可以是按预设频率截取,例如,每秒截取一次。
可选的,为保证在多次图像截取的过程中,能够有效截取到真实页面的各动态区域的所有图像,目标检测***可以将预设频率设置的相对较小,并在每次截图后将得到的真实页面图像与第一张真实页面图像中的图像进行比对,直至得到的真实页面图像与第一张真实页面图像相同,并且得到的真实页面图像与第一张真实页面图像之间存在目标真实页面图像的情况下,确定不再对真实页面进行图像截取。其中,目标真实页面图像是指与第一张真实页面图像不同的真实页面图像。可选的,目标检测***也可以直接按照截图多个规范页面图像的方式,截图得到多个真实页面图像。
可选的,当得到多个真实页面图像之后,由于真实页面的静态区域的内容始终保持不变,因此,目标检测***可以从任意一张真实页面图像中提取属于真实页面的静态区域的图像,得到第三图像。更进一步地,由于真实页面的动态区域的内容始终在变动,因此,对于真实页面的每个动态区域,目标图像可以从每个真实页面图像中提取属于该动态区域的图像,得到该动态区域匹配的多个第四图像。其中,真实页面的同一动态区域匹配的多个第四图像中不同的第四图像属于不同的图像帧。
其中,可以将规范页面中的静态区域匹配的坐标信息确定为真实页面中的静态区域匹配的坐标信息,并将规范页面中的动态区域匹配的坐标信息确定为真实页面中的动态区域匹配的坐标信息,从而依据坐标信息提取得到第三图像和第四图像。
需要说明的是,通过从真实页面图像中提取出第三图像和第四图像,实现了对真实页面的静态区域、动态区域中的内容的有效区分,从而便于后续得到准确的第一比对结果和第二比对结果。
在一种可选的实施例中,第一图像集合包括与规范页面的静态区域匹配的第一图像,第二图像集合包括与真实页面的静态区域匹配的第三图像,其中,在依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果的过程中,目标检测***可以对第一图像和第三图像中处于相同位置的像素的像素值进行比对,得到每个位置对应的第一子比对结果,并依据所有第一子比对结果确定第一比对结果,其中,第一比对结果用于表征规范页面的静态区域和真实页面的静态区域是否相同。
可选的,第一子比对结果用于表征第一图像和第三图像中处于当前位置的像素的像素值是否相同。目标检测***可以在所有第一子比对结果均表征第一图像和第三图像中处于当前位置的像素的像素值相同的情况下,确定第一比对结果表征规范页面的静态区域和真实页面的静态区域相同,反之,在存在第一子比对结果表征第一图像和第三图像中处于当前位置的像素的像素值不同的情况下,确定第一比对结果表征规范页面的静态区域和真实页面的静态区域不同。
需要说明的是,通过对图像中各个位置的像素的像素值进行比对,以确定第一比对结果,实现了对第一比对结果的准确确定。
在一种可选的实施例中,第一图像集合包括与规范页面的各个动态区域匹配的多个第二图像,第二图像集合包括与真实页面的各个动态区域匹配的多个第四图像,其中,在依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果的过程中,目标检测***可以对于真实页面的每个动态区域,从规范页面的动态区域中确定与真实页面的动态区域匹配的目标动态区域,然后对于真实页面的动态区域匹配的每个第四图像,将目标动态区域匹配的每个第二图像与第四图像进行比对,得到每个第二图像与第四图像之间的第二子比对结果,从而依据所有第四图像的第二子比对结果确定第二比对结果。
可选的,对于真实页面的每个动态区域,目标检测***可以依据坐标信息,从规范页面的所有动态区域中确定与该真实页面的动态区域匹配的目标动态区域。例如,若规范页面的某一动态区域的各顶点坐标值与该真实页面的动态区域的各顶点坐标值相同,则确定规范页面的该动态区域为目标动态区域。
其中,对于真实页面的动态区域匹配的每个第四图像,该第四图像会匹配有多个第二子比对结果,且同一个第四图像匹配的不同第二子比对结果与目标动态区域中不同的第二图像对应,第二子比对结果用于表征第四图像与当前第二图像是否相同。
可选的,目标检测***可以将第四图像与第二图像中处于相同位置的像素的像素值进行比对,从而在确定第四图像与第二图像中所有相同位置的像素值均相同的情况下,确定第二子比对结果表征第四图像与当前第二图像相同,反之,在确定第四图像与第二图像中存在相同位置的像素值不同的情况下,确定第二子比对结果表征第四图像与当前第二图像不同。
可选的,目标检测***可以依据所有第四图像的第二子比对结果确定第二比对结果。
需要说明的是,通过先对规范页面的动态区域和真实页面的动态区域进行匹配,再对相匹配的两个动态区域中的图像进行比对,提高了第二比对结果的准确性,同时,避免了将第四图像与所有第二图像进行比对存在的检测效率低下的问题。
在一种可选的实施例中,在依据所有第四图像的第二子比对结果确定第二比对结果的过程中,目标检测***可以对于每个第四图像,判断第四图像的第二子比对结果中是否存在目标子比对结果,从而在所有第四图像均存在对应的目标子比对结果的情况下,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域相同,在存在第四图像不存在对应的目标子比对结果的情况下,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域不同,其中,目标子比对结果表征第四图像与第二图像相同。
可选的,在所有第四图像均存在对应的目标子比对结果的情况下,确定真实页面的所有动态区域与规范页面的所有动态区域相同,因此,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域相同。反之,在存在第四图像不存在对应的目标子比对结果的情况下,确定真实页面的动态区域与规范页面的动态区域存在不同,因此,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域不同。
需要说明的是,通过依据所有第四图像的第二子比对结果确定第二比对结果,实现了对第二比对结果的准确确定。
在一种可选的实施例中,在依据第一比对结果和第二比对结果确定目标网页是否被篡改的过程中,若第一比对结果表征规范页面的静态区域和真实页面的静态区域相同,并且第二比对结果表征规范页面的动态区域和真实页面的动态区域相同,则目标检测***可以确定目标网页未被篡改,若第一比对结果表征规范页面的静态区域和真实页面的静态区域不同,或者第二比对结果表征规范页面的动态区域和真实页面的动态区域不同,则目标检测***可以确定目标网页被篡改。
其中,通俗来讲,在依据第一比对结果和第二比对结果确定目标网页的静态区域和动态区域未被篡改的情况下,确定目标网页未被篡改,在依据第一比对结果和第二比对结果确定目标网页的静态区域或动态区域被篡改的情况下,确定目标网页被篡改。
需要说明的是,通过上述过程,实现了对目标网页是否被篡改的准确判定,从而便于提高网络安全性。
在一种可选的实施例中,在依据第一比对结果和第二比对结果确定目标网页是否被篡改之后,目标检测***可以在目标时间点与参考时间点之间的时间间隔达到预设值的情况下,获取目标网页的真实页面的新的第二图像集合,从而依据新的第二图像集合和第一图像集合确定目标网页是否被篡改。其中,参考时间点是指获取第二图像集合的时间点。
可选的,目标检测***可以定期对目标网页是否被篡改进行检测。例如,在当前时间点与参考时间点之间的时间间隔达到预设值的情况下,获取目标网页的真实页面的新的第二图像集合。其中,前述的当前时间点即为目标时间点。
可选的,目标检测***可以依据新的第二图像集合和第一图像集合确定目标网页是否被篡改,其中,该过程与上述的依据第二图像集合和第一图像集合确定目标网页是否被篡改的过程相同,故此处不再赘述。
需要说明的是,通过持续的对目标网页是否被篡改进行检测,可以更进一步地提高网络安全性。
在一种可选的实施例中,图2是根据本发明实施例的一种可选的网页篡改的检测方法的流程图二,如图2所示,目标检测***可以先对目标网页的规范页面进行图像截取,得到第一图像集合。然后开启定时器,定期执行页面图像比对。其中,如果定时器时间到,则执行后续抓取和比对,否则继续等待,直到定时器时间到。可选的,在定时器时间到达后,目标检测***可以对目标网页的真实页面进行图像截取,得到第二图像集合。之后,依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果,在第一比对结果表征规范页面的静态区域和真实页面的静态区域相同的情况下,依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果,在第二比对结果表征规范页面的动态区域和真实页面的动态区域相同的情况下,确定目标网页未被篡改,并继续等待下次定时器时间到。反之,若第一比对结果表征规范页面的静态区域和真实页面的静态区域不同,或者第二比对结果表征规范页面的动态区域和真实页面的动态区域不同,则确定目标网页被篡改,生成页面篡改告警信息,并继续等待下次定时器时间到。其中,前述的定时器也可以更换为休眠或延时函数,在该种方式下,本申请提供的方法所占用的网络带宽可以通过定时器调节,而且可以应用于分布在不同区域的多终端进行检测,从而使带宽分布在不同的网络路径上,彻底避免了带宽拥堵的可能性。
由此可见,本申请所提供的方案达到了依据页面图像对规范页面和真实页面的动态区域和静态区域进行比对,以确定网页是否被篡改的目的,从而实现了减少占用的***资源的技术效果,进而解决了相关技术中进行网页防篡改检测时,存在占用***资源多的技术问题。
实施例2
根据本发明实施例,提供了一种网页篡改的检测装置的实施例,其中,图3是根据本发明实施例的一种可选的网页篡改的检测装置的示意图,如图3所示,该装置包括:
第一获取模块301,用于获取目标网页的规范页面的第一图像集合,并获取目标网页的真实页面的第二图像集合,其中,第一图像集合和第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成;
第一比对模块302,用于依据第一图像集合和第二图像集合比对规范页面的静态区域和真实页面的静态区域,得到第一比对结果;
第二比对模块303,用于依据第一图像集合和第二图像集合比对规范页面的动态区域和真实页面的动态区域,得到第二比对结果;
第一确定模块304,用于依据第一比对结果和第二比对结果确定目标网页是否被篡改。
需要说明的是,上述第一获取模块301、第一比对模块302、第二比对模块303以及第一确定模块304对应于上述实施例中的步骤S101至步骤S104,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选的,第一获取模块301还包括:第一截取子模块,用于对规范页面进行多次图像截取,得到多个规范页面图像;第一提取子模块,用于从任意一张规范页面图像中提取属于规范页面的静态区域的图像,得到第一图像;第二提取子模块,用于对于规范页面的每个动态区域,从多个规范页面图像中提取属于动态区域的图像,得到动态区域匹配的多个第二图像;第一处理子模块,用于由第一图像和所有动态区域匹配的第二图像组成第一图像集合。
可选的,第一获取模块301还包括:第二截取子模块,用于对真实页面进行多次图像截取,得到多个真实页面图像;第三提取子模块,用于从任意一张真实页面图像中提取属于真实页面的静态区域的图像,得到第三图像;第四提取子模块,用于对于真实页面的每个动态区域,从多个真实页面图像中提取属于动态区域的图像,得到动态区域匹配的多个第四图像;第二处理子模块,用于由第三图像和所有动态区域匹配的第四图像组成第二图像集合。
可选的,第一比对模块302包括:第一比对子模块,用于对第一图像和第三图像中处于相同位置的像素的像素值进行比对,得到每个位置对应的第一子比对结果;第一确定子模块,用于依据所有第一子比对结果确定第一比对结果,其中,第一比对结果用于表征规范页面的静态区域和真实页面的静态区域是否相同。
可选的,第二比对模块303包括:第二确定子模块,用于对于真实页面的每个动态区域,从规范页面的动态区域中确定与真实页面的动态区域匹配的目标动态区域;第二比对子模块,用于对于真实页面的动态区域匹配的每个第四图像,将目标动态区域匹配的每个第二图像与第四图像进行比对,得到每个第二图像与第四图像之间的第二子比对结果;第三确定子模块,用于依据所有第四图像的第二子比对结果确定第二比对结果。
可选的,第三确定子模块还包括:判断单元,用于对于每个第四图像,判断第四图像的第二子比对结果中是否存在目标子比对结果,其中,目标子比对结果表征第四图像与第二图像相同;第一确定单元,用于在所有第四图像均存在对应的目标子比对结果的情况下,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域相同;第二确定单元,用于在存在第四图像不存在对应的目标子比对结果的情况下,确定第二比对结果表征规范页面的动态区域和真实页面的动态区域不同。
可选的,第一确定模块304还包括:第四确定子模块,用于若第一比对结果表征规范页面的静态区域和真实页面的静态区域相同,并且第二比对结果表征规范页面的动态区域和真实页面的动态区域相同,则确定目标网页未被篡改;第五确定子模块,用于若第一比对结果表征规范页面的静态区域和真实页面的静态区域不同,或者第二比对结果表征规范页面的动态区域和真实页面的动态区域不同,则确定目标网页被篡改。
可选的,网页篡改的检测装置还包括:第二获取模块,用于在目标时间点与参考时间点之间的时间间隔达到预设值的情况下,获取目标网页的真实页面的新的第二图像集合,其中,参考时间点是指获取第二图像集合的时间点;第二确定模块,用于依据新的第二图像集合和第一图像集合确定目标网页是否被篡改。
实施例3
根据本发明实施例的另一方面,还提供了计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的网页篡改的检测方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种网页篡改的检测方法,其特征在于,包括:
获取目标网页的规范页面的第一图像集合,并获取所述目标网页的真实页面的第二图像集合,其中,所述第一图像集合和所述第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成;
依据所述第一图像集合和所述第二图像集合比对所述规范页面的静态区域和所述真实页面的静态区域,得到第一比对结果;
依据所述第一图像集合和所述第二图像集合比对所述规范页面的动态区域和所述真实页面的动态区域,得到第二比对结果;
依据所述第一比对结果和所述第二比对结果确定所述目标网页是否被篡改。
2.根据权利要求1所述的方法,其特征在于,获取目标网页的规范页面的第一图像集合,包括:
对所述规范页面进行多次图像截取,得到多个规范页面图像;
从任意一张规范页面图像中提取属于所述规范页面的静态区域的图像,得到第一图像;
对于所述规范页面的每个动态区域,从所述多个规范页面图像中提取属于所述动态区域的图像,得到所述动态区域匹配的多个第二图像;
由所述第一图像和所有动态区域匹配的第二图像组成所述第一图像集合。
3.根据权利要求1所述的方法,其特征在于,获取所述目标网页的真实页面的第二图像集合,包括:
对所述真实页面进行多次图像截取,得到多个真实页面图像;
从任意一张真实页面图像中提取属于所述真实页面的静态区域的图像,得到第三图像;
对于所述真实页面的每个动态区域,从所述多个真实页面图像中提取属于所述动态区域的图像,得到所述动态区域匹配的多个第四图像;
由所述第三图像和所有动态区域匹配的第四图像组成所述第二图像集合。
4.根据权利要求1所述的方法,其特征在于,所述第一图像集合包括与所述规范页面的静态区域匹配的第一图像,所述第二图像集合包括与所述真实页面的静态区域匹配的第三图像,其中,依据所述第一图像集合和所述第二图像集合比对所述规范页面的静态区域和所述真实页面的静态区域,得到第一比对结果,包括:
对所述第一图像和所述第三图像中处于相同位置的像素的像素值进行比对,得到每个位置对应的第一子比对结果;
依据所有第一子比对结果确定所述第一比对结果,其中,所述第一比对结果用于表征所述规范页面的静态区域和所述真实页面的静态区域是否相同。
5.根据权利要求1所述的方法,其特征在于,所述第一图像集合包括与所述规范页面的各个动态区域匹配的多个第二图像,所述第二图像集合包括与所述真实页面的各个动态区域匹配的多个第四图像,其中,依据所述第一图像集合和所述第二图像集合比对所述规范页面的动态区域和所述真实页面的动态区域,得到第二比对结果,包括:
对于所述真实页面的每个动态区域,从所述规范页面的动态区域中确定与所述真实页面的动态区域匹配的目标动态区域;
对于所述真实页面的动态区域匹配的每个第四图像,将所述目标动态区域匹配的每个第二图像与所述第四图像进行比对,得到每个第二图像与所述第四图像之间的第二子比对结果;
依据所有第四图像的第二子比对结果确定所述第二比对结果。
6.根据权利要求5所述的方法,其特征在于,依据所有第四图像的第二子比对结果确定所述第二比对结果,包括:
对于每个第四图像,判断所述第四图像的第二子比对结果中是否存在目标子比对结果,其中,所述目标子比对结果表征所述第四图像与所述第二图像相同;
在所有第四图像均存在对应的目标子比对结果的情况下,确定所述第二比对结果表征所述规范页面的动态区域和所述真实页面的动态区域相同;
在存在第四图像不存在对应的目标子比对结果的情况下,确定所述第二比对结果表征所述规范页面的动态区域和所述真实页面的动态区域不同。
7.根据权利要求1所述的方法,其特征在于,依据所述第一比对结果和所述第二比对结果确定所述目标网页是否被篡改,包括:
若所述第一比对结果表征所述规范页面的静态区域和所述真实页面的静态区域相同,并且所述第二比对结果表征所述规范页面的动态区域和所述真实页面的动态区域相同,则确定所述目标网页未被篡改;
若所述第一比对结果表征所述规范页面的静态区域和所述真实页面的静态区域不同,或者所述第二比对结果表征所述规范页面的动态区域和所述真实页面的动态区域不同,则确定所述目标网页被篡改。
8.根据权利要求1所述的方法,其特征在于,在依据所述第一比对结果和所述第二比对结果确定所述目标网页是否被篡改之后,所述方法还包括:
在目标时间点与参考时间点之间的时间间隔达到预设值的情况下,获取所述目标网页的真实页面的新的第二图像集合,其中,所述参考时间点是指获取所述第二图像集合的时间点;
依据所述新的第二图像集合和所述第一图像集合确定所述目标网页是否被篡改。
9.一种网页篡改的检测装置,其特征在于,包括:
第一获取模块,用于获取目标网页的规范页面的第一图像集合,并获取所述目标网页的真实页面的第二图像集合,其中,所述第一图像集合和所述第二图像集合均由页面的静态区域的图像和页面的动态区域的图像组成;
第一比对模块,用于依据所述第一图像集合和所述第二图像集合比对所述规范页面的静态区域和所述真实页面的静态区域,得到第一比对结果;
第二比对模块,用于依据所述第一图像集合和所述第二图像集合比对所述规范页面的动态区域和所述真实页面的动态区域,得到第二比对结果;
第一确定模块,用于依据所述第一比对结果和所述第二比对结果确定所述目标网页是否被篡改。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的网页篡改的检测方法。
CN202311590921.3A 2023-11-27 2023-11-27 网页篡改的检测方法、装置及计算机可读存储介质 Pending CN117290845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311590921.3A CN117290845A (zh) 2023-11-27 2023-11-27 网页篡改的检测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311590921.3A CN117290845A (zh) 2023-11-27 2023-11-27 网页篡改的检测方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117290845A true CN117290845A (zh) 2023-12-26

Family

ID=89239437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311590921.3A Pending CN117290845A (zh) 2023-11-27 2023-11-27 网页篡改的检测方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117290845A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779245A (zh) * 2011-05-12 2012-11-14 李朝荣 基于图像处理技术的网页异常检测方法
CN103201749A (zh) * 2011-01-05 2013-07-10 株式会社东芝 网页篡改检测装置及存储介质
CN108427881A (zh) * 2018-03-16 2018-08-21 北京知道创宇信息技术有限公司 网页篡改监控方法、装置、监控设备及可读存储介质
CN108563963A (zh) * 2018-04-16 2018-09-21 深信服科技股份有限公司 网页篡改检测方法、装置、设备及计算机可读存储介质
CN111783159A (zh) * 2020-07-07 2020-10-16 杭州安恒信息技术股份有限公司 网页篡改的验证方法、装置、计算机设备和存储介质
CN114091118A (zh) * 2021-11-26 2022-02-25 中国电信股份有限公司 网页防篡改方法、装置、设备及存储介质
CN117113430A (zh) * 2023-08-18 2023-11-24 华润数字科技有限公司 网页违规图片检测方法和装置、电子设备、存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103201749A (zh) * 2011-01-05 2013-07-10 株式会社东芝 网页篡改检测装置及存储介质
CN102779245A (zh) * 2011-05-12 2012-11-14 李朝荣 基于图像处理技术的网页异常检测方法
CN108427881A (zh) * 2018-03-16 2018-08-21 北京知道创宇信息技术有限公司 网页篡改监控方法、装置、监控设备及可读存储介质
CN108563963A (zh) * 2018-04-16 2018-09-21 深信服科技股份有限公司 网页篡改检测方法、装置、设备及计算机可读存储介质
CN111783159A (zh) * 2020-07-07 2020-10-16 杭州安恒信息技术股份有限公司 网页篡改的验证方法、装置、计算机设备和存储介质
CN114091118A (zh) * 2021-11-26 2022-02-25 中国电信股份有限公司 网页防篡改方法、装置、设备及存储介质
CN117113430A (zh) * 2023-08-18 2023-11-24 华润数字科技有限公司 网页违规图片检测方法和装置、电子设备、存储介质

Similar Documents

Publication Publication Date Title
US20150026813A1 (en) Method and system for detecting network link
US20150067848A1 (en) Detecting automated site scans
CN111401416A (zh) 异常网站的识别方法、装置和异常对抗行为的识别方法
CN110035075A (zh) 钓鱼网站的检测方法、装置、计算机设备及存储介质
CN111506917A (zh) 页面展示方法、展示装置、可读存储介质及电子设备
CN107085549B (zh) 故障信息生成的方法和装置
CN102779245A (zh) 基于图像处理技术的网页异常检测方法
CN109815702B (zh) 软件行为的安全检测方法、装置及设备
CN110708292A (zh) Ip处理方法、装置、介质、电子设备
CN112307464A (zh) 诈骗识别方法、装置及电子设备
CN103220277B (zh) 监控跨站脚本攻击的方法、装置及***
CN114157568B (zh) 一种浏览器安全访问方法、装置、设备及存储介质
CN107180194B (zh) 基于视觉分析***进行漏洞检测的方法及装置
CN113315785B (zh) 一种告警消减方法、装置、设备和计算机可读存储介质
CN111783159A (zh) 网页篡改的验证方法、装置、计算机设备和存储介质
CN107135421B (zh) 视频特征检测方法及装置
KR101473671B1 (ko) 이미지 비교를 통한 피싱 사이트 탐지 방법 및 장치
CN111651658A (zh) 一种基于深度学习的自动化识别网站的方法和计算机设备
CN117113430A (zh) 网页违规图片检测方法和装置、电子设备、存储介质
CN117290845A (zh) 网页篡改的检测方法、装置及计算机可读存储介质
CN112087455A (zh) 一种waf站点防护规则生成方法、***、设备及介质
CN110334301B (zh) 一种页面还原方法及装置
CN115878358A (zh) 异常日志分析方法、装置、电子设备及存储介质
CN115643044A (zh) 数据处理方法、装置、服务器及存储介质
CN115934179A (zh) 业务功能控制方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination