CN103778365B - 一种检测网页隐藏内容的方法,及设备 - Google Patents

一种检测网页隐藏内容的方法,及设备 Download PDF

Info

Publication number
CN103778365B
CN103778365B CN201210397725.XA CN201210397725A CN103778365B CN 103778365 B CN103778365 B CN 103778365B CN 201210397725 A CN201210397725 A CN 201210397725A CN 103778365 B CN103778365 B CN 103778365B
Authority
CN
China
Prior art keywords
page
layout information
descriptor
content
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210397725.XA
Other languages
English (en)
Other versions
CN103778365A (zh
Inventor
李永健
周吉文
庾洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210397725.XA priority Critical patent/CN103778365B/zh
Priority to PCT/CN2013/085367 priority patent/WO2014059934A1/en
Publication of CN103778365A publication Critical patent/CN103778365A/zh
Priority to US14/688,314 priority patent/US9979746B2/en
Application granted granted Critical
Publication of CN103778365B publication Critical patent/CN103778365B/zh
Priority to US15/959,693 priority patent/US10333972B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1466Active attacks involving interception, injection, modification, spoofing of data unit addresses, e.g. hijacking, packet injection or TCP sequence number attacks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/51Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems at application loading time, e.g. accepting, rejecting, starting or inhibiting executable software based on integrity or source reliability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/566Dynamic detection, i.e. detection performed at run-time, e.g. emulation, suspicious activities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种检测网页隐藏内容的方法,及设备。其中方法包括:通过加载页面,生成页面的描述信息和页面的布局信息;比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;若否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容。以上实施例通过在排版引擎中加载页面,生成页面的描述信息和页面的布局信息,然后比较页面的描述信息和页面的布局信息,确定被隐藏的内容的方式不受种类的影响也不受是否加密的影响,因而可以准确的识别被隐藏的内容,提高了检测网页隐藏内容的准确率。

Description

一种检测网页隐藏内容的方法,及设备
技术领域
本发明涉及通信技术领域,特别涉及一种检测网页隐藏内容的方法,及设备。
背景技术
黑客目前常用的挂黑链方式是设置超文本标记语言(Hypertext MarkupLanguage,HTML)标签的属性为display:none。要达到这个目的可以有多种方式,可以在HTML中设置可以在级联样式表(Cascading Style Sheet,CSS)文件中通过CSS选择器设置,也可以用JavaScript(程式语言的一种)操作网页节点的属性设置。
挂黑链是黑客修改正常网站页面的内容。通过在正常网页中加入指向其它网站的隐藏链接,以达到提高目标网站外链数量的目的。外链是指向非本域名下的统一资源定位符(Uniform/Universal Resource Locator,URL)的链接。挂的黑链即为网页的隐藏内容,目前的监测方案有如下两种:
静态检测方案:通过对黑客挂黑链常用的HTML、CSS及JavaScript进行收集,提取出较通用的文本字符串特征,利用文本字符串特征进行匹配来检测网页中的黑链。
动态检测方案:利用开源JavaScript引擎执行页面中的JavaScript代码,若发现执行的代码具有隐藏外链的功能,则确定该页面被挂黑链。
需要说明的是,网页的编辑语言有很多种,各种语言具有其特性不同,隐藏内容的方式也会略有不同,本申请文件不可能对此进行穷举,以上关于HTML、CSS、JavaScript的举例不应理解为本申请所涉及隐藏内容的应用范围限定。
基于以上举例,发明人在实现本发明实施例的过程中发现:由于HTML、CSS以及JavaScript相结合可以产生多种多样的隐藏链接代码,且JavaScript作为一种前端编程语言,还可以实现对恶意代码加密,所以上述静态检测容易被绕过。动态检测方案虽然能够检测出JavaScript加密的隐藏代码,但没有对CSS和HTML做处理,所以对通过变形的HTML+CSS方式隐藏内容的页面无法识别。因此采用以上两种方案检测网页隐藏内容的准确率均不高。
发明内容
本发明实施例提供了一种检测网页隐藏内容的方法,及设备,用于提高检测网页隐藏内容的准确率。
一种检测网页隐藏内容的方法,包括:
通过加载页面,生成页面的描述信息和页面的布局信息;
比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
若否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容;
若是,则确定页面无隐藏内容;
若所述隐藏内容为具有指向URL功能的标签节点,且所述具有指向URL功能的标签节点指向外链,则确定所述页面被挂黑链。
一种检测网页隐藏内容的设备,包括:
加载单元,用于通过加载页面,生成页面的描述信息和页面的布局信息;
比较单元,用于比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
内容确定单元,用于若比较确定单元确定为否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容;及若比较确定单元确定为是,则确定页面无隐藏内容;
内容确定子单元,用于若所述隐藏内容为具有指向URL功能的标签节点,且所述具有指向URL功能的标签节点指向外链,则确定所述页面被挂黑链。
从以上技术方案可以看出,本发明实施例具有以下优点:在页面中设置隐藏内容的最终的目的是使浏览器进行排版后,输出到屏幕时不会出现要隐藏的内容,而以上实施例通过在排版引擎中加载页面,生成页面的描述信息和页面的布局信息,然后比较页面的描述信息和页面的布局信息,确定被隐藏的内容的方式不受种类的影响也不受是否加密的影响,因而可以准确的识别被隐藏的内容,提高了检测网页隐藏内容的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例方法流程示意图;
图2为本发明实施例另一方法流程示意图;
图3为本发明实施例设备结构示意图;
图4为本发明实施例设备结构示意图;
图5为本发明实施例设备结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供了一种检测网页隐藏内容的方法,如图1所示,包括:
101:通过加载页面,生成页面的描述信息和页面的布局信息;
上述加载页面包括:使用排版引擎加载页面,并且在上述使用排版引擎加载页面之前还包括:将排版引擎的用户代理user-agent设置为搜索引擎。
将用户代理设置为搜索引擎的原因是:目前很多黑客会根据user-agent判断是搜索引擎爬虫在访问页面还是普通用户在访问页面,黑客只给搜索引擎爬虫返回带搜索引擎优化(Search Engine Optimization,SEO)内容的页面,给普通用户返回正常内容。这样会让网络管理员很难发现网站的异常情况。将排版引擎的user-agent设置为搜索引擎则可以避免这种情况,进一步提升检测网页隐藏内容的准确率。
上述使用排版引擎加载页面包括:使用排版引擎加载统一资源定位符(URL,Uniform/Universal Resource Locator),并解析返回的HTML代码,并加载上述HTML代码对应页面中的其他元素。上述其他元素可以如:CSS、JavaScript等,具体内容本发明实施例不予限定。
可选地,上述排版引擎为开源浏览器排版引擎(webkit);上述页面的描述信息为文档对象模型(DOM,Document Object Model)树;上述页面的布局信息为描绘(render)树。需要说明的是,排版引擎是用于对页面进行排版的工具,并不仅限于webkit,以上webkit的举例不应理解为对本发明实施例的限定,同理,后续DOM树和render树是webkit下的数据结构也不应理解为对本发明实施例的限定。
那么前述101步骤则具体为:使用开源浏览器排版引擎加载页面,生成文档对象模型DOM树和描绘render树。
102:比较上述页面的描述信息以及上述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;若否,进入103;
另需说明的是,若上述103确定的结果为是,那么可以确定上述页面无隐藏内容,然后结束本方法流程。
具体地,若上述排版引擎为webkit;上述页面的描述信息为DOM树;上述页面的布局信息为render树;那么上述步骤102为:比较上述DOM树以及上述render树,确定DOM树的所有标签节点是否均包含在render树中。
进一步地,上述比较上述页面的描述信息以及上述页面的布局信息包括:在生成页面的描述信息和页面的布局信息,且经设定延迟时间之后,比较上述页面的描述信息以及上述页面的布局信息。上诉设定延迟时间通常可以设置为5秒,该时间可以依据页面加载等处理时间来设定,具体时间为多少本发明实施例不予限定。
103:确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容。
具体地,若上述排版引擎为webkit;上述页面的描述信息为DOM树;上述页面的布局信息为render树;那么上述步骤103为:若102结果为否,则确定DOM树中未包含在render树中的标签节点为隐藏内容。
在页面中设置隐藏内容的最终的目的是使浏览器进行排版后,输出到屏幕时不会出现要隐藏的内容,而以上实施例通过在排版引擎中加载页面,生成页面的描述信息和页面的布局信息,然后比较页面的描述信息和页面的布局信息,确定被隐藏的内容的方式不受种类的影响也不受是否加密的影响,因而可以准确的识别被隐藏的内容,提高了检测网页隐藏内容的准确率。
本发明实施例还提供了进一步识别黑链的方案,上述方法还包括:
若上述隐藏内容为具有指向URL功能的标签节点,且上述具有指向URL功能的标签节点指向外链,则确定上述页面被挂黑链。
上述具有指向URL功能的标签节点,可以为:a标签节点;a标签节点介绍如下:
<a>标签可定义锚(anchor),anchor一般有两种用法:
1、通过使用超文本引用(href,Hypertext Reference)属性,创建指向另外一个文档的链接(或超链接);
2、通过使用名称(name)或标识符(id,Identifier)属性,创建一个文档内部的书签,也即是:可以创建指向文档片段的链接。
以下实施例将给出排版引擎为webkit;页面的描述信息为文DOM树;页面的布局信息为render树的实施例作为举例,进行进一步说明。
基本原理:无论黑客用什么方式隐藏黑链,最终的目的都是使浏览器进行排版后,输出到屏幕时不会出现要隐藏的内容。
用webkit对页面进行渲染的过程中,会在内存中构造一棵dom树和一棵render树,dom树用于描述HTML页面的的信息,render树则用于描述HTML页面的布局,即具体负责dom树如何显示在屏幕上。Webkit将dom树构造成render树过程中,会根据CSS、JavaScript的解析执行结果判断dom树的节点是否处于隐藏状态,如果处于隐藏状态,那么在构造render树的时候就不会将该节点加入到render树中。
通过比较dom树和render树,可以看到本来存在于dom树中的很多元素,在生成的render树中已经没有了,因此可以通过对比webkit生成的dom树和render树中节点是否一致的方式来判断页面中是否有页面内容处于隐藏状态,再通过遍历该隐藏的页面内容下是否有a标签来进一步判断是否有链接被隐藏。
具体的流程,请参阅图2,包括:
201:输入URL;
202:设置webkit的User-Agent为常见搜索引擎,之所以如此,是因为现在很多黑客会根据浏览器的user-agent判断是搜索引擎爬虫在访问还是普通用户在访问,黑客只给搜索引擎爬虫返回带seo内容的页面,而给普通用户返回正常内容。这样可以让网络管理员很难发现网站的异常情况。
203:访问URL,具体地:用webkit加载URL,解析返回的HTML代码,并加载页面中的其他元素,如CSS、JavaScript等,等待若干时间以使JavaScript执行完毕,例如等待5秒,具体时间可以灵活设置。
204:生成dom树和render树;
205:判断dom树中的HTML标签节点是否存在于render树中,如果否,则认为该dom节点被隐藏,进入207;如果是,进入206;
206:确定页面没有被挂黑链;
207:判断被隐藏的dom节点下是否存在若干a标签节点,若是,进入208;若否,进入206;
208:确认页面被挂黑链。
本发明实施例还提供了一种检测网页隐藏内容的设备,如图3所示,包括:
加载单元301,用于通过加载页面,生成页面的描述信息和页面的布局信息;
比较单元302,用于比较上述页面的描述信息以及上述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
内容确定单元303,用于若比较确定单元确定为否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容。
在页面中设置隐藏内容的最终的目的是使浏览器进行排版后,输出到屏幕时不会出现要隐藏的内容,而以上实施例通过在排版引擎中加载页面,生成页面的描述信息和页面的布局信息,然后比较页面的描述信息和页面的布局信息,确定被隐藏的内容的方式不受种类的影响也不受是否加密的影响,因而可以准确的识别被隐藏的内容,提高了检测网页隐藏内容的准确率。
更具体地,上述比较单元,具体用于在生成页面的描述信息和页面的布局信息,且经设定延迟时间之后,比较上述页面的描述信息以及上述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中。
进一步地,如图4所示,上述加载单元301,具体用于使用排版引擎加载页面;上述设备上述设备还包括:
加载控制单元401,用于在上述使用排版引擎加载页面之前,将排版引擎的用户代理字符串设置为搜索引擎。将用户代理设置为普通用户的原因是:目前很多黑客会根据user-agent判断是搜索引擎爬虫在访问页面还是普通用户在访问页面,黑客只给搜索引擎爬虫返回带SEO内容的页面,给普通用户返回正常内容。这样会让网络管理员很难发现网站的异常情况。将排版引擎的user-agent设置为普通用户则可以避免这种情况,进一步提升检测网页隐藏内容的准确率。
可选地,上述加载单元301,具体用于使用排版引擎加载统一资源定位符URL,并解析返回的超文本标记语言HTML代码,并加载上述HTML代码对应页面中的其他元素。上述其他元素可以如:CSS、JavaScript等,具体内容本发明实施例不予限定。
可选地,上述加载单元301,具体用于使用开源浏览器排版引擎加载页面,生成文档对象模型DOM树和描绘render树;
上述比较单元302,具体用于比较上述DOM树以及上述render树,确定DOM树的所有标签节点是否均包含在render树中;
上述内容确定单元303,具体用于若比较确定单元确定为否,则确定DOM树中未包含在render树中的标签节点为隐藏内容。
需要说明的是,排版引擎是用于对页面进行排版的工具,并不仅限于webkit,以上webkit的举例不应理解为对本发明实施例的限定,同理,后续DOM树和render树是webkit下的数据结构也不应理解为对本发明实施例的限定。
本发明实施例还提供了进一步识别黑链的方案,如图5所示,上述设备还包括:
内容确定子单元501,用于若上述隐藏内容为具有指向URL功能的标签节点,且上述具有指向URL功能的标签节点指向外链,则确定上述页面被挂黑链。
值得注意的是,上述设备实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种检测网页隐藏内容的方法,其特征在于,包括:
通过加载页面,生成页面的描述信息和页面的布局信息;
比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
若否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容;所述隐藏内容为:所述页面经浏览器进行排版后,输出到屏幕时不会出现的内容;
若是,则确定页面无隐藏内容;
若所述隐藏内容为具有指向URL功能的标签节点,且所述具有指向URL功能的标签节点指向外链,则确定所述页面被挂黑链。
2.根据权利要求1所述方法,其特征在于,所述比较所述页面的描述信息以及所述页面的布局信息包括:
在生成页面的描述信息和页面的布局信息,且经设定延迟时间之后,比较所述页面的描述信息以及所述页面的布局信息。
3.根据权利要求1所述方法,其特征在于,所述加载页面包括:使用排版引擎加载页面,并且在采用排版引擎加载页面之前还包括:
将排版引擎的用户代理字符串设置为搜索引擎。
4.根据权利要求3所述方法,其特征在于,所述使用排版引擎加载页面包括:
使用排版引擎加载统一资源定位符URL,并解析返回的超文本标记语言HTML代码,并加载所述HTML代码对应页面中的其他元素。
5.根据权利要求3或4所述方法,其特征在于,
所述排版引擎为开源浏览器排版引擎;所述页面的描述信息为文档对象模型DOM树;所述页面的布局信息为描绘render树。
6.一种检测网页隐藏内容的设备,其特征在于,包括:
加载单元,用于通过加载页面,生成页面的描述信息和页面的布局信息;
比较单元,用于比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中;
内容确定单元,用于若比较确定单元确定为否,则确定页面的描述信息中未包含在页面的布局信息中的标签节点为隐藏内容;所述隐藏内容为:所述页面经浏览器进行排版后,输出到屏幕时不会出现的内容;及若比较确定单元确定为是,则确定页面无隐藏内容;
内容确定子单元,用于若所述隐藏内容为具有指向URL功能的标签节点,且所述具有指向URL功能的标签节点指向外链,则确定所述页面被挂黑链。
7.根据权利要求6所述设备,其特征在于,
所述比较单元,具体用于在生成页面的描述信息和页面的布局信息,且经设定延迟时间之后,比较所述页面的描述信息以及所述页面的布局信息,确定页面的描述信息的所有标签节点是否均包含在页面的布局信息中。
8.根据权利要求6所述设备,其特征在于,所述加载单元,具体用于使用排版引擎加载页面;所述设备还包括:
加载控制单元,用于在所述使用排版引擎加载页面之前,将排版引擎的用户代理字符串设置为搜索引擎。
9.根据权利要求8所述设备,其特征在于,
所述加载单元,具体用于使用排版引擎加载统一资源定位符URL,并解析返回的超文本标记语言HTML代码,并加载所述HTML代码对应页面中的其他元素。
10.根据权利要求8或9所述设备,其特征在于,
所述加载单元,具体用于使用开源浏览器排版引擎加载页面,生成文档对象模型DOM树和描绘render树;
所述比较单元,具体用于比较所述DOM树以及所述render树,确定DOM树的所有标签节点是否均包含在render树中;
所述内容确定单元,具体用于若比较确定单元确定为否,则确定DOM树中未包含在render树中的标签节点为隐藏内容。
CN201210397725.XA 2012-10-18 2012-10-18 一种检测网页隐藏内容的方法,及设备 Active CN103778365B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210397725.XA CN103778365B (zh) 2012-10-18 2012-10-18 一种检测网页隐藏内容的方法,及设备
PCT/CN2013/085367 WO2014059934A1 (en) 2012-10-18 2013-10-17 Method and apparatus for detecting hidden content of web page
US14/688,314 US9979746B2 (en) 2012-10-18 2015-04-16 Method and apparatus for detecting hidden content of web page
US15/959,693 US10333972B2 (en) 2012-10-18 2018-04-23 Method and apparatus for detecting hidden content of web page

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210397725.XA CN103778365B (zh) 2012-10-18 2012-10-18 一种检测网页隐藏内容的方法,及设备

Publications (2)

Publication Number Publication Date
CN103778365A CN103778365A (zh) 2014-05-07
CN103778365B true CN103778365B (zh) 2015-05-13

Family

ID=50487584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210397725.XA Active CN103778365B (zh) 2012-10-18 2012-10-18 一种检测网页隐藏内容的方法,及设备

Country Status (3)

Country Link
US (2) US9979746B2 (zh)
CN (1) CN103778365B (zh)
WO (1) WO2014059934A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778365B (zh) 2012-10-18 2015-05-13 腾讯科技(深圳)有限公司 一种检测网页隐藏内容的方法,及设备
WO2015117267A1 (en) * 2014-02-07 2015-08-13 Google Inc. Systems and methods for automatically creating content modification scheme
CN107294918B (zh) * 2016-03-31 2020-09-29 阿里巴巴集团控股有限公司 一种钓鱼网页检测方法及装置
US11514094B2 (en) * 2018-02-06 2022-11-29 International Business Machines Corporation Search and navigation of hidden elements of a web page
CN111259284B (zh) * 2018-11-30 2023-05-02 阿里巴巴集团控股有限公司 页面懒加载的方法和装置、存储介质和处理器
US11263029B2 (en) * 2019-03-27 2022-03-01 Citrix Systems, Inc. Providing user interface (UI) elements having scrollable content in virtual machine sessions at reduced latency and related methods
US11281478B2 (en) 2019-03-27 2022-03-22 Citrix Systems, Inc. Providing user interface (UI) elements having an ordered hierarchy of graphical control elements in virtual machine sessions at reduced latency and related methods
US11263028B2 (en) 2019-03-27 2022-03-01 Citrix Systems, Inc. Providing user interface (UI) elements in virtual machine sessions at reduced latency
CN110309667B (zh) * 2019-04-16 2022-08-30 网宿科技股份有限公司 一种网站暗链检测方法和装置
CN113111274A (zh) * 2020-01-10 2021-07-13 网宿科技股份有限公司 一种检测网页中隐藏暗链的方法和装置
CN111353112A (zh) * 2020-02-27 2020-06-30 百度在线网络技术(北京)有限公司 页面处理方法、装置、电子设备和计算机可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346770A (zh) * 2011-09-21 2012-02-08 晨星软件研发(深圳)有限公司 WebKit浏览器网页内容加载方法及装置
CN102375851A (zh) * 2010-08-23 2012-03-14 ***通信有限公司 一种显示页面的方法及设备
CN102508887A (zh) * 2011-10-19 2012-06-20 江西省南城县网信电子有限公司 一种数字电视交互服务标记语言解析***及方法
CN102682097A (zh) * 2012-04-27 2012-09-19 北京神州绿盟信息安全科技股份有限公司 检测网页中暗链的方法和设备

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4037999B2 (ja) * 2000-05-15 2008-01-23 インターナショナル・ビジネス・マシーンズ・コーポレーション ウェブサイト、ロボット型検索エンジン応答システム、ロボット型検索エンジン登録方法、記憶媒体及びプログラム伝送装置
AU2003210900A1 (en) * 2002-02-07 2003-09-02 Empirix Inc. Automated security threat testing of web pages
EP1406183A3 (en) * 2002-10-01 2004-04-14 Sap Ag Method and system for refreshing browser pages
US7287279B2 (en) * 2004-10-01 2007-10-23 Webroot Software, Inc. System and method for locating malware
US8615800B2 (en) * 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US8020206B2 (en) * 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
US8065392B2 (en) * 2007-06-08 2011-11-22 Apple Inc. Methods and systems for managing web feed content with an email client application
GB0719964D0 (en) * 2007-10-12 2007-11-21 Katholleke Universiteit Leuven Method for detecting and resolving hidden text salting
US20100114902A1 (en) * 2008-11-04 2010-05-06 Brigham Young University Hidden-web table interpretation, conceptulization and semantic annotation
US9398032B1 (en) * 2009-07-09 2016-07-19 Trend Micro Incorporated Apparatus and methods for detecting malicious scripts in web pages
US8806325B2 (en) * 2009-11-18 2014-08-12 Apple Inc. Mode identification for selective document content presentation
US8505094B1 (en) * 2010-01-13 2013-08-06 Trend Micro, Inc. Detection of malicious URLs in a web page
US8997239B2 (en) * 2011-03-31 2015-03-31 Infosys Limited Detecting code injections through cryptographic methods
EP2579144B1 (en) 2011-10-07 2019-05-01 BlackBerry Limited Determining a target position for scrolling content
CN102542201B (zh) * 2011-12-26 2015-01-21 北京奇虎科技有限公司 一种网页中恶意代码的检测方法及***
CN102622543B (zh) * 2012-02-06 2016-08-03 北京百度网讯科技有限公司 一种动态检测恶意网页脚本的方法和装置
US8639680B1 (en) * 2012-05-07 2014-01-28 Google Inc. Hidden text detection for search result scoring
CN103778365B (zh) 2012-10-18 2015-05-13 腾讯科技(深圳)有限公司 一种检测网页隐藏内容的方法,及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375851A (zh) * 2010-08-23 2012-03-14 ***通信有限公司 一种显示页面的方法及设备
CN102346770A (zh) * 2011-09-21 2012-02-08 晨星软件研发(深圳)有限公司 WebKit浏览器网页内容加载方法及装置
CN102508887A (zh) * 2011-10-19 2012-06-20 江西省南城县网信电子有限公司 一种数字电视交互服务标记语言解析***及方法
CN102682097A (zh) * 2012-04-27 2012-09-19 北京神州绿盟信息安全科技股份有限公司 检测网页中暗链的方法和设备

Also Published As

Publication number Publication date
US20180241773A1 (en) 2018-08-23
WO2014059934A1 (en) 2014-04-24
US20150222660A1 (en) 2015-08-06
CN103778365A (zh) 2014-05-07
US10333972B2 (en) 2019-06-25
US9979746B2 (en) 2018-05-22

Similar Documents

Publication Publication Date Title
CN103778365B (zh) 一种检测网页隐藏内容的方法,及设备
KR101623223B1 (ko) 하나의 인터넷 호스팅 시스템 집합에 의해 제공되는 다수의 병렬 사용자 경험
KR100932847B1 (ko) 복제 방지 방법 및 그 시스템
US10540416B2 (en) Linking source code to running element
CN102932197A (zh) 一种测试方法及测试***
CN102664925B (zh) 一种展现搜索结果的方法及装置
CN101876897A (zh) 用于在Web浏览器上处理Widget的***和方法
CN102724187A (zh) 一种针对网址的安全检测方法及装置
US8332821B2 (en) Using encoding to detect security bugs
CN111556036A (zh) 一种网络钓鱼攻击的检测方法、装置及设备
US20180113583A1 (en) Device and method for providing at least one functionality to a user with respect to at least one of a plurality of webpages
CN108830082B (zh) 一种基于输出点位置的xss漏洞检测参数自动选取方法
CN111143722A (zh) 一种网页暗链检测方法、装置、设备及介质
US10846361B2 (en) User-specific customization of web pages
CN103309954A (zh) 一种基于html网页的数据抽取***
CN104704495B (zh) 一种信息搜索的方法以及装置
CN113934507A (zh) 基于污点标志跟踪检测jQuery库隐私泄露的方法和装置
US11314834B2 (en) Delayed encoding of resource identifiers
CN109657472B (zh) Sql注入漏洞检测方法、装置、设备及可读存储介质
CN104506529A (zh) 网站防护方法和装置
CN103838865A (zh) 用于挖掘时效性种子页的方法及装置
US9396170B2 (en) Hyperlink data presentation
Zhou et al. An analysis of urls generated from javascript code
CN112287349A (zh) 安全漏洞检测方法及服务端
JP4526355B2 (ja) Web処理方法およびWeb処理装置並びにWeb処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant