CN110381118A - 页面数据传输的控制方法和相关设备 - Google Patents

页面数据传输的控制方法和相关设备 Download PDF

Info

Publication number
CN110381118A
CN110381118A CN201910533716.0A CN201910533716A CN110381118A CN 110381118 A CN110381118 A CN 110381118A CN 201910533716 A CN201910533716 A CN 201910533716A CN 110381118 A CN110381118 A CN 110381118A
Authority
CN
China
Prior art keywords
html document
terminal
page
content
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910533716.0A
Other languages
English (en)
Other versions
CN110381118B (zh
Inventor
杨小彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN201910533716.0A priority Critical patent/CN110381118B/zh
Publication of CN110381118A publication Critical patent/CN110381118A/zh
Priority to PCT/CN2019/118041 priority patent/WO2020253057A1/zh
Application granted granted Critical
Publication of CN110381118B publication Critical patent/CN110381118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/168Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开涉及数据传输技术领域,具体揭示了一种页面数据传输的控制方法及***,包括:响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档;从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件;将进行内容分离后的所述html文档和所述组件分别传输至所述终端;在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除;将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。从而避免了在终端中显示html文档在传输过程中所被植入的内容。

Description

页面数据传输的控制方法和相关设备
技术领域
本公开涉及数据传输技术领域,特别涉及一种页面数据传输的控制方法及相关设备。
背景技术
现有技术中,页面经常会被植入一些非法广告,从而极大影响了用户在进行页面浏览时的体验。而植入页面中的非法广告是在页面所对应页面数据的传输过程中,非法程序向所传输的页面数据中***了一些非法的广告标签,进而,被植入的广告标签在根据终端所接收到的页面数据进行显示时,会显示所***的广告,从而导致用户浏览页面的体验非常不好。
由上可知,亟需一种方法来进行页面数据的传输,从而保证在用户终端所显示的页面中不包括页面数据中被植入的内容。
发明内容
为了解决相关技术中存在的问题,本公开提供了一种页面数据传输的控制方法及相关设备。
第一方面,一种页面数据传输的控制方法,应用于由服务器和至少一终端构成的网页传输***,包括:
响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档;
从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件;
将进行内容分离后的所述html文档和所述组件分别传输至所述终端;
在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除;
将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。
第二方面,一种页面数据传输的控制***,应用于由服务器和至少一终端构成的网页传输***,所述服务器包括:
获取模块,被配置为:响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档;
分离模块,被配置为:从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件;
传输模块,被配置为:将进行内容分离后的所述html文档和所述组件分别传输至所述终端;
所述终端包括:
遍历模块,被配置为:在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除;
挂载模块,被配置为:将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。
在一实施例中,所述分离模块,包括:
移除单元,被配置为:从所述html文档中提取所述body标签中的内容,并将所述body标签中的内容从所述html文档中移除,得到移除后的html文档;
组件放入单元,被配置为:将所提取的所述body标签中的内容作为一组件放入所述所请求页面的脚本文件中,所述脚本文件是所述服务器响应于所述HTTP请求所获得的;
所述传输模块,包括:
传输单元,被配置为:将所述移除后的html文档和被放入所述组件的所述脚本文件分别传输至所述终端。
在一实施例中,所述传输单元,包括:
Html文档传输单元,被配置为:根据所述HTTP请求,所述服务器通过HTTP传输协议向所述终端传输所述移除后的html文档;
脚本请求接收单元,被配置为:接收所述终端所发送的脚本请求,所述脚本请求是根据所述终端在所接收到所述html文档中所解析到script标签的内容而发送的;
脚本文件传输单元,被配置为:响应于所述脚本请求向所述终端传输所述被放入所述组件的所述脚本文件。
渲染模块,被配置为:根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
在一实施例中,所述终端还包括:
渲染模块,被配置为:根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
在一实施例中,所述渲染模块,包括:
解析单元,被配置为:解析所述处理后的html文档构建DOM树和获得所述页面的CSS文件;
渲染树构建单元,被配置为:根据所述DOM树和所述CSS文件构建得到渲染树;
渲染单元,被配置为:渲染所述渲染树,实现在所述终端上显示所述页面。
第三方面,一种页面数据传输的控制设备,包括:
处理器;及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的方法。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过服务端在进行html文档的传输前,将html文档中body标签下的内容从html文档中分离出来作为一个组件,并将进行内容分离后的html文档和组件分别传输至终端;而在终端接收到所传输的html文档和组件之后,先对所接收到的html文档进行遍历,从而出去所接收到的html文档中除设定标签外的其他标签以及对应的内容,从而可以将终端所接收到的html文档中在传输过程中所被植入的内容从html文档中移除,然后再将组件挂载在进行移除之后的html文档的body标签下,得到处理后的html文档,以使终端的浏览器根据处理后的html文档进行页面的显示。由于页面显示的内容由body标签下的内容决定,即将body标签下的内容分离出又重新挂载在body标签下,并不会影响页面中内容的显示,从而,通过本公开的技术方案,一方面保证了页面的准确显示,另一方面,如果html文档在传输过程中被植入内容,也可以将内容继续移除,从而在终端中不显示所植入的内容,保证了用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据本公开所涉及的实施环境的示意图;
图2是根据一示例性实施例示出的一种装置的框图;
图3是根据一示例性实施例示出的一种页面数据传输的控制方法的流程图;
图4是根据另一示例性实施例示出的一种页面数据传输的控制方法的流程图;
图5是图4对应实施例的步骤S151在一实施例中的流程图;
图6是根据另一示例性实施例示出的一种页面数据传输的控制方法的流程图;
图7是图6对应实施例的布置S310在一实施例中的流程图;
图8是根据一示例性实施例示出的一种页面数据传输的控制***的框图;
图9是根据一示例性实施例示出的一种页面数据传输的控制设备的框图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据本公开所涉及的实施环境的示意图。如图1所示,该实施环境包括:服务器200和至少一个终端100。
服务器300可以是独立的服务器,也可以是由多台服务器构成的服务器集群。
终端100可以是智能手机、平板电脑、笔记本电脑、台式电脑等可以进行网页访问并显示所访问网页的通信设备,在此不进行具体限定。
终端100与服务器300之间通过所建立的有线或者无线网络进行通信,例如终端100为进行页面访问向服务器300发起HTTP请求,服务器300向终端100传输所请求访问页面的页面数据等。
在进行页面数据传输的过程中,服务器300和终端100即构成页面数据传输***,从而基于服务器300和终端100的配合实现本公开的页面数据传输控制方法。
图2是根据一示例性实施例示出的一种装置200的框图。例如,装置200可以是图1所示实施环境中的终端100。
参照图2,装置200可以包括以下一个或多个组件:处理组件202,存储器204,电源组件206,多媒体组件208,音频组件210,传感器组件214以及通信组件216。
处理组件202通常控制装置200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作以及记录操作相关联的操作等。处理组件202可以包括一个或多个处理器218来执行指令,以完成下述的方法的全部或部分步骤。此外,处理组件202可以包括一个或多个模块,便于处理组件202和其他组件之间的交互。例如,处理组件202可以包括多媒体模块,以方便多媒体组件208和处理组件202之间的交互。
存储器204被配置为存储各种类型的数据以支持在装置200的操作。这些数据的示例包括用于在装置200上操作的任何应用程序或方法的指令。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static RandomAccess Memory,简称SRAM),电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。存储器204中还存储有一个或多个模块,该一个或多个模块被配置成由该一个或多个处理器218执行,以完成下述任一实施例中所示方法中的全部或者部分步骤。
电源组件206为装置200的各种组件提供电力。电源组件206可以包括电源管理***,一个或多个电源,及其他与为装置200生成、管理和分配电力相关联的组件。
多媒体组件208包括在所述装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(Liquid Crystal Display,简称LCD)和触摸面板。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。屏幕还可以包括有机电致发光显示器(Organic Light Emitting Display,简称OLED)。
音频组件210被配置为输出和/或输入音频信号。例如,音频组件210包括一个麦克风(Microphone,简称MIC),当装置200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中,音频组件210还包括一个扬声器,用于输出音频信号。
传感器组件214包括一个或多个传感器,用于为装置200提供各个方面的状态评估。例如,传感器组件214可以检测到装置200的打开/关闭状态,组件的相对定位,传感器组件214还可以检测装置200或装置200一个组件的位置改变以及装置200的温度变化。在一些实施例中,该传感器组件214还可以包括磁传感器,压力传感器或温度传感器。
通信组件216被配置为便于装置200和其他设备之间有线或无线方式的通信。装置200可以接入基于通信标准的无线网络,如WiFi(WIreless-Fidelity,无线保真)。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件216还包括近场通信(Near FieldCommunication,简称NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RadioFrequency Identification,简称RFID)技术,红外数据协会(InfraredDataAssociation,简称IrDA)技术,超宽带(Ultra Wideband,简称UWB)技术,蓝牙技术和其他技术来实现。
在示例性实施例中,装置200可以被一个或多个应用专用集成电路(ApplicationSpecific Integrated Circuit,简称ASIC)、数字信号处理器、数字信号处理设备、可编程逻辑器件、现场可编程门阵列、控制器、微控制器、微处理器或其他电子元件实现,用于执行下述方法。
图3是根据一示例性实施例示出的一种页面数据传输的控制方法的流程图。该页面数据传输的控制方法应用于由服务器和至少一终端构成的网页传输***。如图3所示,该页面数据传输的控制方法,可以包括以下步骤。
步骤S110,响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档。
终端100为进行页面访问,终端100基于其自身所安装的浏览器应用或者内嵌于其他应用的浏览器程序向对应页面的服务器发起请求。其中服务器是为所访问页面提供资源和服务的服务器,服务器中存储由所访问页面的页面数据,并与请求进行页面访问的终端进行通信。
终端100向对应的服务器发起的请求,可以是HTTP请求,也可以是HTTPS请求,其中,对于终端向对应页面的服务器发起HTTP请求,服务器基于HTTP协议向终端100返回所请求访问页面的页面数据;同样的,对于终端向对应页面的服务器发起HTTPS请求,服务器基于HTTPS协议向终端100返回所请求访问页面的页面数据。
HTTPS协议(Hyper Text Transfer Protocol over Secure Socket Layer,超文本传输安全协议)是具有安全性的SSL加密传输协议,也即是说,通过HTTPS协议所传输的页面数据在传输过程中是被加密的。而通过HTTP协议所传输的页面数据是没有被加密的。
在页面数据传输的过程中,非法用户可以通过在页面数据中植入其他内容例如广告标签、非法程序等,从而让在页面数据传输到终端之后,终端所显示的页面中也会对应的显示所被植入的内容,例如广告等。而如果不采取措施对页面数据中所植入的内容进行处理的话,则大大影响在终端所显示的页面数据所对应页面,从而导致用户浏览页面的体验大大降低。特别是对于通过HTTP协议传输的页面数据,由于页面数据在传输过程中没有被加密,从而容易被植入其他内容,例如广告标签。
基于此,本公开提出了一种页面数据的传输控制方法,用于在控制基于HTTP协议进行页面数据传输的过程,从而避免在页面数据中被植入的内容影响用户的页面浏览体验。
其中页面数据是用于描述页面的数据,页面数据至少包括描述页面内容的html文档,以及定义页面中各元素显示样式和布局的CSS(Cascading Style Sheets层叠CSS文件)文件、脚本文件等。
html文档是由html命令组成的描述性文本,html命令可以说明文字、图形、动画、声音、表格、链接等。html文档的结构包括头部(在html文档中通过head标签体现)、主体(在html文档中通过body标签体现)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。
如上所描述,页面数据中的html文档描述了页面的内容,所以页面的html文档中的内容直接决定了所显示页面的内容,具体是html文档中的body标签下的内容定义了在页面中显示的内容。而非法用户向页面数据中植入其他内容,也是通过向html文档中进行内容的植入。基于此,本公开的技术方案在向终端传输html文档之前,对html文档进行预处理,即步骤S130。
从而,在服务器接收到终端所发起的HTTP请求之后,对应获取HTTP请求所请求访问页面的html文档。
步骤S130,从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件。
如上所描述,html文档主要包括两部分:头部和主体。而在头部和主体中还可以包括多个标签,而每一标签由一个开始标签和一个结束标签,例如html标签,开始标签为<html>,结束标签为</html>,对于一个标签,开始标签和结束标签之间的内容即为该标签下的内容,例如body标签下的内容即为html文档中开始标签<body>和结束标签</body>之间的内容。
将html文档中body标签下的内容分离出来之后,在html文档中,body标签下的内容即为空,而将所分离出的body标签下的内容作为一个单独的组件。
步骤S150,将进行内容分离后的所述html文档和所述组件分别传输至所述终端。
将进行内容分离后的html文档和以body标签下的内容所形成的组件分别传输至终端,从而,即使在html文档的传输过程中被植入例如广告的其他内容,而作为决定所请求页面显示内容的body标签下的内容并没有受到影响。
步骤S170,在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除。
步骤S190,将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。
对于html文档中的标签,例如html标签、head标签、body标签、script标签、style标签等。其中,
Html标签,文件申明,让浏览器知道这是一个html;head标签,出现在html文档的开头,提供html文档的整体资讯;body标签,定义了html文档的主题,其中body标签下的内容决定了html文档所对应页面中显示的内容,即用户所看到的内容,可以包括文本、图片、音频、视频等各种内容;script标签,用于定义脚本,script标签下的呢绒可以包含脚本语句,也可以通过src属性指向外部脚本文件;style标签,用于为html文档定义样式信息。
在步骤S170之前,对设定标签进行约定,例如在进行网页开发时,按照所设定的标签进行网页开发,从而,服务器所存储的页面的html文档中仅包括设定标签,而不包括设定标签外的其他标签。在一具体实施例中,由于html文档中包括基本标签,即:html标签、meta标签、head标签、script标签、style标签以及body标签,则将上述所列举的基本标签约定为html标签、meta标签、head标签、script标签、style标签以及body标签。从而,在步骤S170中,终端在接收到html文档之后,遍历所接收到的html文档,如果html文档中包括所设定标签外的其他标签,例如广告标签:如img标签、video标签、canvas标签、div标签、iframe标签,则说明这些其他标签时在html文档传输过程中被植入的,从而,将这些其他标签从html文档中移除,并将这些其他标签下的内容也对应移除。从而实现被植入内容的移除。
在其他实施例中,为了避免用户在访问某一网站中的页面时,在用户的终端中显示被植入的内容,则在进行网站中页面的开发过程中,进行设定标签的约定,并在向终端传输页面数据的过程中,将所约定的设定标签传输至终端,例如将所约定的设定标签写入脚本中,并将该脚本作为页面的脚本文件,对应的,在该脚本文件中写入进行html文档遍历的脚本以及移除设定标签外其他标签及对应内容的脚本,从而,在终端接收到脚本文件之后,通过脚本文件中的脚本进行html文档的遍历,并将html文档中,除设定标签外的其他标签及其他标签所对应内容从html文档中移除。
当然,如果终端遍历所接收到的html文档中不包括设定标签外的其他标签,则说明html文档在传输的过程中没有被植入内容,则执行步骤S190,将组件挂载在html文档的body标签下,并根据进行挂载得到的html文档进行页面的显示。
通过服务端在进行html文档的传输前,将html文档中body标签下的内容从html文档中分离出来作为一个组件,并将进行内容分离后的html文档和组件分别传输至终端;而在终端接收到所传输的html文档和组件之后,先对所接收到的html文档进行遍历,从而出去所接收到的html文档中除设定标签外的其他标签以及对应的内容,从而可以将终端所接收到的html文档中在传输过程中所被植入的内容从html文档中移除,然后再将组件挂载在进行移除之后的html文档的body标签下,得到处理后的html文档,以使终端的浏览器根据处理后的html文档进行页面的显示。由于页面显示的内容由body标签下的内容决定,即将body标签下的内容分离出又重新挂载在body标签下,并不会影响页面中内容的显示,从而,通过本公开的技术方案,一方面保证了页面的准确显示,另一方面,如果html文档在传输过程中被植入内容,也可以将内容继续移除,从而在终端中不显示所植入的内容,保证了用户体验。
在一实施例中,如图4所示,步骤S130包括:
步骤S131,从所述html文档中提取所述body标签中的内容,并将所述body标签中的内容从所述html文档中移除,得到移除后的html文档。
步骤S132,将所提取的所述body标签中的内容作为一组件放入所述所请求页面的脚本文件中,所述脚本文件是所述服务器响应于所述HTTP请求所获得的。
在服务器接收到终端所发送的HTTP请求后,对应地获取所请求页面的页面数据,即html文档、脚本文件以及CSS文件。从而,在本实施例中中,在布置S132中,将从html文档中所分离出来的body标签下的内容,作为一个组件,放入脚本文件中。从而,组件随着脚本文件一起被传输终端。
在该实施例中,步骤S150包括:
步骤S151,将所述移除后的html文档和被放入所述组件的所述脚本文件分别传输至所述终端。
在一实施例中,如图5所示,步骤S151包括:
步骤S210,根据所述HTTP请求,所述服务器通过HTTP传输协议向所述终端传输所述移除后的html文档。
步骤S230,接收所述终端所发送的脚本请求,所述脚本请求是根据所述终端在所接收到所述html文档中所解析到script标签的内容而发送的。、
步骤S250,响应于所述脚本请求向所述终端传输所述被放入所述组件的所述脚本文件。
即在终端接收到服务端所发送的移除后的html文档后,对html文档进行解析,以构建DOM树,而在解析的过程中,当解析到html文档中的script标签时,则对应的根据所解析到标签下的内容向服务器发起脚本请求。在本实施例中,script标签下的脚本是指向外部脚本文件的,即服务器所获取到的脚本文件。
在一实施例中,终端向服务器发送脚本请求是基于所解析到的script标签来进行脚本请求的发送的。即根据所解析到script标签下的内容,标签下的内容指示了所要请求脚本文件的文件表示,从而终端根据所解析到的脚本文件标识向服务器发起脚本请求,对应地,服务器接收到脚本请求之后,向终端传输放有组件的脚本文件。
在一具体实施例中,为了减少终端向服务器发起请求的次数,将页面数据中的脚本文件进行合并,从而,终端仅需要发起一次脚本请求,即可获取到全部的脚本文件,用于继续页面的加载。
在一实施例中,为了保证终端在接收到服务器所传输的html文档之后,先向服务器请求脚本文件,在终端接收到服务器所传输的html文档后,根据html文档确定资源请求的优先级。对于终端而言,在接收到html文档之后,所还需要向服务器请求的文件包括脚本文件和CSS文件,由于脚本文件中的某一个脚本文件中包括了由body标签下的内容所形成的组件,从而,将请求脚本文件设定在资源优先级的首位,终端根据所设定的资源优先级向服务器发起资源请求,即先向服务器请求脚本文件,再向服务器请求CSS文件。
在一实施例中,如图6所示,步骤S190之后,所述方法还包括:
步骤S310,根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
对于终端而言,向服务器发送HTTP请求是为了在终端中显示所请求网页。从而,在本实施例中,在终端将所分离出的body标签下的内容重新挂载到html文档之后,则需要根据处理之后的html文档进行页面的渲染显示。
在一实施例中,如图7所示,步骤S310包括:
步骤S311,解析所述处理后的html文档构建DOM树和获得所述页面的CSS文件。
步骤S313,根据所述DOM树和所述CSS文件构建得到渲染树。
步骤S315,渲染所述渲染树,实现在所述终端上显示所述页面。
对于页面的显示,是基于所html文档构建DOM树,
其中,DOM(Document Object Model,文档对象模型)树是根据html文档来构建的。
CSS文件用于构造CSSOM(CSS Object ModelCSS,对象模型)树。具体而言,在步骤S313中,渲染树是根据所构建的DOM树和CSSOM树而构建得到的。
当构建好渲染树之后,终端的浏览器即可以知道页面中有哪些节点,各个节点的CSS定义以及它们的从属关系。从而,浏览器根据渲染树计算出每个节点在屏幕中的位置,并根据所计算出的位置,遍历渲染树,从而在浏览器的UI后端绘制每个节点,进行渲染树的渲染,实现在终端的浏览器上显示页面。
下述为本公开***长实施例,可以用于执行本公开上述的页面数据传输的控制方法实施例。对于本公开***实施例中未披露的细节,请参照本公开页面数据传输的控制方法实施例。
图8是根据一示例性实施例示出的一种页面数据传输的控制***的框图,该页面数据传输的控制***可以用于执行上述方法实施例中任一所示的页面数据传输的控制方法的全部或者部分步骤。如图8所示,该页面数据传输的控制***,应用于由服务器和至少一终端构成的网页传输***,其中所述服务器300包括:
获取模块110,被配置为:响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档。
分离模块130,被配置为:从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件。
传输模块150,被配置为:将进行内容分离后的所述html文档和所述组件分别传输至所述终端。
所述终端100包括:
遍历模块170,被配置为:在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除。
挂载模块190,被配置为:将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。
上述装置中各个模块的功能和作用的实现过程具体详见上述页面数据传输的控制方法中对应步骤的实现过程,在此不再赘述。
可以理解,这些模块可以通过硬件、软件、或二者结合来实现。当以硬件方式实现时,这些模块可以实施为一个或多个硬件模块,例如一个或多个专用集成电路。当以软件方式实现时,这些模块可以实施为在一个或多个处理器上执行的一个或多个计算机程序,例如图2的处理器218所执行的存储在存储器204中的程序。
在一实施例中,所述分离模块130,包括:
移除单元,被配置为:从所述html文档中提取所述body标签中的内容,并将所述body标签中的内容从所述html文档中移除,得到移除后的html文档。
组件放入单元,被配置为:将所提取的所述body标签中的内容作为一组件放入所述所请求页面的脚本文件中,所述脚本文件是所述服务器响应于所述HTTP请求所获得的。
所述传输模块150,包括:
传输单元,被配置为:将所述移除后的html文档和被放入所述组件的所述脚本文件分别传输至所述终端。
在一实施例中,所述传输单元,包括:
Html文档传输单元,被配置为:根据所述HTTP请求,所述服务器通过HTTP传输协议向所述终端传输所述移除后的html文档。
脚本请求接收单元,被配置为:接收所述终端所发送的脚本请求,所述脚本请求是根据所述终端在所接收到所述html文档中所解析到script标签的内容而发送的。
脚本文件传输单元,被配置为:响应于所述脚本请求向所述终端传输所述被放入所述组件的所述脚本文件。
渲染模块,被配置为:根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
在一实施例中,所述终端还包括:
渲染模块,被配置为:根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
在一实施例中,所述渲染模块,包括:
解析单元,被配置为:解析所述处理后的html文档构建DOM树和获得所述页面的CSS文件。
渲染树构建单元,被配置为:根据所述DOM树和所述CSS文件构建得到渲染树。
渲染单元,被配置为:渲染所述渲染树,实现在所述终端上显示所述页面。
上述装置中各个模块的功能和作用的实现过程具体详见上述页面数据传输的控制方法中对应步骤的实现过程,在此不再赘述。
可选的,本公开还提供一种页面数据传输的控制设备,该页面数据传输的控制设备可以用于图1所示实施环境的终端100和服务器300中,执行上述任一实施例所示的页面数据传输的控制方法的全部或者部分步骤。如图9所示,所述页面数据传输的控制设备1000包括:
处理器1001;及
存储器1002,存储器1002上存储有计算机可读指令,计算机可读指令被处理器1001执行时实现以上方法实施中任一项的方法。
其中,可执行指令被处理器1001执行时实现以上任一实施例中的方法。其中可执行指令比如是计算机可读指令,在处理器1001执行时,处理器通过与存储器之间所连接的通信线/总线1003读取存储于存储器中的计算机可读指令。
该实施例中的装置的处理器执行操作的具体方式已经在有关该页面数据传输的控制方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上任一方法实施例中的方法。其中计算机可读存储介质例如包括计算机程序的存储器204,上述指令可由装置200的处理器218执行以实现上述的方法。
该实施例中的处理器执行操作的具体方式已经在有关该页面数据传输的控制方法的实施例中执行了详细描述,此处将不做详细阐述说明
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种页面数据传输的控制方法,其特征在于,应用于由服务器和至少一终端构成的网页传输***,包括:
响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档;
从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件;
将进行内容分离后的所述html文档和所述组件分别传输至所述终端;
在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除;
将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。
2.根据权利要求1所述的方法,其特征在于,所述从所述html文档中分离出body标签所对应的内容,并将所分离出的内容作为一组件,包括:
从所述html文档中提取所述body标签中的内容,并将所述body标签中的内容从所述html文档中移除,得到移除后的html文档;
将所提取的所述body标签中的内容作为一组件放入所述所请求页面的脚本文件中,所述脚本文件是所述服务器响应于所述HTTP请求所获得的;
所述将进行内容分离后的所述html文档和所述组件分别传输至所述终端,包括:
将所述移除后的html文档和被放入所述组件的所述脚本文件分别传输至所述终端。
3.根据权利要求2所述的方法,其特征在于,所述将所述移除后的html文档和被放入所述组件的所述脚本文件分别传输至所述终端,包括:
根据所述HTTP请求,所述服务器通过HTTP传输协议向所述终端传输所述移除后的html文档;
接收所述终端所发送的脚本请求,所述脚本请求是根据所述终端在所接收到所述html文档中所解析到script标签的内容而发送的;
响应于所述脚本请求向所述终端传输所述被放入所述组件的所述脚本文件。
4.根据权利要求1所述的方法,其特征在于,将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档之后,所述方法还包括:
根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
5.根据权利要求4所述的方法,其特征在于,所述根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面,包括:
解析所述处理后的html文档构建DOM树和获得所述页面的CSS文件;
根据所述DOM树和所述CSS文件构建得到渲染树;
渲染所述渲染树,实现在所述终端上显示所述页面。
6.一种页面数据传输的控制***,其特征在于,应用于由服务器和至少一终端构成的网页传输***,所述服务器包括:
获取模块,被配置为:响应于终端发起的HTTP请求,服务器获取所述HTTP请求所请求页面的html文档;
分离模块,被配置为:从所述html文档中分离出body标签下的内容,并将所分离出的内容作为一组件;
传输模块,被配置为:将进行内容分离后的所述html文档和所述组件分别传输至所述终端;
所述终端包括:
遍历模块,被配置为:在所述终端上,遍历所接收到的所述html文档,以将所述html文档中除设定标签外的其它标签以及所对应的内容移除;
挂载模块,被配置为:将所述组件挂载在进行遍历后的所述html文档的body标签内,得到处理后的html文档,以根据所述处理之后的html文档显示所述页面。
7.根据权利要求6所述的***,其特征在于,所述分离模块,包括:
移除单元,被配置为:从所述html文档中提取所述body标签中的内容,并将所述body标签中的内容从所述html文档中移除,得到移除后的html文档;
组件放入单元,被配置为:将所提取的所述body标签中的内容作为一组件放入所述所请求页面的脚本文件中,所述脚本文件是所述服务器响应于所述HTTP请求所获得的;
所述传输模块,包括:
传输单元,被配置为:将所述移除后的html文档和被放入所述组件的所述脚本文件分别传输至所述终端。
8.根据权利要求7所述的***,其特征在于,所述传输单元,包括:
Html文档传输单元,被配置为:根据所述HTTP请求,所述服务器通过HTTP传输协议向所述终端传输所述移除后的html文档;
脚本请求接收单元,被配置为:接收所述终端所发送的脚本请求,所述脚本请求是根据所述终端在所接收到所述html文档中所解析到script标签的内容而发送的;
脚本文件传输单元,被配置为:响应于所述脚本请求向所述终端传输所述被放入所述组件的所述脚本文件;
渲染模块,被配置为:根据所述处理后的html文档进行页面渲染,以在所述终端上显示所述页面。
9.一种页面数据传输的控制设备,其特征在于,包括:
处理器;及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至5中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的方法。
CN201910533716.0A 2019-06-19 2019-06-19 页面数据传输的控制方法和相关设备 Active CN110381118B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910533716.0A CN110381118B (zh) 2019-06-19 2019-06-19 页面数据传输的控制方法和相关设备
PCT/CN2019/118041 WO2020253057A1 (zh) 2019-06-19 2019-11-13 页面数据传输的控制方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910533716.0A CN110381118B (zh) 2019-06-19 2019-06-19 页面数据传输的控制方法和相关设备

Publications (2)

Publication Number Publication Date
CN110381118A true CN110381118A (zh) 2019-10-25
CN110381118B CN110381118B (zh) 2022-03-04

Family

ID=68249299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910533716.0A Active CN110381118B (zh) 2019-06-19 2019-06-19 页面数据传输的控制方法和相关设备

Country Status (2)

Country Link
CN (1) CN110381118B (zh)
WO (1) WO2020253057A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020253057A1 (zh) * 2019-06-19 2020-12-24 平安普惠企业管理有限公司 页面数据传输的控制方法及相关设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101821764A (zh) * 2007-10-12 2010-09-01 微软公司 自动操纵web文档集合
CN102184189A (zh) * 2011-04-18 2011-09-14 北京理工大学 基于dom节点文本密度的网页核心块确定方法
CN102469113A (zh) * 2010-11-01 2012-05-23 北京启明星辰信息技术股份有限公司 一种安全网关及其转发网页的方法
CN102546576A (zh) * 2010-12-31 2012-07-04 北京启明星辰信息技术股份有限公司 一种网页挂马检测和防护方法、***及相应代码提取方法
CN102779169A (zh) * 2012-06-27 2012-11-14 江苏新瑞峰信息科技有限公司 一种基于html标签的网页正文提取方法及装置
US20130238978A1 (en) * 2012-03-08 2013-09-12 Samsung Electronics Co. Ltd. Method and apparatus for extracting body on web page
CN103546498A (zh) * 2012-07-09 2014-01-29 百度在线网络技术(北京)有限公司 一种为移动终端提供访问网页的方法与设备
CN103593414A (zh) * 2013-10-29 2014-02-19 北京奇虎科技有限公司 一种浏览器中网页的展现方法和装置
CN105183801A (zh) * 2015-08-25 2015-12-23 北京信息科技大学 网页正文抽取方法及装置
CN106055667A (zh) * 2016-06-06 2016-10-26 北京林业大学 一种基于文本‑标签密度的网页核心内容提取方法
CN106547895A (zh) * 2016-11-03 2017-03-29 北京锐安科技有限公司 一种网页信息的提取方法及装置
CN108763591A (zh) * 2018-06-21 2018-11-06 湖南星汉数智科技有限公司 一种网页正文提取方法、装置、计算机装置及计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6199082B1 (en) * 1995-07-17 2001-03-06 Microsoft Corporation Method for delivering separate design and content in a multimedia publishing system
US8713425B2 (en) * 2001-04-20 2014-04-29 Progme Corporation Audio/video program-related hyperlink printer
CN102065106B (zh) * 2009-11-16 2014-05-28 中国电信股份有限公司 Web流量梳理器和终端访问Web网页的方法及***
CN102693280B (zh) * 2012-04-28 2014-08-13 广州市动景计算机科技有限公司 网页浏览方法、WebApp框架、执行JavaScript方法及装置、移动终端
CN110381118B (zh) * 2019-06-19 2022-03-04 平安普惠企业管理有限公司 页面数据传输的控制方法和相关设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101821764A (zh) * 2007-10-12 2010-09-01 微软公司 自动操纵web文档集合
CN102469113A (zh) * 2010-11-01 2012-05-23 北京启明星辰信息技术股份有限公司 一种安全网关及其转发网页的方法
CN102546576A (zh) * 2010-12-31 2012-07-04 北京启明星辰信息技术股份有限公司 一种网页挂马检测和防护方法、***及相应代码提取方法
CN102184189A (zh) * 2011-04-18 2011-09-14 北京理工大学 基于dom节点文本密度的网页核心块确定方法
US20130238978A1 (en) * 2012-03-08 2013-09-12 Samsung Electronics Co. Ltd. Method and apparatus for extracting body on web page
CN102779169A (zh) * 2012-06-27 2012-11-14 江苏新瑞峰信息科技有限公司 一种基于html标签的网页正文提取方法及装置
CN103546498A (zh) * 2012-07-09 2014-01-29 百度在线网络技术(北京)有限公司 一种为移动终端提供访问网页的方法与设备
CN103593414A (zh) * 2013-10-29 2014-02-19 北京奇虎科技有限公司 一种浏览器中网页的展现方法和装置
CN105183801A (zh) * 2015-08-25 2015-12-23 北京信息科技大学 网页正文抽取方法及装置
CN106055667A (zh) * 2016-06-06 2016-10-26 北京林业大学 一种基于文本‑标签密度的网页核心内容提取方法
CN106547895A (zh) * 2016-11-03 2017-03-29 北京锐安科技有限公司 一种网页信息的提取方法及装置
CN108763591A (zh) * 2018-06-21 2018-11-06 湖南星汉数智科技有限公司 一种网页正文提取方法、装置、计算机装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李瑾: "精确web信息抽取***的设计与实现", 《中国优秀硕士学位论文全文数据库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020253057A1 (zh) * 2019-06-19 2020-12-24 平安普惠企业管理有限公司 页面数据传输的控制方法及相关设备

Also Published As

Publication number Publication date
WO2020253057A1 (zh) 2020-12-24
CN110381118B (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
US11080493B2 (en) Translation review workflow systems and methods
KR101824222B1 (ko) 동적 컨텐츠 및 스테일 컨텐츠를 포함하는 웹사이트들의 고속 렌더링
US9053201B2 (en) Communication with a web compartment in a client application
US10997360B2 (en) Page display method, device, and system, and page display assist method and device
CN100462964C (zh) 一种网页数据的更新显示方法
JP6488508B2 (ja) ウェブページのアクセス方法、装置、デバイス及びプログラム
US9736143B2 (en) Customized log-in experience
KR102045602B1 (ko) 애플리케이션 코드 실행이 없는 라이브 타일들
US9426202B2 (en) Transforming application cached template using personalized content
US8943608B2 (en) Document server and client device document viewer and editor
JP2014029701A (ja) モバイル装置のための文書処理
US20170192941A1 (en) Computer-Automated Generation of Application Deep Links
KR20090102252A (ko) 사용자 설정형 맞춤 컨텐츠 제공 시스템 및 그 방법
EP4246312A1 (en) Content display method and terminal device
CN107229653B (zh) 伪静态网页生成方法和装置
CN113360106B (zh) 一种网页打印方法和装置
CN110381118A (zh) 页面数据传输的控制方法和相关设备
US20100023888A1 (en) Method and apparatus for controlling focus of application
US8818983B1 (en) Synchronization of search engines
CN103390043A (zh) 一种显示网络数据的方法及显示网络数据的装置
CN105791360A (zh) 跨设备的浏览器功能分享方法和***
KR101460788B1 (ko) 웹 어플리케이션의 화면 구성 방법, 서버 및 컴퓨터 판독 가능한 기록 매체
JP2009104595A (ja) ウェブページ接続システムおよびその接続方法
KR101556998B1 (ko) 전자문서 서비스 시스템 및 방법
CN115640094A (zh) 页面展示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information

Address after: 201, room 518000, building A, No. 1, front Bay Road, Qianhai Shenzhen Guangdong Shenzhen Hong Kong cooperation zone (Qianhai business secretary)

Applicant after: Pingan Pu Hui Enterprise Management Co., Ltd.

Address before: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A

Applicant before: Pingan Pu Hui Enterprise Management Co., Ltd.

CB02 Change of applicant information
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant