CN111274521B - 文档html页面展示方法、装置和电子设备 - Google Patents

文档html页面展示方法、装置和电子设备 Download PDF

Info

Publication number
CN111274521B
CN111274521B CN202010352916.9A CN202010352916A CN111274521B CN 111274521 B CN111274521 B CN 111274521B CN 202010352916 A CN202010352916 A CN 202010352916A CN 111274521 B CN111274521 B CN 111274521B
Authority
CN
China
Prior art keywords
paragraph
access
factor
html page
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010352916.9A
Other languages
English (en)
Other versions
CN111274521A (zh
Inventor
王盛华
李艳红
王建新
晋海峰
徐柱芝
刘宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Renhe Huizhi Information Technology Co ltd
Original Assignee
Beijing Renhe Huizhi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Renhe Huizhi Information Technology Co ltd filed Critical Beijing Renhe Huizhi Information Technology Co ltd
Priority to CN202010352916.9A priority Critical patent/CN111274521B/zh
Publication of CN111274521A publication Critical patent/CN111274521A/zh
Application granted granted Critical
Publication of CN111274521B publication Critical patent/CN111274521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明的实施例提供了一种文档HTML页面展示方法、装置和电子设备,涉及计算机技术领域。本发明实施例提供的文档HTML页面展示方法、装置和电子设备,在获取文档以初始HTML页面展示时每个段落的阅读访问计量信息后,根据每个段落的阅读访问计量信息,计算得到每个段落的访问计量因子,根据每个段落的访问计量因子,调整每个段落的样式显示属性,将调整后的每个段落的样式显示属性进行加载,形成目标HTML页面,以对文档进行展示,从而将HTML页面阅读展示与文档段落的访问计量关联,改变了HTML页面阅读的展示形式,实现了对用户的关注段落的重点推荐,提高了HTML页面可阅读性。

Description

文档HTML页面展示方法、装置和电子设备
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种文档HTML页面展示方法、装置和电子设备。
背景技术
超文本标记语言(Hypertext Marked Language,HTML)是一种建立网页文件的语言,通过标记式的指令(Tag),将影像、声音、图片、文字动画、影视等内容显示出来。由于HTML具有简易性、可扩展性等优势,使得HTML在线阅读越来越普及,但在进行阅读时,HTML页面对于长文档的展示,其篇幅会很长,全篇都是相同的展示形式,无关注重点的区分,从而导致可阅读性较差,很容易丢失掉一些浅阅读的用户人群。
发明内容
基于上述研究,本发明提供了一种文档HTML页面展示方法、装置和电子设备,以改善上述问题。
本发明的实施例可以这样实现:
第一方面,实施例提供一种文档HTML页面展示方法,包括:
获取文档以初始HTML页面展示时每个段落的阅读访问计量信息;
根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子,并根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性;
将调整后的每个所述段落的样式显示属性进行加载,形成目标HTML页面,以对所述文档进行展示。
在可选的实施方式中,所述阅读访问计量信息包括访问次数以及每次访问的访问时长,所述根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子的步骤,包括:
针对每个所述段落,根据预先设置的可忽略时长区间,判断该段落的每次访问的时长是否在所述可忽略时长区间内,将访问时长未在所述可忽略时长区间的访问进行过滤,得到该段落的有效访问次数以及每次有效访问的时长;
根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子,并根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子;
根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子。
在可选的实施方式中,所述根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子的步骤,包括:
将所述初始HTML页面中的所有段落的有效访问次数进行求和,并除以段落数,得到所述所有段落的有效访问平均次数;
针对每个所述段落,基于该段落的有效访问次数以及所述有效访问平均次数,得到该段落的有效访问次数因子。
在可选的实施方式中,所述根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子的步骤,包括:
针对每个所述段落,基于该段落每次有效访问的时长,得到该段落的累计停留时长;
根据该段落的累计停留时长以及该段落的有效访问次数,得到该段落的平均停留时长因子。
在可选的实施方式中,所述根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子的步骤,包括:
将每个所述段落的有效访问次数因子以及平均停留时长因子进行加权,得到每个所述段落的初始访问计量因子;
对每个所述段落的初始访问计量因子进行归一化处理,得到每个所述段落的访问计量因子。
在可选的实施方式中,所述根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性的步骤,包括:
针对每个所述段落,根据该段落的访问计量因子调整该段落的CSS样式显示值,得到该段落调整后的行高、字号以及透明度。
在可选的实施方式中,所述初始HTML页面中包括每个段落的ID信息,所述获取文档以初始HTML页面展示时每个段落的阅读访问计量信息的步骤包括:
根据每个所述段落的ID信息,监测用户访问每个所述段落的次数以及每次访问的时长;
根据用户访问每个所述段落的次数以及每次访问的时长,得到每个所述段落的阅读访问计量信息。
在可选的实施方式中,所述方法还包括:
针对文档中的每个段落,根据该段落的推荐程度值,对该段落的样式显示属性进行设置;
根据设置后的每个段落的样式显示属性,形成推荐HTML页面,以对该文档进行展示。
第二方面,实施例提供一种文档HTML页面展示装置,包括信息获取模块、调整模块以及展示模块;
所述信息获取模块用于获取文档以初始HTML页面展示时每个段落的阅读访问计量信息;
所述调整模块用于根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子,并根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性;
所述展示模块用于将调整后的每个所述段落的样式显示属性进行加载,形成目标HTML页面,以对所述文档进行展示。
第三方面,实施例提供一种电子设备,包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述电子设备执行前述实施方式中任意一项所述的文档HTML页面展示方法。
第四方面,实施例提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被执行时实现前述实施方式中任意一项所述的文档HTML页面展示方法。
本发明实施例提供的文档HTML页面展示方法、装置和电子设备,在获取文档以初始HTML页面展示时每个段落的阅读访问计量信息后,根据每个段落的阅读访问计量信息,计算得到每个段落的访问计量因子,根据每个段落的访问计量因子,调整每个段落的样式显示属性,然后将调整后的每个段落的样式显示属性进行加载,形成目标HTML页面,以对文档进行展示,从而将HTML页面阅读展示与文档段落的访问计量关联,改变了HTML页面阅读的展示形式,实现了对用户的关注段落的重点推荐,提高了HTML页面可阅读性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的电子设备的一种方框示意图。
图2为本发明实施例所提供文档HTML页面展示方法的一种流程示意图。
图3为本发明实施例所提供文档HTML页面展示方法的子步骤的流程示意图之一。
图4为本发明实施例所提供文档HTML页面展示方法的子步骤的流程示意图之二。
图5为本发明实施例所提供文档HTML页面展示方法的子步骤的流程示意图之三。
图6为本发明实施例所提供文档HTML页面展示方法的子步骤的流程示意图之四。
图7为本发明实施例所提供文档HTML页面展示方法的子步骤的流程示意图之五。
图8为本发明实施例所提供文档HTML页面展示装置的一种方框示意图。
图标:100-电子设备;10-文档HTML页面展示装置;11-信息获取模块;12-调整模块;13-展示模块;20-存储器;30-处理器;40-通信单元;50-显示单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
随着HTML在线阅读越来越普及,越来越多的人采用HTML页面进行阅读,但是HTML页面对于长文档(例如科技期刊论文)的展示,其篇幅会很长,且无重点推荐,导致其可阅读性较差,很容易丢失掉一些浅阅读的用户人群。
基于上述研究,本实施例提供了一种文档HTML页面展示方法,以改善上述问题。
请参考图1,本实施例提供的文档HTML页面展示方法应用于图1所示的电子设备100,由图1所示的电子设备100执行本实施例所提供的文档HTML页面展示方法。如图1所示,本实施例所提供的电子设备100包括文档HTML页面展示装置10、存储器20、处理器30、通信单元40及显示单元50。
所述存储器20、处理器30及通信单元40各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述文档HTML页面展示装置10包括至少一个可以软件或固件(firmware)的形式存储于所述存储器20中或固化在所述电子设备100的操作***(operating system,OS)中的软件功能模块。所述处理器30用于执行所述存储器20中存储的可执行模块,例如所述文档HTML页面展示装置10所包括的软件功能模块及计算机程序等。
其中,所述存储器20可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器20用于存储程序或者数据。
所述处理器30可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述通信单元40用于通过网络建立所述电子设备100与其他电子设备之间的通信连接,并用于通过所述网络收发数据。
所述显示单元50在所述电子设备100与用户之间提供一个交互界面(例如用户操作界面)用于显示网页信息。具体地,该显示单元50可以向用户显示页面及视频输出,这些输出的内容可包括文字、图形、视频及其任意组合。一些输出结果是对应于一些用户界面对象。在本实施例中,所述显示单元50可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处产生的触控操作,并将该感应到的触控操作交由处理器进行计算和处理。在本实施例中,显示单元50的具体实例包括但并不限于液晶显示器或发光聚合物显示器。
可以理解,图1所示的结构仅为示意,所述电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
基于上述电子设备100的实现架构,请结合参阅图2,图2为本实施例所提供的文档HTML页面展示方法的流程示意图。下面对图2所示的流程示意图进行详细阐述。
步骤S10:获取文档以初始HTML页面展示时中每个段落的阅读访问计量信息。
步骤S20:根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子,并根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性。
步骤S30:将调整后的每个所述段落的样式显示属性进行加载,形成目标HTML页面,以对所述文档进行展示。
本实施例所提供的文档HTML页面展示方法,通过获取文档在初始HTML页面展示时每个段落的阅读访问计量信息,并根据每个段落的阅读访问计量信息,计算每个段落的访问计量因子,在得到每个段落的访问计量因子后,根据每个段落的访问计量因子,调整每个段落的样式显示属性,然后将调整后的每个段落的样式显示属性进行加载,形成目标HTML页面,以对文档进行展示,从而将HTML页面阅读展示与文档段落的访问计量关联,实现了对HTML页面中用户的关注段落进行重点展示,改变了HTML阅读的展示形式,提高了HTML的可阅读性,改善了用户体验。
需要说明的是,在本实施例中,初始HTML页面指的是文档段落的样式显示属性未调整,即文档正常显示的HTML页面。
可选的,在本实施例中,对于已用HTML页面进行展示的文档,该HTML页面即为初始HTML页面,可直接获取该初始HTML页面中该文档的每个段落的阅读访问计量信息。而对于未用HTML页面进行展示的文档,则可将先该文档进行结构化和碎片化处理,得到文档所对应的XML文件,然后再将该XML文件以HTML页面(即初始HTML页面)的形式进行展示,供用户在线阅读访问,从而以获取文档以初始HTML页面展示时每个段落的阅读访问计量信息。
由于以HTML页面进行展示的文档,其每个段落都具有ID信息,即HTML页面中包括每个段落的ID信息,因此,在本实施例中,可基于每个段落的ID信息获取阅读访问计量信息。可选的,请结合参阅图3,在本实施例中,所述获取文档以初始HTML页面展示时每个段落的阅读访问计量信息的步骤包括步骤S11至步骤S12。
步骤S11:根据每个所述段落的ID信息,监测用户访问每个所述段落的次数以及每次访问的时长。
步骤S12:根据用户访问每个所述段落的次数以及每次访问的时长,得到每个所述段落的阅读访问计量信息。
其中,以初始HTML页面展示的文档,可根据每个段落在初始HTML页面的ID信息,监测用户浏览阅读时的行为,即监测用户访问每个段落的次数以及每次访问的时长,并根据访问每个段落的次数以及每次访问的时长,得到每个段落的阅读访问计量信息。
在具体地应用场景中,只需要监测用户在初始HTML页面中点击或滑动某个段落的 次数以及停留在该段落的时长,便可以获取得到用户访问该段落的次数以及每次访问的时 长,进而得到该段落的阅读访问计量信息,得到的阅读访问计量信息包括访问次数以及每 次访问的访问时长。针对于第i个段落,其阅读访问计量信息可以表示为
Figure 846111DEST_PATH_IMAGE001
,其中,p i 为第i个段落的访问次数,t ij 1jp i )为第j次访问的时长。
可以理解的,为了便于阅读,段落的ID信息在HTML页面显示时为隐藏状态。
需要说明的是,在本实施例中,段落的阅读访问计量信息为不断更新状态,用户每访问一次,段落的阅读访问计量信息则更新一次。
在获取得到每个段落的阅读访问计量信息后,即可根据每个段落的阅读访问计量信息,计算每个段落的访问计量因子。
可选的,请结合参阅图4,所述根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子的步骤,包括步骤S21至步骤S23。
步骤S21:针对每个所述段落,根据预先设置的可忽略时长区间,判断该段落的每次访问的时长是否在所述可忽略时长区间内,将访问时长未在所述可忽略时长区间的访问进行过滤,得到该段落的有效访问次数以及每次有效访问的时长。
步骤S22:根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子,并根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子。
步骤S23:根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子。
其中,段落的长度不同,阅读的时长则不同,为了提高数据处理的准确性,可选的,在本实施例中,可基于每个段落的长度设置可忽略时长区间。
在一种示例性的实施方式中,基于每个段落的长度设置可忽略时长区间的步骤包括:
首先,获取所有段落中段落长度的最大值,针对每个段落,根据该段落的长度以及段落长度的最大值,得到该段落的段落长度因子。
然后,针对每个段落,根据该段落的段落长度因子、单位段落长度最小可计数时长以及单位段落长度最大可计数时长,设置该段落的可忽略时长区间。
例如,所有段落中段落长度的最大值为l max,假设第i个段落的长度为l i 则第i个 段落的段落长度因子为
Figure 232093DEST_PATH_IMAGE002
,在得到第i个段落的段落长度因子L i 后,假设单位段落长 度最小可计数时长为
Figure 746251DEST_PATH_IMAGE003
,单位段落长度最大可计数时长
Figure 610302DEST_PATH_IMAGE004
,则第i个段落的可忽略时长 区间为
Figure 96778DEST_PATH_IMAGE005
在得到每个段落的可忽略时长区间,采用首尾过滤的方式,对访问次数进行过滤,即判断每个段落的每次访问的时长是否在每个段落的可忽略时长区间内,若某次访问的时长不在可忽略时长区间内,则将该访问进行过滤,从而得到每个段落的有效访问次数以及每次有效访问的时长。
例如,第i个段落的阅读访问计量信息的数据集为
Figure 388082DEST_PATH_IMAGE006
,可忽略时长区间为
Figure 121028DEST_PATH_IMAGE007
,在访问次数进行过滤时,则需判断数据集
Figure 788769DEST_PATH_IMAGE008
中的各值是否在 可忽略时长区间为
Figure 926490DEST_PATH_IMAGE009
,将未在可忽略时长区间的值进行过滤,则可以得到 第i个段落的有效访问次数,第i个段落的有效访问次数可以表示为
Figure 388695DEST_PATH_IMAGE010
,其中,p vi 为 第i个段落的有效访问次数,t ij (1jp vi )为第j次有效访问的时长。
在获取得到每个段落的有效访问次数以及每次有效访问的时长后,则可根据每个段落的有效访问次数,得到每个段落的有效访问次数因子,根据每个段落每次有效访问的时长,得到每个段落的平均停留时长因子。
在可选的实施方式中,请结合参阅图5,所述根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子的步骤,包括步骤S221至步骤S222。
步骤S221:将所述初始HTML页面中的所有段落的有效访问次数进行求和,并除以段落数,得到所述所有段落的有效访问平均次数。
步骤S222:针对每个所述段落,基于该段落的有效访问次数以及所述有效访问平均次数,得到该段落的有效访问次数因子。
可选地,可通过以下公式,获得每个段落的有效访问次数因子:
Figure 611866DEST_PATH_IMAGE011
式中,n为段落总数,N i 为第i个段落的有效访问次数因子。
其中,在得到所有段落的有效访问平均次数后,将每个段落的有效访问次数除以所有段落的有效访问平均次数,即可得到每个段落的有效访问次数因子。
请结合参阅图6,所述根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子的步骤,包括步骤S223至步骤S224。
步骤S223:针对每个所述段落,基于该段落每次有效访问的时长,得到该段落的累计停留时长。
步骤S224:根据该段落的累计停留时长以及该段落的有效访问次数,得到该段落的平均停留时长因子。
其中,对每个段落每次有效访问的时长进行求和,即可得到每个段落的累计停留时长,可选的,可通过以下公式,计算得到每个段落的累计停留时长因子:
Figure 817719DEST_PATH_IMAGE012
式中,T i 为第i个段落的累计停留时长因子,p vi 为第i个段落的有效访问次数,t ij 为第j次有效访问的时长,L i 为第i个段落的段落长度因子。
在得到每个段落的累计停留时长因子后,除以每个段落的有效访问次数,即可以得到每个段落的平均停留时长因子,可选的,可通过以下公式得到每个段落的平均停留时长因子:
Figure 75525DEST_PATH_IMAGE013
式中,
Figure 974211DEST_PATH_IMAGE014
为第i个段落的平均停留时长因子,T i 为第i个段落的累计停留时长因子,p vi 为第i个段落的有效访问次数。
在本实施例中,通过计算每个段落的有效访问次数因子以及平均停留时长因子,可以准确地反映出用户对每个段落的关注度。
在获取得到每个段落的有效访问次数因子以及平均停留时长因子后,即可根据每个段落的有效访问次数因子以及平均停留时长因子,得到每个段落的访问计量因子。
在可选的实施方式中,请结合参阅图7,所述根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子的步骤,包括步骤S231至步骤S232。
步骤S231:将每个所述段落的有效访问次数因子以及平均停留时长因子进行加权,得到每个所述段落的初始访问计量因子。
步骤S232:对每个所述段落的初始访问计量因子进行归一化处理,得到每个所述段落的访问计量因子。
具体地,可通过以下公式得到每个段落的初始访问计量因子:
Figure 684678DEST_PATH_IMAGE015
其中,m i 为第i个段落的初始访问计量因子;
Figure 428643DEST_PATH_IMAGE016
为第i个段落的平均停留时长因子;
Figure 9797DEST_PATH_IMAGE017
为所有段落的平均停留时长因子,
Figure 813805DEST_PATH_IMAGE018
n为段落总数,
Figure 11568DEST_PATH_IMAGE019
反映了第i个段落的平 均停留时长占所有段落的平均停留时长的相对数值;f p 为各段落整体访问次数加权因子,f t 为各段落整体访问时长加权因子,f p f t 可根据实际需求设置;N i 为第i个段落的有效访问次 数因子。
在基于上述过程得到每个段落的初始访问计量因子后,为了避免在基于访问计量因子调整段落的样式显示属性时,超过显示阈值,本实施例对每个段落的初始访问计量因子进行归一化处理,以使每个段落的访问计量因子的值在0-1之间。
可选的,可通过以下公式对每个段落的初始访问计量因子进行归一化处理:
Figure 762487DEST_PATH_IMAGE020
其中,M i 为第i个段落的访问计量因子,m i 为第i个段落的初始访问计量因子;m max为所有段落中的初始访问计量因子的最大值。
可以理解的,在本实施例中,可采用多种方式对每个段落的初始访问计量因子进行归一化处理,不仅限于上述所示的方式。
本实施例通过将每个段落的有效访问次数因子以及平均停留时长因子以加权平均的方式进行结合,得到每个段落的访问计量因子,进而准确反映出了用户对每个段落的关注度,使数据结果更为准确。
在得到每个段落的访问计量因子后,则可根据每个段落的访问计量因子,调整每个段落的样式显示属性。可选的,在本实施例中,每个段落的样式显示属性包括段落显示的行高、字号以及透明度等信息。因此,所述根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性的步骤,包括:
针对每个所述段落,根据该段落的访问计量因子调整该段落的CSS样式显示值,得到该段落调整后的行高、字号以及透明度。
其中,层叠样式表(Cascading Style Sheets,CSS)是一种用来表现HTML(标准通用标记语言的一个应用)等文件样式的计算机语言。CSS为HTML标记语言提供了一种样式描述,定义了其中元素的显示方式,利用它可以实现修改一个小的样式更新与之相关的所有页面元素。因此,可通过调整CSS的显示值,调整HTML页面的显示形式。
具体地,在得到每个段落的访问计量因子后,根据每个段落的访问计量因子调整每个段落默认的CSS显示值,即可对每个段落的样式显示属性进行调整,得到每个段落调整后的行高、字号以及透明度等。
可选的,在对每个段落的行高进行调整时,将每个段落的访问计量因子乘以默认 的CSS定义的行高,即可得到每个段落调整后的行高,即调整后的行高
Figure 929638DEST_PATH_IMAGE021
,其中,H为默认的CSS定义的行高,H i 为第i个段落调整后的行高,M i 为第i个段落的访问计量因子。
在对每个段落的字号进行调整时,将每个段落的访问计量因子乘以默认的CSS定 义的字号大小,即可得到每个段落调整后的字号大小,即调整后的字号大小
Figure 170127DEST_PATH_IMAGE022
,其 中,S为默认的CSS定义的字号大小,S i 为第i个段落调整后的字号大小,M i 为第i个段落的访 问计量因子。
在对每个段落的透明度进行调整时,对每个段落的访问计量因子进行相减,即可 得到每个段落调整后的透明度,即调整后的透明度为
Figure 792869DEST_PATH_IMAGE023
,其中,P i 为第i个段落调 整后的透明度,M i 为第i个段落的访问计量因子。
在基于上述过程,对每个段落的样式显示属性进行调整后,将调整后的每个段落的样式显示属性加载,形成目标HTML页面,以对文档进行展示,进而目标HTML页面可重点展示用户所关注的段落,而对于用户未关注的段落,则可进行隐藏或淡化显示。
可以理解的,若用户需对隐藏或淡化的段落进行阅读时,可重新对隐藏或淡化的段落进行操作,即可用初始的样式显示属性显示隐藏或淡化的段落。
作为一种可选的实施方式,本实施例所提供的文档HTML页面展示方法还可以应用于文档的主动推荐显示,进而本实施所提供的文档HTML页面展示方法还可以包括:
针对文档中的每个段落,根据该段落的推荐程度值,对该段落的样式显示属性进行设置;
根据设置后的每个段落的样式显示属性,形成推荐HTML页面,以对该文档进行展示。
其中,每个段落的推荐程度值,可根据用户需求而设置,例如,若需要重点推荐文档中的某个段落,则可将该段落的推荐程度值设置为高,若对某个段落不需要进行推荐,则可将该段落的推荐程度值设置为低。
在得到文档中每个段落的推荐程度值后,即可基于每个段落的推荐程度值,设置每个段落的样式显示属性。
例如,对于推荐程度高的段落,可将该段落的样式显示属性设置为正常行高(即CSS定义的行高)和不透明,对于推荐程度低的段落,可将段落的样式显示属性设置为行高显示低,透明度高。具体的设置方式可根据实际情况而设定,本实施例不做限制。
在设置每个段落的样式显示属性后,即可根据设置后的段落的样式显示属性形成推荐HTML页面,对文档进行展示。
基于上述阐述,本实施例所提供的文档HTML页面展示方法可向用户提供了三种阅读方式,第一种为以初始HTML页面展示的文档进行阅读,第二种为以目标HTML页面展示的文档进行阅读,第三种为以推荐HTML页面展示的文档进行阅读。为了更清楚的说明本实施例所提供的方案,下面以一具体应用场景进行说明。
当用户需要正常阅读文档时,则可基于初始HTML页面所展示的文档进行阅读,并保存用户阅读文档每个段落的阅读访问计量信息。
当用于需要重点阅读时,则可直接获取文档以初始HTML页面展示时每个段落的阅读访问计量信息,根据每个段落的阅读访问计量信息,计算每个段落的访问计量因子,并根据每个段落的访问计量因子,调整每个段落的样式显示属性,然后将调整后的每个段落的样式显示属性进行加载,形成目标HTML页面,将文档以目标HTML页面进行展示,即基于目标HTML页面进行阅读。
当用户需要推荐阅读时,则可基于推荐HTML页面所展示的文档进行阅读。
可以理解地,在本实施例中,目标HTML页面随段落的阅读访问计量信息更新而更新,即在初始HTML页面展示的文档,其段落的阅读访问计量信息每更新一次,则会形成一新的目标HTML页面。
本实施例所提供的文档HTML页面展示方法,根据文档以初始HTML页面展示时每个段落的访问计量因子,调整每个段落的样式显示属性,进而可根据用户的关注点调整段落的展示形式,以重点推荐用户所关注的段落,提高了HTML页面的可阅读性,以及改善了用户体验,同时,可保证以目标HTML页面所展示文档的段落的样式显示属性的准确性,避免用户在阅读以目标HTML页面展示的文档时所造成的关注误差,从而影响段落的阅读访问计量信息。
在上述基础上,请结合参阅图8,本实施例还提供一种文档HTML页面展示装置10,包括信息获取模块11、调整模块12以及展示模块13。
所述信息获取模块11用于获取文档以HTML页面展示时每个段落的阅读访问计量信息。
所述调整模块12用于根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子,并根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性。
所述展示模块13用于将调整后的每个所述段落的样式显示属性进行加载,形成目标HTML页面,以对所述文档进行展示。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的文档HTML页面展示装置10的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
在上述基础上,本实施例提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被执行时实现前述实施方式中任意一项所述的文档HTML页面展示方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述存储介质的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上,本实施例提供的文档HTML页面展示方法、装置和电子设备,在获取文档以初始HTML页面展示时每个段落的阅读访问计量信息后,根据每个段落的阅读访问计量信息,计算得到每个段落的访问计量因子,根据每个段落的访问计量因子,调整每个段落的样式显示属性,将调整后的每个段落的样式显示属性进行加载,形成目标HTML页面,将文档以目标HTML页面进行展示,从而改变了HTML页面阅读的展示形式,提高了HTML页面可阅读性。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种文档HTML页面展示方法,其特征在于,包括:
获取文档以初始HTML页面展示时每个段落的阅读访问计量信息;
根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子,并根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性;
将调整后的每个所述段落的样式显示属性进行加载,形成目标HTML页面,以对所述文档进行展示;
所述阅读访问计量信息包括访问次数以及每次访问的访问时长,所述根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子的步骤,包括:
针对每个所述段落,根据预先设置的可忽略时长区间,判断该段落的每次访问的时长是否在所述可忽略时长区间内,将访问时长未在所述可忽略时长区间的访问进行过滤,得到该段落的有效访问次数以及每次有效访问的时长;
根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子,并根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子;
根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子。
2.根据权利要求1所述的文档HTML页面展示方法,其特征在于,所述根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子的步骤,包括:
将所述初始HTML页面中的所有段落的有效访问次数进行求和,并除以段落数,得到所述所有段落的有效访问平均次数;
针对每个所述段落,基于该段落的有效访问次数以及所述有效访问平均次数,得到该段落的有效访问次数因子。
3.根据权利要求1所述的文档HTML页面展示方法,其特征在于,所述根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子的步骤,包括:
针对每个所述段落,基于该段落每次有效访问的时长,得到该段落的累计停留时长;
根据该段落的累计停留时长以及该段落的有效访问次数,得到该段落的平均停留时长因子。
4.根据权利要求1所述的文档HTML页面展示方法,其特征在于,所述根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子的步骤,包括:
将每个所述段落的有效访问次数因子以及平均停留时长因子进行加权,得到每个所述段落的初始访问计量因子;
对每个所述段落的初始访问计量因子进行归一化处理,得到每个所述段落的访问计量因子。
5.根据权利要求1所述的文档HTML页面展示方法,其特征在于,所述根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性的步骤,包括:
针对每个所述段落,根据该段落的访问计量因子调整该段落的CSS样式显示值,得到该段落调整后的行高、字号以及透明度。
6.根据权利要求1所述的文档HTML页面展示方法,其特征在于,所述初始HTML页面中包括每个段落的ID信息,所述获取文档以初始HTML页面展示时每个段落的阅读访问计量信息的步骤包括:
根据每个所述段落的ID信息,监测用户访问每个所述段落的次数以及每次访问的时长;
根据用户访问每个所述段落的次数以及每次访问的时长,得到每个所述段落的阅读访问计量信息。
7.根据权利要求1所述的文档HTML页面展示方法,其特征在于,所述方法还包括:
针对文档中的每个段落,根据该段落的推荐程度值,对该段落的样式显示属性进行设置;
根据设置后的每个段落的样式显示属性,形成推荐HTML页面,以对该文档进行展示。
8.一种文档HTML页面展示装置,其特征在于,包括信息获取模块、调整模块以及展示模块;
所述信息获取模块用于获取文档以初始HTML页面展示时每个段落的阅读访问计量信息;
所述调整模块用于根据每个所述段落的阅读访问计量信息,计算每个所述段落的访问计量因子,并根据每个所述段落的访问计量因子,调整每个所述段落的样式显示属性;
所述展示模块用于将调整后的每个所述段落的样式显示属性进行加载,形成目标HTML页面,以对所述文档进行展示;
所述阅读访问计量信息包括访问次数以及每次访问的访问时长;
所述调整模块还用于:
针对每个所述段落,根据预先设置的可忽略时长区间,判断该段落的每次访问的时长是否在所述可忽略时长区间内,将访问时长未在所述可忽略时长区间的访问进行过滤,得到该段落的有效访问次数以及每次有效访问的时长;
根据每个所述段落的有效访问次数,得到每个所述段落的有效访问次数因子,并根据每个所述段落每次有效访问的时长,得到每个所述段落的平均停留时长因子;
根据每个所述段落的有效访问次数因子以及平均停留时长因子,得到每个所述段落的访问计量因子。
9.一种电子设备,其特征在于,包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述电子设备执行权利要求1-7中任意一项所述的文档HTML页面展示方法。
CN202010352916.9A 2020-04-29 2020-04-29 文档html页面展示方法、装置和电子设备 Active CN111274521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010352916.9A CN111274521B (zh) 2020-04-29 2020-04-29 文档html页面展示方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010352916.9A CN111274521B (zh) 2020-04-29 2020-04-29 文档html页面展示方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN111274521A CN111274521A (zh) 2020-06-12
CN111274521B true CN111274521B (zh) 2021-09-07

Family

ID=71001010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010352916.9A Active CN111274521B (zh) 2020-04-29 2020-04-29 文档html页面展示方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN111274521B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297581A (ja) * 2001-03-29 2002-10-11 Seiko Epson Corp 文書作成支援装置およびその方法
CN102982129A (zh) * 2012-11-14 2013-03-20 优视科技有限公司 对网页中内容进行标记提醒的方法、***及装置
CN106991099A (zh) * 2016-01-21 2017-07-28 北京铂金智慧网络科技有限公司 一种基于页面访问的阅读线生成方法及***
CN110244848A (zh) * 2019-06-17 2019-09-17 Oppo广东移动通信有限公司 阅读控制方法及相关设备
CN110275746A (zh) * 2019-04-12 2019-09-24 阿里巴巴集团控股有限公司 页面展示的控制方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552991B2 (en) * 2015-06-30 2020-02-04 International Business Machines Corporation Visually showing how recently a change was made to a document by using color intensity and/or typeface and/or font and/or emphasis
CN105979392A (zh) * 2015-09-14 2016-09-28 乐视致新电子科技(天津)有限公司 网页显示方法和浏览器
CN107608946A (zh) * 2017-09-30 2018-01-19 努比亚技术有限公司 文字重点内容提取方法及对应的移动终端
CN110390079A (zh) * 2018-04-19 2019-10-29 广东电网有限责任公司 一种处理文档方法
CN110889065B (zh) * 2018-08-15 2023-05-09 北京国双科技有限公司 页面停留时长确定方法、装置与设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297581A (ja) * 2001-03-29 2002-10-11 Seiko Epson Corp 文書作成支援装置およびその方法
CN102982129A (zh) * 2012-11-14 2013-03-20 优视科技有限公司 对网页中内容进行标记提醒的方法、***及装置
CN106991099A (zh) * 2016-01-21 2017-07-28 北京铂金智慧网络科技有限公司 一种基于页面访问的阅读线生成方法及***
CN110275746A (zh) * 2019-04-12 2019-09-24 阿里巴巴集团控股有限公司 页面展示的控制方法及装置
CN110244848A (zh) * 2019-06-17 2019-09-17 Oppo广东移动通信有限公司 阅读控制方法及相关设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
owards Usability Guidelines for the Design of Effective Arabic Websites;Namoun,A.等;《International Journal of Advanced Computer Science and Applications》;20190430;第585-94页 *
长文本的复杂指标提取方法;范小明;《中国优秀硕士学位论文全文数据库(电子期刊)》;20170215;第I138-4692页 *

Also Published As

Publication number Publication date
CN111274521A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
US11573693B2 (en) Display controlling method, terminal, information processing apparatus, and storage medium
WO2021068331A1 (zh) 一种网页自适应布局方法、服务器及计算机可读存储介质
US9984045B2 (en) Dynamic adjustment of rendering parameters to optimize reading speed
US9720571B2 (en) Immersive mode for a web browser
WO2018121618A1 (zh) 滚动翻页的显示方法和装置、计算设备及存储介质
WO2014026510A1 (zh) 网页内容的浏览方法、装置和浏览器
JP2019040565A (ja) 電子機器及び広告表示方法並びに広告表示プログラム
US7107545B2 (en) System and method for providing a graphical user interface display with a conspicuous image element
CN111124564A (zh) 显示用户界面的方法及装置
US20160086246A1 (en) Local search of network content
US20080229258A1 (en) Navigable screensaver and method for implementing same
CN103995809A (zh) 社会化媒体的信息处理方法及装置
US20060041835A1 (en) User-controlled web browser table reduction
CN111274521B (zh) 文档html页面展示方法、装置和电子设备
EP1204030A1 (en) Extending hypermedia documents by adding tagged attributes
CN113076165A (zh) 一种页面校验方法和装置
CN107463573B (zh) 内容信息提供方法、设备、浏览器、电子设备和服务器
CN111782121B (zh) 页面滚动控制方法及装置、可读存储介质及电子设备
JP6739177B2 (ja) 情報表示プログラム、情報表示方法及び制御装置
US11537586B2 (en) Detection of layout table(s) by a screen reader
US20160342570A1 (en) Document presentation qualified by conditions evaluated on rendering
CN101819581A (zh) 用于辅助用户理解内容的装置和辅助方法
CN112035765A (zh) 页面渲染方法、装置和设备
US20140046773A1 (en) Method and system for displaying relevant advertisements based on characteristic tags
US20230014018A1 (en) Information processing apparatus, control method, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant