CN111552903A - 基于html模板的页面生成方法、装置和计算机设备 - Google Patents

基于html模板的页面生成方法、装置和计算机设备 Download PDF

Info

Publication number
CN111552903A
CN111552903A CN202010273181.0A CN202010273181A CN111552903A CN 111552903 A CN111552903 A CN 111552903A CN 202010273181 A CN202010273181 A CN 202010273181A CN 111552903 A CN111552903 A CN 111552903A
Authority
CN
China
Prior art keywords
page
content
html
resource file
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010273181.0A
Other languages
English (en)
Inventor
刘慧众
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202010273181.0A priority Critical patent/CN111552903A/zh
Publication of CN111552903A publication Critical patent/CN111552903A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请涉及一种基于研发管理的基于HTML模板的页面生成方法、装置、计算机设备和存储介质。所述方法包括:获取并识别基准页面,抓取基准页面的页面布局文件和资源文件,根据页面布局文件确定具有相同标签位的相似页面内容。基于标签位实现相似页面内容的聚类,得到基于标签位的内容聚类,提取内容聚类的公共参数,基于公共参数和资源文件确定基准页面的页面内容。对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板,根据HTML模板以及目标页面的资源文件,生成对应目标页面。采用本方法无需开发人员手动修改源码文件,根据HTML模板和目标页面的资源文件,实现目标页面内容的替换,得到目标页面,降低人力资源消耗,提高目标页面生成的效率。

Description

基于HTML模板的页面生成方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于HTML模板的页面生成方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,以及互联网在人们日常工作生活中的广泛应用,人们通过浏览网页来获取所需要的信息的方式变得十分普遍。随之而来的,针对各个用户的不同需求,网页的制作和展示,也成为各网站吸引更多用户的手段。
一个网页的制作,需要根据网页待实现的功能或者新添加的需求,对网页的各元素重新进行编写和布局。然而传统上的页面内容的重新编写或布局,大多是在代码或者配置文件中,通过开发人员手动修改代码来实现,仍需耗费大量人力资源,导致网页生成的效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高网页生成效率的基于HTML模板的页面生成方法、装置、计算机设备和存储介质。
一种基于HTML模板的页面生成方法,所述方法包括:
获取并识别基准页面,并抓取所述基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类;
提取所述内容聚类的公共参数,并基于所述公共参数和所述资源文件确定所述基准页面的页面内容;
对所述基准页面的页面内容进行模板化处理,生成所述基准页面对应的HTML模板;
根据所述HTML模板以及目标页面的资源文件,生成对应目标页面。
在其中一个实施例中,所述根据所述HTML模板以及目标页面的资源文件,生成对应目标页面包括:
当检测到目标页面生成指令时,触发基线版本访问操作,根据所述基线版本访问操作获取HTML页面模板;
将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面。
在其中一个实施例中,所述将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面,包括:
基于所述HTML页面模板的页面内容和布局特征,生成多个替换键;
当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据所述资源提取地址获得目标页面的资源文件;
将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面。
在其中一个实施例中,所述公共参数包括配色方案,所述页面内容包括页面主题色;所述基于所述公共参数和所述资源文件确定所述页面的页面内容,包括:
基于所述配色方案和所述资源文件,对基准页面的配色进行色值分析,获取相同色号的标签位对应的配色;
对所述相同色号的标签位对应的配色进行聚类,得到基于所述标签位的色号聚类,确定为页面主题色。
在其中一个实施例中,所述公共参数包括布局特征,所述页面内容包括网站标志的位置和资源属性;所述基于所述公共参数和所述资源文件确定所述页面的页面内容,包括:
从所述资源文件中提取所述网站标志的显示关键字,并根据所述资源文件确定所述网站标志的资源属性;所述显示关键字为顶部工具栏,所述网站标志的资源属性为图片属性;
基于所述布局特征和所述显示关键字的关联,确定所述网站标志的显示位置;所述网站标志的位置为与所述顶部工具栏对应的页面顶端。
在其中一个实施例中,所述根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类,包括:
获取所述页面布局文件的所有页面内容,并提取所有页面内容的标签位;
获取相同标签位的页面内容,确定为相似页面内容;
基于所述标签位对所述相似页面内容进行聚类操作,得到基于所述标签位的内容聚类。
一种基于HTML模板的页面生成装置,所述装置包括:
基准页面识别模块,用于获取并识别基准页面,并抓取所述基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
内容聚类模块,用于根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类;
公共参数提取模块,用于提取所述内容聚类的公共参数,并基于所述公共参数和资源文件确定所述页面的页面内容;
HTML模板生成模块,用于基于所述基准页面的页面内容进行模板化处理,生成所述基准页面对应的HTML模板;
目标页面生成模块,用于根据所述HTML模板,以及目标页面的资源文件,生成对应目标页面。
在其中一个实施例中,所述目标页面生成模块还用于:
基于所述HTML页面模板的页面内容和布局特征,生成多个替换键;
当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据所述资源提取地址获得目标页面的资源文件;
将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取并识别基准页面,并抓取所述基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面
根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类;
提取所述内容聚类的公共参数,并基于所述公共参数和所述资源文件确定所述基准页面的页面内容;
对所述基准页面的页面内容进行模板化处理,生成所述基准页面对应的HTML模板;
根据所述HTML模板以及目标页面的资源文件,生成对应目标页面。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取并识别基准页面,并抓取所述基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类;
提取所述内容聚类的公共参数,并基于所述公共参数和所述资源文件确定所述基准页面的页面内容;
对所述基准页面的页面内容进行模板化处理,生成所述基准页面对应的HTML模板;
根据所述HTML模板以及目标页面的资源文件,生成对应目标页面。
上述基于HTML模板的页面生成方法、装置、计算机设备和存储介质,通过获取识别基准页面,并抓取基准页面的页面布局文件和资源文件,进而实现具有相同标签位的相似页面内容的聚类,得到基于标签位的内容聚类。通过提取内容聚类的公共参数,基于公共参数和资源文件确定页面的页面内容。由于对基准页面的页面内容进行了模板化处理,生成了与基准页面对应的HTML模板。在进行页面内容的修改时,可基于HTML模板,将HTML模板上原有的页面内容替换成目标页面的资源文件,则无需通过开发人员手动修改源码文件的方式来实现页面内容的修改,即可得到符合需求的目标页面,降低了人力资源消耗,并提高了目标页面生成的效率。
附图说明
图1为一个实施例中基于HTML模板的页面生成方法的应用场景图;
图2为一个实施例中基于HTML模板的页面生成方法的流程示意图;
图3为一个实施例中HTML模板示意图;
图4为一个实施例中生成对应目标页面的步骤的流程示意图;
图5为一个实施例中目标页面示意图;
图6为一个实施例中基于HTML模板的页面生成装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于HTML模板的页面生成方法,可以应用于如图1所示的应用环境中。其中,终端102与服务器104通过网络进行通信。服务器102通过获取并识别终端102的基线版本的网站页面,并抓取基准页面的页面布局文件和资源文件。进而服务器104根据页面布局文件确定具有相同标签位的相似页面内容,并基于标签位实现相似页面内容的聚类,得到基于标签位的内容聚类,通过提取内容聚类的公共参数,基于公共参数和资源文件确定基准页面的页面内容。对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板,并根据HTML模板以及目标页面的资源文件,生成对应目标页面。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于HTML模板的页面生成方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,获取并识别基准页面,并抓取基准页面的页面布局文件和资源文件。
具体地,基准页面为基线版本的网站页面,在网站开发设计过程中,可采用相同基础框架来实现不同网站的构建,通过将其中一个网站页面作为基线版本,通过识别该基线版本的基准页面,并抓取基准页面的布局文件和资源文件,根据基准页面的布局文件和资源文件可得到基线版本的HTML模板。其中,HTML包括一系列标签.通过这些标签可以将网络上的文档格式统一,使分散的网络资源连接为一个逻辑整体。模板包含表示元素,表示元素包括文本文字、HTML和数据绑定表达式,HTML模板表示为由HTML的一系列标签组成的表示元素的模板。
其中,页面布局文件涉及网页页面包括的所有内容在页面不同显示位置的设置,以网站标志为例,网站标志通常设置在页面的最顶端,可以是居中显示或者左/右上角显示等,网站标志在资源文件中显示的关键字为顶部工具栏,而由于网站标志多为图片,因此其对应的资源属性为图片属性。
步骤S204,根据页面布局文件确定具有相同标签位的相似页面内容,并基于标签位实现相似页面内容的聚类,得到基于标签位的内容聚类。
具体地,通过获取页面布局文件的所有页面内容,并提取所有页面内容的标签位,进而获取相同标签位的页面内容,确定为相似页面内容,基于标签位对相似页面内容进行聚类操作,得到基于标签位的内容聚类。
其中,标签位可以用于显示宣传栏的推荐产品或者热销产品等,基于页面内容的页面布局文件,可分别确定页面上不同栏目,比如推荐产品或热销产品等的标签位,并判断不同栏目对应标签位是否相同。
在一个实施例中,在网页页面显示为推荐产品的标签位,在页面布局文件中显示为div#details_plan_con_2,对应的标签位在资源文件中标记为<div class=“details_plan_two_right”>,而在网页页面上显示为热销产品的标签位,在页面布局文件中显示为div.details_plan_two_right,在资源文件中标记同样为<div class=“details_plan_two_right”>,则由于推荐产品和热销产品具有相同标签位,则可将推荐产品和热销产品确定为相似页面内容。基于所标记的标签位,可实现推荐产品和热销产品的聚类,得到基于标签位的内容聚类。
步骤S206,提取内容聚类的公共参数,并基于公共参数和资源文件确定基准页面的页面内容。
具体地,通过提取内容聚类的公共参数,公共参数包括配色方案和布局特征,配色方案包括页面的配色,页面上不同位置的配色可一致或者不同。布局特征即为根据不同标签位确定的页面内容聚类在页面的布局位置,可以包括网站标志、宣传栏以及空间元素。进而基于公共参数和资源文件,确定基准页面的页面内容。其中,页面内容包括与配色方案对应的页面主题色,以及网站标志和宣传栏对应的位置和资源属性。
进一步地,通过对所提取的公共参数进行扫描操作,执行入参操作,将公共参数写入配置表中存储。而入参操作表示为通过将所提取的公共参数,以及与公共参数对应的取值或定义等,写入预设的配置表中。其中,预设配置表中设置有多个字段名,各字段名包括预设关键字,通过将公共参数与预设关键字进行匹配,匹配成功时,将对应的公共参数以及对应的取值或定义等写入对应字段名包括的区域。
步骤S208,对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板。
具体地,通过对基准页面内容,包括页面布局、主题配色以及空间元素(包括图标、图片、背景等)等,进行模板化处理,获得组成一个网页HTML模版各组件,包括主体html、头部head、内容body。其中head区域主要存放网页标题、关键词、页面描述以及css和js代码的引用,而body区域主要存放我们以后对页面的编码内容。根据进行模板化处理获得的各组件,生成基准页面对应的HTML模板。
步骤S210,根据HTML模板以及目标页面的资源文件,生成对应目标页面。
具体地,当检测到目标页面生成指令时,触发基线版本访问操作,根据基线版本访问操作获取HTML页面模板,并将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
进一步地,如图3所示,图3提供了一种HTML模板,当检测到目标页面生成指令时,触发基线版本访问操作,并获取检测到的基线版本的访问地址,根据输入的基线版本的访问地址,获取HTML页面模板,进而通过将HTML页面模板的页面内容替换成目标页面的资源文件,以生成对应目标页面。
其中,具体的替换过程为数据资源覆盖或者数据资源替换过程,通过将HTML页面模板上替换按钮对应的已有页面内容替换成目标页面内容,或利用需要更新的目标页面内容将原有HTML页面模板上对应部分的内容覆盖,以得到符合要求的目标页面。
上述基于HTML模板的页面生成方法中,通过获取并识别基准页面,并抓取基准页面的页面布局文件和资源文件,进而实现具有相同标签位的相似页面内容的聚类,得到基于标签位的内容聚类。通过提取内容聚类的公共参数,基于公共参数和资源文件确定页面的页面内容,通过对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板,无需开发人员手动修改源码文件,可根据HTML模板以及目标页面的资源文件,实现目标页面内容的替换,得到符合需求的目标页面,降低了人力资源消耗,并提高了目标页面生成的效率。
在一个实施例中,如图4所示,生成对应目标页面,即将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面的步骤,具体包括一下S402至S406:
步骤S402,基于HTML页面模板的页面内容和布局特征,生成多个替换键。
其中,HTML页面模板的页面内容包括页面主题色、网站标志以及空间元素,空间元素包括背景图片以及宣传栏图片,布局特征包括与页面主题色对应的主题色布局,与网站标志对应的网站标志显示位置,以及与空间元素对应的空间布局。
具体地,基于页面主题色和主题色布局,可生成对应的页面主题色替换键,基于网站标志和网站标识显示位置,可生成对应的网站标志替换键。同样地,基于空间元素和空间布局,可生成对应的空间元素替换键,其中,空间元素替换键包括背景图片替换键和宣传栏图片替换键。
步骤S404,当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据资源提取地址获得目标页面的资源文件。
具体地,当检测到触发任一替换键,包括页面主题色替换键、网站标志替换键、背景图片替换键以及宣传栏图片替换键中的任一个时,获取对应替换键的资源提取地址。
进一步地,以触发的替换键为网站标志替换键为例,通过获取目标页面的网站标志的资源提取地址,通过访问所获取的资源提取地址,提取存储目标页面的网站标志的资源文件。
同样地,以触发的替换键为宣传栏图片替换键为例,可通过获取目标页面的宣传栏图片的资源提取地址,通过访问所获取的资源提取地址,提取存储目标页面的宣传栏图片的资源文件。
步骤S406,将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
具体地,通过根据所触发的替换键,包括页面主题色替换键、网站标志替换键、背景图片替换键以及宣传栏图片替换键等,将HTML页面模板的页面内容,替换为与替换键对应的目标页面的资源文件,得到替换后的目标页面。
进一步地,请参照图5,图5为触发替换键得到的目标页面示意图,如图5所示,触发了网站标志替换键和宣传栏图片替换键,将图3所示的HTML模板中的网站标志,替换成目标页面的资源文件中的网站标志,将HTML模板中的宣传栏图片,替换成目标页面的资源文件中的宣传栏图片,得到替换完成后的目标页面。
上述生成对应目标页面的步骤,基于HTML页面模板的页面内容和布局特征,生成多个替换键,当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据资源提取地址获得目标页面的资源文件,并将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面,无需开发人员手动修改源码文件,可根据HTML模板以及目标页面的资源文件,实现目标页面内容的替换,提高目标页面生成效率。
在一个实施例中,公共参数包括配色方案,页面内容包括页面主题色;基于公共参数和资源文件确定页面的页面内容,包括:
基于配色方案和资源文件,对基准页面的配色进行色值分析,获取相同色号的标签位对应的配色;对相同色号的标签位对应的配色进行聚类,得到基于标签位的色号聚类,确定为页面主题色。
具体地,通过对基准页面的配色方案进行色值分析,获取基准页面所有标签位对应的配色的色号,进而确定属于相同标签位的配色方案包括的色号。通过对相同色号的标签位的配色进行聚类,得到基于标签位的色号聚类,即可确定具有最多相同标签位配色作为页面主题色。
上述于公共参数和资源文件确定页面的页面内容,通过聚类的方式,确定页面主题色,减少因取样较少时,导致所提取的主题色的误差较大的问题,提高所确定的页面主题色的准确度。
在一个实施中,公共参数包括布局特征,页面内容包括网站标志的位置和资源属性;基于公共参数和资源文件确定页面的页面内容,还包括:
从资源文件中提取网站标志的显示关键字,并根据资源文件确定网站标志的资源属性;其中,显示关键字为顶部工具栏,网站标志的资源属性为图片属性;基于布局特征和显示关键字的关联,确定网站标志的显示位置;其中,网站标志的位置为与顶部工具栏对应的页面顶端。
具体地,通过从资源文件中提取网站标志的显示关键字,其中,网站标志对应的显示关键字为顶部工具栏,并可从资源文件中确定网站标志的资源属性为图片属性。进而基于布局特征和显示关键字的关联关系,确定网站标志的显示位置为与顶部工具栏对应的页面顶端。其中,由于网站标志通常设置在页面的最顶端,可以是居中显示或者左/右上角显示等,通过布局特征以及显示关键字的关联,来判定是否为网站标志,当确定为网站标志时,即将所确定的网站标志确定为页面内容的一部分。
在一个实施例中,公共参数还可包括空间元素,空间元素包括宣传栏以及背景图片等,页面内容还包括宣传栏的位置和资源属性,基于公共参数和资源文件确定页面的页面内容,还包括:
从资源文件中提取宣传栏的显示关键字,并根据资源文件确定宣传栏的资源属性;基于布局特征和显示关键字的关联,确定宣传栏的显示位置。
具体地,通过从资源文件中提取宣传栏的显示关键字,其中,宣传栏的显示关键字可以为居中工具栏,并可从资源文件确定宣传栏的资源属性为图片属性或声音属性或动态图片属性等。基于布局特征和显示关键字的关联关系,确定宣传栏的显示位置为与居中工具栏对应的页面居中位置。
上述基于公共参数和资源文件确定页面的页面内容,从资源文件中提取网站标志的显示关键字,并根据资源文件确定网站标志的资源属性,并基于布局特征和显示关键字的关联,确定网站标志的显示位置,同时还可确定页面对应位置所显示的内容是否为网站标志,降低替换操作时出现替换失误的几率,提高目标页面生成效率。
应该理解的是,虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种基于HTML模板的页面生成装置,包括:基准页面识别模块602、内容聚类模块604、公共参数提取模块606、HTML模板生成模块608以及目标页面生成模块610,其中:
基准页面识别模块602,用于获取并识别基准页面,并抓取基准页面的页面布局文件和资源文件;基准页面为基线版本的网站页面。
内容聚类模块604,用于根据页面布局文件确定具有相同标签位的相似页面内容,并基于标签位实现相似页面内容的聚类,得到基于标签位的内容聚类。
公共参数提取模块606,用于提取内容聚类的公共参数,并基于公共参数和资源文件确定页面的页面内容。
HTML模板生成模块608,用于基于基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板。
目标页面生成模块610,用于根据HTML模板,以及目标页面的资源文件,生成对应目标页面。
上述基于HTML模板的页面生成装置,通过获取并识别基准页面,并抓取基准页面的页面布局文件和资源文件,进而实现具有相同标签位的相似页面内容的聚类,得到基于标签位的内容聚类。通过提取内容聚类的公共参数,基于公共参数和资源文件确定页面的页面内容,通过对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板,无需开发人员手动修改源码文件,可根据HTML模板以及目标页面的资源文件,实现目标页面内容的替换,得到符合需求的目标页面,降低了人力资源消耗,并提高了目标页面生成的效率。
在一个实施例中,目标页面生成模块还用于:
当检测到目标页面生成指令时,触发基线版本访问操作,根据基线版本访问操作获取HTML页面模板;将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
上述目标页面生成模块,通过将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面,无需开发人员手动修改源码文件,可根据HTML模板以及目标页面的资源文件,实现目标页面内容的替换,提高目标页面生成效率。
在一个实施例中,目标页面生成模块还用于:
基于HTML页面模板的页面内容和布局特征,生成多个替换键;当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据资源提取地址获得目标页面的资源文件;将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
上述目标页面生成模块,基于HTML页面模板的页面内容和布局特征,生成多个替换键,当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据资源提取地址获得目标页面的资源文件,并将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面,无需开发人员手动修改源码文件,可根据HTML模板以及目标页面的资源文件,实现目标页面内容的替换,提高目标页面生成效率。
在一个实施例中,公共参数提取模块还用于:
基于配色方案和资源文件,对基准页面的配色进行色值分析,获取相同色号的标签位对应的配色;对相同色号的标签位对应的配色进行聚类,得到基于标签位的色号聚类,确定为页面主题色。
上述公共参数提取模块,通过聚类的方式,确定页面主题色,减少因取样较少时,导致所提取的主题色的误差较大的问题,提高所确定的页面主题色的准确度。
在一个实施例中,公共参数提取模块还用于:
从资源文件中提取网站标志的显示关键字,并根据资源文件确定网站标志的资源属性;显示关键字为顶部工具栏,网站标志的资源属性为图片属性;基于布局特征和显示关键字的关联,确定网站标志的显示位置;网站标志的位置为与顶部工具栏对应的页面顶端。
上述公共参数提取模块,从资源文件中提取网站标志的显示关键字,并根据资源文件确定网站标志的资源属性,并基于布局特征和显示关键字的关联,确定网站标志的显示位置,同时还可确定页面对应位置所显示的内容是否为网站标志,降低替换操作时出现替换失误的几率,提高目标页面生成效率。
关于基于HTML模板的页面生成装置的具体限定可以参见上文中对于基于HTML模板的页面生成方法的限定,在此不再赘述。上述基于HTML模板的页面生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储页面布局数据和页面资源数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于HTML模板的页面生成方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取并识别基准页面,并抓取基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
根据页面布局文件确定具有相同标签位的相似页面内容,并基于标签位实现相似页面内容的聚类,得到基于标签位的内容聚类;
提取内容聚类的公共参数,并基于公共参数和资源文件确定基准页面的页面内容;
对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板;
根据HTML模板以及目标页面的资源文件,生成对应目标页面。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
当检测到目标页面生成指令时,触发基线版本访问操作,根据基线版本访问操作获取HTML页面模板;
将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于HTML页面模板的页面内容和布局特征,生成多个替换键;
当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据资源提取地址获得目标页面的资源文件;
将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于配色方案和资源文件,对基准页面的配色进行色值分析,获取相同色号的标签位对应的配色;
对相同色号的标签位对应的配色进行聚类,得到基于标签位的色号聚类,确定为页面主题色。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
从资源文件中提取网站标志的显示关键字,并根据资源文件确定网站标志的资源属性;显示关键字为顶部工具栏,网站标志的资源属性为图片属性;
基于布局特征和显示关键字的关联,确定网站标志的显示位置;网站标志的位置为与顶部工具栏对应的页面顶端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取页面布局文件的所有页面内容,并提取所有页面内容的标签位;
获取相同标签位的页面内容,确定为相似页面内容;
基于标签位对相似页面内容进行聚类操作,得到基于标签位的内容聚类。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取并识别基准页面,并抓取基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
根据页面布局文件确定具有相同标签位的相似页面内容,并基于标签位实现相似页面内容的聚类,得到基于标签位的内容聚类;
提取内容聚类的公共参数,并基于公共参数和资源文件确定基准页面的页面内容;
对基准页面的页面内容进行模板化处理,生成基准页面对应的HTML模板;
根据HTML模板以及目标页面的资源文件,生成对应目标页面。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当检测到目标页面生成指令时,触发基线版本访问操作,根据基线版本访问操作获取HTML页面模板;
将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
基于HTML页面模板的页面内容和布局特征,生成多个替换键;
当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据资源提取地址获得目标页面的资源文件;
将HTML页面模板的页面内容替换为目标页面的资源文件,生成对应目标页面。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
基于配色方案和资源文件,对基准页面的配色进行色值分析,获取相同色号的标签位对应的配色;
对相同色号的标签位对应的配色进行聚类,得到基于标签位的色号聚类,确定为页面主题色。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
从资源文件中提取网站标志的显示关键字,并根据资源文件确定网站标志的资源属性;显示关键字为顶部工具栏,网站标志的资源属性为图片属性;
基于布局特征和显示关键字的关联,确定网站标志的显示位置;网站标志的位置为与顶部工具栏对应的页面顶端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取页面布局文件的所有页面内容,并提取所有页面内容的标签位;
获取相同标签位的页面内容,确定为相似页面内容;
基于标签位对相似页面内容进行聚类操作,得到基于标签位的内容聚类。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于HTML模板的页面生成方法,所述方法包括:
获取并识别基准页面,并抓取所述基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类;
提取所述内容聚类的公共参数,并基于所述公共参数和所述资源文件确定所述基准页面的页面内容;
对所述基准页面的页面内容进行模板化处理,生成所述基准页面对应的HTML模板;
根据所述HTML模板以及目标页面的资源文件,生成对应目标页面。
2.根据权利要求1所述的方法,其特征在于,所述根据所述HTML模板以及目标页面的资源文件,生成对应目标页面包括:
当检测到目标页面生成指令时,触发基线版本访问操作,根据所述基线版本访问操作获取HTML页面模板;
将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面。
3.根据权利要求2所述的方法,其特征在于,所述将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面,包括:
基于所述HTML页面模板的页面内容和布局特征,生成多个替换键;
当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据所述资源提取地址获得目标页面的资源文件;
将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述公共参数包括配色方案,所述页面内容包括页面主题色;所述基于所述公共参数和所述资源文件确定所述页面的页面内容,包括:
基于所述配色方案和所述资源文件,对基准页面的配色进行色值分析,获取相同色号的标签位对应的配色;
对所述相同色号的标签位对应的配色进行聚类,得到基于所述标签位的色号聚类,确定为页面主题色。
5.根据权利要求1至3任意一项所述的方法,其特征在于,所述公共参数包括布局特征,所述页面内容包括网站标志的位置和资源属性;所述基于所述公共参数和所述资源文件确定所述页面的页面内容,包括:
从所述资源文件中提取所述网站标志的显示关键字,并根据所述资源文件确定所述网站标志的资源属性;所述显示关键字为顶部工具栏,所述网站标志的资源属性为图片属性;
基于所述布局特征和所述显示关键字的关联,确定所述网站标志的显示位置;所述网站标志的位置为与所述顶部工具栏对应的页面顶端。
6.根据权利要求1至3任意一项所述的方法,其特征在于,所述根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类,包括:
获取所述页面布局文件的所有页面内容,并提取所有页面内容的标签位;
获取相同标签位的页面内容,确定为相似页面内容;
基于所述标签位对所述相似页面内容进行聚类操作,得到基于所述标签位的内容聚类。
7.一种基于HTML模板的页面生成装置,其特征在于,所述装置包括:
基准页面识别模块,用于获取并识别基准页面,并抓取所述基准页面的页面布局文件和资源文件;所述基准页面为基线版本的网站页面;
内容聚类模块,用于根据所述页面布局文件确定具有相同标签位的相似页面内容,并基于所述标签位实现所述相似页面内容的聚类,得到基于所述标签位的内容聚类;
公共参数提取模块,用于提取所述内容聚类的公共参数,并基于所述公共参数和资源文件确定所述页面的页面内容;
HTML模板生成模块,用于基于所述基准页面的页面内容进行模板化处理,生成所述基准页面对应的HTML模板;
目标页面生成模块,用于根据所述HTML模板,以及目标页面的资源文件,生成对应目标页面。
8.根据权利要求7所述的基于HTML模板的页面生成装置,其特征在于,所述目标页面生成模块还用于:
基于所述HTML页面模板的页面内容和布局特征,生成多个替换键;
当检测到触发任一替换键时,获取对应替换键的资源提取地址,根据所述资源提取地址获得目标页面的资源文件;
将所述HTML页面模板的页面内容替换为所述目标页面的资源文件,生成对应目标页面。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010273181.0A 2020-04-09 2020-04-09 基于html模板的页面生成方法、装置和计算机设备 Pending CN111552903A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010273181.0A CN111552903A (zh) 2020-04-09 2020-04-09 基于html模板的页面生成方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010273181.0A CN111552903A (zh) 2020-04-09 2020-04-09 基于html模板的页面生成方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN111552903A true CN111552903A (zh) 2020-08-18

Family

ID=72005668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010273181.0A Pending CN111552903A (zh) 2020-04-09 2020-04-09 基于html模板的页面生成方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111552903A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269605A (zh) * 2020-11-12 2021-01-26 北京百度网讯科技有限公司 一种皮肤更换方法、装置、电子设备及存储介质
CN112818277A (zh) * 2021-01-25 2021-05-18 京东方科技集团股份有限公司 一种网页生成方法、装置、存储介质及电子设备
CN114546389A (zh) * 2022-04-25 2022-05-27 浙江大华技术股份有限公司 前端页面生成方法、音视频分析方法及其装置以及介质
CN114968447A (zh) * 2022-03-30 2022-08-30 中国人寿保险股份有限公司 在线网页生成和管理方法及相关设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269605A (zh) * 2020-11-12 2021-01-26 北京百度网讯科技有限公司 一种皮肤更换方法、装置、电子设备及存储介质
CN112818277A (zh) * 2021-01-25 2021-05-18 京东方科技集团股份有限公司 一种网页生成方法、装置、存储介质及电子设备
CN114968447A (zh) * 2022-03-30 2022-08-30 中国人寿保险股份有限公司 在线网页生成和管理方法及相关设备
CN114546389A (zh) * 2022-04-25 2022-05-27 浙江大华技术股份有限公司 前端页面生成方法、音视频分析方法及其装置以及介质

Similar Documents

Publication Publication Date Title
CN108446116B (zh) 应用程序页面的生成方法、装置、计算机设备和存储介质
CN108304498B (zh) 网页数据采集方法、装置、计算机设备和存储介质
CN108932122B (zh) 接口文档生成方法、装置、计算机设备和存储介质
CN109901834B (zh) 文档页面生成方法、装置、计算机设备和存储介质
CN109712218B (zh) 电子书笔记处理方法、手写阅读设备和存储介质
CN111552903A (zh) 基于html模板的页面生成方法、装置和计算机设备
CN109814854B (zh) 项目框架生成方法、装置、计算机设备和存储介质
CN111898411B (zh) 文本图像标注***、方法、计算机设备和存储介质
CN108595697B (zh) 网页集成方法、装置及***
CN109032917B (zh) 页面调试方法和***、移动终端以及电脑端
CN110110152B (zh) 思维导图的处理方法、装置、计算机设备和存储介质
CN112115338A (zh) 页面查询请求处理方法、装置、设备及存储介质
CN111291533B (zh) 待显示句段的显示方法、装置、计算机设备和存储介质
CN110955608B (zh) 测试数据处理方法、装置、计算机设备和存储介质
CN112131837A (zh) 业务报告配置方法、装置、计算机设备和存储介质
CN110647350A (zh) 接口文档生成方法、装置、计算机设备和存储介质
CN111783019A (zh) 浏览器子页面创建方法、装置、计算机设备和存储介质
CN112559938A (zh) 电子***文件生成方法、装置、计算机设备和存储介质
JP2005322082A (ja) 文書属性入力装置および方法
CN111597151A (zh) 文件生成方法、装置、计算机设备和存储介质
CN115061688B (zh) 一种页面效果展示方法、计算设备及存储介质
CN110222290B (zh) 页面生成方法、装置、计算机设备和存储介质
CN110908570B (zh) 图像处理方法、装置、终端及存储介质
CN115293873A (zh) 授信流程的页面处理方法、装置、计算机设备和存储介质
CN113835704A (zh) 一种布局文件生成方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination