CN111984891A - 页面展示方法、装置、电子设备和存储介质 - Google Patents
页面展示方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111984891A CN111984891A CN202010789343.6A CN202010789343A CN111984891A CN 111984891 A CN111984891 A CN 111984891A CN 202010789343 A CN202010789343 A CN 202010789343A CN 111984891 A CN111984891 A CN 111984891A
- Authority
- CN
- China
- Prior art keywords
- page
- information
- filtering
- user
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000001914 filtration Methods 0.000 claims abstract description 191
- 238000013519 translation Methods 0.000 claims description 8
- 238000009877 rendering Methods 0.000 description 29
- 230000008859 change Effects 0.000 description 26
- 230000008569 process Effects 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 6
- 230000001960 triggered effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 210000002837 heart atrium Anatomy 0.000 description 1
- 210000003709 heart valve Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9577—Optimising the visualization of content, e.g. distillation of HTML documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开关于页面展示方法、装置、电子设备和存储介质,所述方法包括:确定初始页面的页面数据中包含的页面对象;确定所述页面对象中匹配于用户设置的过滤特征的目标对象;根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。根据用户意愿实现了对页面对象的针对性和个性化展示,从而能够满足不同用户针对同一页面的不同展示需求。
Description
技术领域
本公开涉及页面展示领域,尤其涉及页面展示方法、装置、电子设备和存储介质。
背景技术
页面展示设备展示的页面中可能包含侮辱性词汇、敏感方言、暴力视频、血腥图片等敏感信息。为避免展示上述敏感信息可能给用户带来的不适,相关技术中由网站等数据发送方对页面数据进行审核,以过滤其中的敏感信息,从而为用户展示仅包含非敏感信息对应的页面对象的页面。
但是,由于不同用户对敏感信息的关注点不同,即便在经过网站审核后的页面中,仍然可能存在部分页面对象会导致某些用户不适,而这部分页面对象却并不会导致其他用户的不适。因此,上述敏感信息审核方式难以满足不同用户针对同一页面的不同展示需求。
发明内容
本公开提供一种页面展示方法、装置、电子设备和存储介质,以针对不同用户个性化地展示页面内容。本公开的技术方案如下:
根据本公开实施例的第一方面,提出一种页面展示方法,包括:
确定初始页面的页面数据中包含的页面对象;
确定所述页面对象中匹配于用户设置的过滤特征的目标对象;
根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。
可选的,所述确定初始页面的页面数据中包含的页面对象,包括:
解析初始页面的页面数据以生成所述初始页面对应的页面结构文档;
通过遍历所述页面结构文档的节点确定所述页面数据中包含的页面对象。
可选的,还包括:
获取来自所述用户的输入信息;
其中,所述过滤特征包括所述输入信息和/或从所述输入信息中提取的特征信息。
可选的,所述获取来自所述用户的输入信息,包括:
从预设存储空间中读取所述用户在历史时刻产生的输入信息;
若从所述预设存储空间中读取失败,则展示特征设置界面,并接收所述用户在所述特征设置界面中形成的输入信息。
可选的,还包括:
按照预设的扩展规则对所述输入信息和/或所述特征信息进行扩展得到扩展信息;
其中,所述过滤特征还包括所述扩展信息。
可选的,所述扩展规则包括下述至少之一:
同音字替换、近义词替换、特殊符号替换、译文替换。
可选的,所述过滤特征包括文本过滤信息,所述确定所述页面对象中匹配于用户设置的过滤特征的目标对象,包括:
提取所述页面对象中的文本信息;
计算所述文本信息与所述文本过滤信息的文本相似度;
在所述文本相似度不大于预设的文本相似度阈值的情况下,将所述页面对象确定为匹配于用户设置的所述过滤特征的目标对象。
可选的,所述文本信息包含第一文本且所述文本过滤信息包含第二文本,所述计算所述文本信息与所述文本过滤信息的文本相似度,包括:
计算所述第一文本与所述第二文本之间的平均字面距离,并将所述平均字面距离确定为所述文本信息与所述文本过滤信息的文本相似度;或者,
计算所述第一文本与所述第二文本之间的余弦相似度,并将所述余弦相似度确定为所述文本信息与所述文本过滤信息的文本相似度;或者,
使用预先经过训练的语义相似度计算模型计算所述第一文本与所述第二文本之间的语义相似度,并将所述语义相似度确定为所述文本信息与所述文本过滤信息的文本相似度。
可选的,所述过滤特征包括图像过滤信息,所述确定所述页面对象中匹配于用户设置的过滤特征的目标对象,包括:
提取所述页面对象中任一图片对象或任一视频帧对象的图像信息;
计算所述图像信息与所述图像过滤信息的图像相似度;
在所述图像相似度不大于预设的图像相似度阈值的情况下,将所述任一图片对象或所述任一视频帧对象确定为匹配于用户设置的所述过滤特征的目标对象。
可选的,所述图像信息包含第一图像且所述图像过滤信息包含第二图像,所述计算所述图像信息与所述图像过滤信息的图像相似度,包括:
采用特征区域提取算法分别提取所述第一图像中的第一特征区域和所述第二图像中的第二特征区域;
基于所述第一特征区域和第二特征区域内各像素点的像素值计算所述第一特征区域和第二特征区域之间的区域相似度;
将所述区域相似度确定为所述图像信息与所述图像过滤信息的图像相似度。
可选的,还包括:使用预设替换对象替换所述页面数据中的所述目标对象;
所述根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面,包括:
根据所述预设替换对象和所述页面数据中除所述目标对象以外的其他对象,生成并展示所述初始页面对应的过滤后页面。
可选的,所述根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面,包括:
滤除所述目标对象在所述初始页面的页面结构文档中对应的节点元素;
根据滤除所述节点元素后的页面结构文档进行页面渲染,以展示所述过滤后页面。
可选的,所述根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面,包括:
生成所述目标对象过滤前后的对象变更信息;
根据所述对象变更信息和所述初始页面的页面结构文档进行页面渲染,以展示所述过滤后页面。
可选的,还包括:
在接收到所述用户针对所述过滤特征发出的特征清空指令后,触发执行针对所述过滤后页面的刷新操作。
根据本公开实施例的第二方面,提出一种页面展示装置,包括:
页面对象确定模块,被配置为确定初始页面的页面数据中包含的页面对象;
目标对象确定模块,被配置为确定所述页面对象中匹配于用户设置的过滤特征的目标对象;
页面展示模块,被配置为根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。
可选的,所述页面对象确定模块还被配置为:
解析初始页面的页面数据以生成所述初始页面对应的文档对象模型页面结构文档;
通过遍历所述页面结构文档的节点确定所述页面数据中包含的页面对象。
可选的,所述装置还包括:
输入信息获取模块,被配置为获取来自所述用户的输入信息;
其中,所述过滤特征包括所述输入信息和/或从所述输入信息中提取的特征信息。
可选的,所述输入信息获取模块还被配置为:
从预设存储空间中读取所述用户在历史时刻产生的输入信息;
若从所述预设存储空间中读取失败,则展示特征设置界面,并接收所述用户在所述特征设置界面中形成的输入信息。
可选的,所述装置还包括:
扩展信息获取模块,被配置为按照预设的扩展规则对所述输入信息和/或所述特征信息进行扩展得到扩展信息;
其中,所述过滤特征还包括所述扩展信息。
可选的,所述扩展规则包括下述至少之一:
同音字替换、近义词替换、特殊符号替换、译文替换。
可选的,所述过滤特征包括文本过滤信息,所述目标对象确定模块包括:
文本对象确定单元,被配置为提取所述页面对象中的文本信息,计算所述文本信息与所述文本过滤信息的文本相似度,在所述文本相似度不大于预设的文本相似度阈值的情况下,将所述页面对象确定为匹配于用户设置的所述过滤特征的目标对象。
可选的,所述文本信息包含第一文本且所述文本过滤信息包含第二文本,所述文本对象确定单元还被配置为:
计算所述第一文本与所述第二文本之间的平均字面距离,并将所述平均字面距离确定为所述文本信息与所述文本过滤信息的文本相似度;或者,
计算所述第一文本与所述第二文本之间的余弦相似度,并将所述余弦相似度确定为所述文本信息与所述文本过滤信息的文本相似度;或者,
使用预先经过训练的语义相似度计算模型计算所述第一文本与所述第二文本之间的语义相似度,并将所述语义相似度确定为所述文本信息与所述文本过滤信息的文本相似度。
可选的,所述过滤特征包括图像过滤信息,所述目标对象确定模块还包括:图像对象确定单元,被配置为提取所述页面对象中任一图片对象或任一视频帧对象的图像信息,计算所述图像信息与所述图像过滤信息的图像相似度,在所述图像相似度不大于预设的图像相似度阈值的情况下,将所述任一图片对象或所述任一视频帧对象确定为匹配于用户设置的所述过滤特征的目标对象。
可选的,所述图像信息包含第一图像且所述图像过滤信息包含第二图像,所述图像对象确定单元还被配置为:
采用特征区域提取算法分别提取所述第一图像中的第一特征区域和所述第二图像中的第二特征区域;
基于所述第一特征区域和第二特征区域内各像素点的像素值计算所述第一特征区域和第二特征区域之间的区域相似度;
将所述区域相似度确定为所述图像信息与所述图像过滤信息的图像相似度。
可选的,还包括:对象替换模块,被配置为使用预设替换对象替换所述页面数据中的所述目标对象;
所述页面展示模块还被配置为:根据所述预设替换对象和所述页面数据中除所述目标对象以外的其他对象,生成并展示所述初始页面对应的过滤后页面。
可选的,所述页面展示模块包括:
元素滤除单元,被配置为滤除所述目标对象在所述初始页面的页面结构文档中对应的节点元素;
第一展示单元,被配置为根据滤除所述节点元素后的页面结构文档进行页面渲染,以展示所述过滤后页面。
可选的,所述页面展示模块还包括:
替换记录单元,被配置为生成所述目标对象过滤前后的对象变更信息;
第二展示单元,被配置为根据所述对象变更信息和所述初始页面的页面结构文档进行页面渲染,以展示所述过滤后页面。
可选的,还包括:
特征清空模块,被配置为在接收到所述用户针对所述过滤特征发出的特征清空指令后,触发执行针对所述过滤后页面的刷新操作。
根据本公开实施例的第三方面,提出一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述第一方面中任一实施例所述的页面展示方法。
根据本公开实施例的第四方面,提出一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得页面展示设备能够执行上述第一方面中任一实施例所述的页面展示方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
根据本公开的实施例,由页面展示设备按照用户设置的过滤特征对页面对象进行过滤,滤除页面对象中匹配于过滤特征的目标对象后,仅为用户展示根据剩余页面对象生成的过滤后页面。因为过滤特征由用户自行设置,所以过滤后页面中的页面对象不会导致用户不适,根据用户意愿实现了对页面对象的针对性和个性化展示,从而能够更好的满足不同用户针对同一页面的不同展示需求。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据本公开的实施例示出的一种页面展示方法流程图;
图2是根据本公开的实施例示出的另一种页面展示方法流程图;
图3是根据本公开的实施例示出的又一种页面展示方法流程图;
图4是根据本公开的实施例示出的一种页面展示装置的示意框图;
图5是根据本公开的实施例示出的一种电子设备的结构图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
现阶段,无论是通过页面展示设备安装的浏览器访问网页,还是通过各类应用程序获取相应的网络资源,页面展示设备为用户展示的页面中都有可能包含侮辱性词汇、敏感方言、暴力视频、血腥图片等各类敏感信息。为避免展示上述敏感信息可能给用户带来的不适,相关技术中由网站等数据发送方对页面数据进行审核,以过滤其中的敏感信息,从而为用户展示仅包含非敏感信息对应的页面对象的页面。
但是,由于不同用户对敏感信息的关注点不同,因此即便在经过网站审核后的页面中,仍然可能存在部分页面对象会导致某些用户不适,而这部分页面对象却并不会导致其他用户的不适。因此,上述敏感信息审核方式难以满足不同用户针对同一页面的不同展示需求。
为解决上述针对不同用户个性化展示页面内容的技术问题,本公开提出一种页面展示方法。图1是根据本公开的实施例示出的一种页面展示方法流程图,该方法应用于页面展示设备。如图1所示,该方法可以包括:
步骤102,确定初始页面的页面数据中包含的页面对象。
需要说明的是,本公开所述的页面展示设备可以包括但不限于手机、电脑,可穿戴设备、平板电脑等电子设备。本公开所述的页面展示方法依托页面展示设备中的页面展示软件实现,例如,可以以页面展示软件的***功能的方式实现,也可以通过页面展示软件的功能插件实现。其中,上述页面展示软件可以为浏览器或其他具有页面展示功能的程序软件。本公开对于所述页面展示设备、页面展示软件及所述页面展示方法的具体实现方式并不进行限制。
本公开所述的初始页面即为尚未进行页面对象过滤的页面。初始页面的页面数据,即为包括该初始页面的页面对象的页面相关数据。例如,可以为初始页面对应的HTML(超文本标记语言,HyperText Markup Language)文件,或者从HTML文件中提取的页面对象信息集合。页面对象即为页面中包含的待展示对象,例如可以为文字、表情、图片、音频、视频等形式的展示对象。
在一实施例中,可以解析初始页面的页面数据以生成初始页面对应的页面结构文档,然后通过遍历该页面结构文档的节点(node)确定页面数据中包含的页面对象。例如在上述页面结构文档为DOM(文档对象模型,Document Object Model)树的情况下,可以通过遍历DOM树中各节点的节点值(node Value)确定页面数据中包含的页面对象,生成DOM树及对DOM树进行遍历的具体方式可以参见相关技术中公开的内容,此处不再赘述。因为初始页面的页面对象包含在页面结构文档中,因此通过遍历页面结构文档的方式可以查询到初始页面的全部页面对象或某一类型的部分页面数据。特别是在页面结构文档为DOM树的情况下,能够按照该初始页面的页面布局及其页面架构有序查找页面数据中的全部页面对象,保证了查找页面数据全面性和完整性,从而避免遗漏页面对象。
步骤104,确定所述页面对象中匹配于用户设置的过滤特征的目标对象。
在一实施例中,还可以获取来自用户的输入信息,相应的,上述过滤特征可以为该输入信息。此时,直接将用户产生的输入信息设置为过滤特征,使得该过滤特征能够更准确的反映用户的针对页面的过滤意愿,从而保证了过滤特征设置的准确性和针对性。上述过滤特征也可以为从上述输入信息中提取的特征信息,基于用户输入的输入信息提取特征信息,使得用户不必准确输入直接用作过滤特征的输入信息,降低了用户设置过滤特征的操作成本,提高了设置操作的便利性,同时也使得用户设置的过滤特征更加全面。当然,上述过滤特征也可以同时包含上述输入信息和扩展信息,以兼顾用户操作的便利性和过滤特征的全面性。
进一步的,可以从预设存储空间中读取用户在历史时刻产生的输入信息,上述历史时刻产生的输入信息可以为用户在当前时刻之前产生的输入信息,从而使得用户输入信息具有延续性,避免用户多次重复输入,从而简化用户操作。其中,用户在历史时刻产生的输入信息可以保存在页面展示设备的缓存空间中,也可以保存在页面展示设备的本地缓存中,如浏览器对应的localstorage文件中。
若上述读取成功,则可以将读取的用户在历史时刻产生的输入信息作为用户的输入信息。否则,若上述读取失败,则表明本地缓存中尚未保存用户在历史时刻产生的输入信息此时可以展示特征设置界面,并接收用户在该特征设置界面中形成的输入信息。在接收到用户在该特征设置界面中形成的输入信息后,可以将该输入保存在本地缓存中,以便下次需要确定用户在历史时刻产生的输入信息可以直接从本地缓存中读取,以节约输入信息的获取时间。
当然,也可以从分布式缓存或服务器中获取用户在历史时刻产生的输入信息,其中,上述分布式缓存可以为redis缓存或Memcached缓存等。从分布式缓存或服务器获取上述输入信息的过程可参见相关技术中公开的内容,此处不再赘述。
在一实施例中,可以按照预设的扩展规则对输入信息和/或所述特征信息进行扩展得到扩展信息,此时,过滤特征还包括上述扩展信息,以使用户设置的过滤特征更加全面。其中,上述扩展规则可以包括同音字替换、近义词替换、特殊符号替换、译文替换和/或译文替换等的一种或多种,以尽量满足不同用户的不同展示需求,并简化用户的设置操作。
在一实施例中,确定的用户设置的过滤特征可以具有多种格式,上述初始展示页面的页面数据中也可能包含多个页面对象,因此对于任一页面对象,可以基于过滤特征的不同格式采用不同的目标对象确定方式。
作为一示例性实施例,用户设置的过滤特征包括文本过滤信息,此时,可以提取页面对象中的文本信息,计算该文本信息与上述文本过滤信息的文本相似度,若计算出的文本相似度不大于预设的文本相似度阈值,则将该页面对象确定为匹配于用户设置的过滤特征的目标对象。上述文本信息中可以包含第一文本,且文本过滤信息中可以包含第二文本,计算上述文本相似度的方法可以有多种。例如,为验证文本信息与文本过滤信息中各个文本或各个字体的相似程度,可以计算第一文本与第二文本之间的平均字面距离,并将该平均字面距离确定为文本信息与文本过滤信息的文本相似度。又例如,为确定文本信息与文本过滤信息之间的整体相似度,可以计算第一文本与第二文本之间的余弦相似度,并将该余弦相似度确定为文本信息与文本过滤信息的文本相似度,此时,该预先相似度能够反映两信息之间的平均相似程度,从而避免两信息中个别文本或字体可能引入的较大误差。再例如,可以预先使用包含多种场景下的文本信息与文本过滤信息的训练样本对语义相似度计算模型进行训练,并在训练和验证完成(满足预设准确度要求)后,使用该模型计算第一文本与第二文本之间的语义相似度,并将语义相似度确定为文本信息与文本过滤信息的文本相似度;此时,使用预先训练好的语音相似度计算模型计算第一文本与第二文本之间的语义相似度,便于同时对大量信息进行处理,有助于加快相似度计算速度,进而提升对象过滤与页面展示效率。
作为另一示例性实施例,上述过滤特征包括图像过滤信息,此时,可以提取页面对象中任一图片对象或任一视频帧对象的图像信息,计算该图像信息与图像过滤信息的图像相似度,若计算出的图像相似度不大于预设的图像相似度阈值,则将上述任一图片对象或任一视频帧对象确定为匹配于用户设置的过滤特征的目标对象。上述图像信息可以包含第一图像,上述图像过滤信息可以包含第二图像,此时,可以采用特征区域提取算法分别提取第一图像中的第一特征区域和第二图像中的第二特征区域,然后基于第一特征区域和第二特征区域内各像素点的像素值计算第一特征区域和第二特征区域之间的区域相似度,再将该区域相似度确定为图像信息与图像过滤信息的图像相似度。通过特征区域提取的方式计算图像信息和图像过滤信息之间的图像相似度,相对于完整图片相似度计算的方式,大幅减少了计算数据量,有助于加快相似度计算速度。
可见,基于过滤特征的不同格式(文本格式或图像格式),分别通过计算相似性确定页面对象是否为目标对象,使得仅需要判断与过滤特征同种格式的页面对象,减少了需要进行判断的页面对象的个数,提高了目标对象的确定效率。
在一实施例中,可以使用预设替换对象替换从页面数据中确定出的目标对象,然后根据预设替换对象和页面数据中除目标对象以外的其他对象,生成并展示初始页面对应的过滤后页面。通过目标对象的替换,使得过滤后页面中仅展示预设替换对象而不展示其对应的目标对象,不仅实现了对目标对象的替换性过滤,而且便于使用户知晓过滤后页面中相应位置处是否存在被替换掉的目标对象。
步骤106,根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。
在一实施例中,可以滤除目标对象在初始页面的页面结构文档中对应的节点元素,然后根据滤除该节点元素后的页面结构文档进行页面渲染,以展示相应的过滤后页面。此时,通过替换初始页面的页面结构文档中与目标对象对应的节点元素,实现了页面结构文档的更新,因此后续只需要按照更新后的页面结构文档进行渲染即可直接展示过滤后页面,过滤后页面的渲染及展示过程改动小,更便捷。
在一实施例中,可以记录目标对象过滤前后的对象变更信息,然后根据该对象变更信息和页面数据对应的页面结构文档进行页面渲染,以展示相应的过滤后页面。此时,只需要额外记录初始页面对应于用户设置的过滤特征的对象变更信息,而无需改动初始页面对应的页面结构文档,因此即便用户在过滤后页面中对过滤特征进行更改,也无需从服务器重新获取页面数据或重新生成初始页面的页面结构文档,从而有效减少了过滤后页面展示后过滤特征更改导致的额外数据传输,有助于减少请求数量降低网络负载。其中,在上述两实施中,上述页面结构文档统一采用初始页面对应的DOM树。
在一实施例中,可以在接收到用户针对过滤特征发出的特征清空指令后,触发执行针对过滤后页面的刷新操作。例如,可以从服务器重新获取初始页面的页面数据并通过渲染展示初始页面实现刷新,也可以按照以获取的初始页面的页面数据及其页面结构文档进行渲染以实现刷新。响应于用户的特征清空操作,通过页面刷新实现初始页面的正常展示。
根据本公开的上述实施例,由页面展示设备按照用户设置的过滤特征对页面对象进行过滤,从而滤除页面对象中匹配于过滤特征的目标对象,仅为用户展示根据剩余页面对象生成的过滤后页面。保证了过滤后页面中的页面对象不会导致用户不适,从而实现了按照用户意愿对页面对象进行个性化展示,能够更好的满足不同用户的不同展示需求。
下面结合图2,以页面展示软件为浏览器、页面结构文档为DOM树为例,对用户设置完成过滤特征后进行的目标对象过滤及相应页面的展示过程进行详细描述。该方法应用于页面展示设备。如图2所示的另一种页面展示方法流程图,该方法可以包括:
步骤202,展示特征设置界面,以供用户设置过滤特征。
本实施例所述的页面展示方法可以作为浏览器集成功能或浏览器插件提供给用户。因此在本实施例中,可以在用户执行针对上述集成功能或插件执行预设操作后,为用户展示特征设置界面。例如,可以在浏览器的工具栏显示特征设置按钮,当用户点击触发该按钮后,可以在浏览器的当前显示界面中展示特征设置界面,或者在弹出的新页面中展示特征设置界面。
在一实施例中,特征设置界面可以包括过滤特征输入框,并相应地将用户在该过滤特征输入框中输入的文本形式的过滤关键词作为预输入信息。其中,过滤特征输入框可以依次仅接收用户输入的一个过滤关键词,也可以通知接收按照预设间隔格式进行区分的多个过滤关键词。上述特征设置界面或者该过滤特征输入框中还可以包括语音输入控件,并相应地将用户通过该语音输入控件输入的语音形式的过滤关键词作为预输入信息,或者可以将用户通过该语音输入控件输入的语音通过语音识别转换为文字形式的过滤关键词作为预输入信息。上述特征设置界面还可以包括确认控件,在通过上述滤特征输入框接收用户输入的文本形式的预输入信息,或者通过语音输入控件接收用户输入的语音形式的预输入信息的过程中,可以检测该确认控件是否被触发,并在检测到该确认控件被触发的情况下,将上述滤特征输入框接收到的文本形式的预输入信息或者语音输入控件接收到的语音形式的预输入信息确定为用户输入信息。
特征设置界面还可以包括图片特征上传控件,该图片特征上传控件用于供用户上传图片形式的过滤图像作为预输入信息。当用户通过该图片特征上传控件及其对应的弹出式窗口选中需要上传的过滤图像后,若用户触发该弹出式窗口的确认控件或上述确认控件,可以将过滤图像确定为用户的输入信息。上述特征设置界面还可以包括特征清空控件,当用户执行针对该特征清空控件的预设触发操作后,可以将已经设置的过滤特征全部清空,并触发针对当前显示界面的刷新。当然,特征设置界面还可以包括其他对象,本公开对此并不进行限制。
步骤204,根据用户的输入信息确定并保存过滤特征。
在一实施例中,可以直接将用户输入的上述输入信息确定为用户设置的过滤特征,例如直接将用户输入的文本形式的过滤关键词确定为过滤特征。也可以在接收到用户输入的上述输入信息后,将从上述输入信息中提取的特征信息确定为过滤特征,例如,可以从用户上传的语音形式的过滤关键词中通过语音识别提取文本关键词、音频变化率、响度变化曲线等特征信息,也可以从图片形式的过滤图像中提取像素值变化率或通过智能算法识别图片中包含的文字信息等特征信息,然后将上述一种或多种特征信息确定为过滤特征。
在一实施例中,可以按照预设的扩展规则对上述输入信息或特征信息进行扩展得到扩展信息,然后直接将扩展信息也确定为过滤特征,或者由用户决定将上述全部或部分扩展信息确定为过滤特征。例如,上述扩展规则可以为同音字替换、近义词替换、特殊符号替换、译文替换等的一种或多种。
例如在浏览器的特征设置界面中,当用户输入文字形式的过滤关键词“心脏”后,可以按照同音字替换规则扩展得到扩展信息“新脏”和“新藏”,按照近义词替换规则扩展得到扩展信息“心房”(当然也可以为“心室”、“心瓣”等),按照特殊符号替换规则扩展得到扩展信息按照译文替换规则扩展得到扩展信息“heart”。此时,可以直接将上述扩展信息确定为过滤特征,也可以为每一扩展信息添加选中控件,并根据用户针对每一扩展信息对应的选中控件执行的操作确定是否将该扩展信息确定为过滤特征。当然,上述扩展规则并不仅限于上述规则,上述扩展信息的确认方式也并不仅限于上述方式,可以根据具体情况进行调整,本公开对此不再进行限制。
确定过滤特征后,可以将其保存在预设存储空间中,例如,可以保存在本地缓存中,保存在预设的分布式缓存中、或者保存在浏览器对应的非缓存的存储空间中,以避免浏览器关闭后上述过滤特征被清除。另外,在上述过滤特征与其对应的输入信息不相同的情况下,可以将与上述过滤特征相对应的输入信息与上述过滤特征关联保存在上诉预设的存储空间中,以便在必要时可以基于上述输入信息重新确定过滤特征。
至此,过滤特征完成了根据用户输入信息确定过滤特征工作,当确定上述过滤特征后,浏览器需要展示的任一页面都可以在使用上述过滤特征进行过滤处理后再展示。因此,在保存完成上述过滤特征后,直至展示新的页面之间的间隔时间并不确定,因此基本公开对于步骤204和步骤206之间的间隔时间并不进行限制。
步骤206,获取初始页面对应的DOM树并遍历其DOM树节点以确定页面对象。
在一实施例中,可以在接收到用户针对任一初始页面发出的展示指令后,基于服务器的指示获取初始页面的页面数据,例如页面对应的HTML文件,然后解析该页面数据以生成初始页面对应的DOM树,再通过遍历上述DOM树的节点确定页面数据中包含的页面对象。
作为一示例性实施例,可以先确定上述过滤特征的信息类型,然后通过遍历DOM树查找与上述信息类型相对应的页面对象。例如,若上述过滤特征的信息类型为文本类型,则与其对应的页面对象的信息类型可以包括文本类型、图片类型、语音类型、视频类型等;若上述过滤特征的信息类型为图片类型,则与其对应的页面对象的信息类型可包括图片类型或视频类型;若上述过滤特征的信息类型为语音类型,则与其对应的页面对象的信息类型可包括语音类型或包含语音的视频类型等。可见,本实施例中的“遍历”可以为无限制条件的完全遍历,也可以为具有限制条件的不完全遍历,此时,可以加快页面对象的确定速度。
步骤208,计算页面对象的对象信息与过滤特征的特征信息之间的对象相似度。
步骤210,判断对象相似度是否满足相似度阈值。
在上述步骤206中可能确定出一个或多个页面对象。在一实施例中,可以在全部页面对象确定出后依次对每一页面对象的对象信息与过滤特征的特征信息进行相似度计算,以尽量减少页面刷新次数;也可以在遍历过程中,每确定出一个页面对象即对其对象信息与过滤特征的特征信息进行相似度计算,以及时滤除目标对象。
在一实施例中,对于任一页面对象,可以分别提取上述任一页面对象的对象信息和过滤特征的特征信息,然后计算上述对象信息和特征信息之间的对象相似度以判断该任一页面对象是否为目标对象。例如,在过滤特征包括文本过滤信息的情况下,可以提取上述任一页面对象中的文本信息,然后计算该文本信息与上述文本过滤信息的文本相似度,若计算出的文本相似度不大于预设的文本相似度阈值,则将上述任一页面对象确定为匹配于用户设置的过滤特征的目标对象。例如,在上述任一页面对象为文本对象的情况下,可以直接将该文本对象确定为文本信息;在上述任一页面对象为图片对象的情况下,可以通过智能图像算法识别该图片对象中的文本信息;在上述任一页面对象为语音对象的情况下,可以通过智能语音算法识别该语音对象中语音对应的文本信息(即语音转文字);在上述任一页面对象为视频对象的情况下,可以通过智能图像算法识别该视频对象的视频帧图像中的文本信息,或者通过智能语音算法识别该视频对象的视频语音对应的文本信息(即语音转文字),或者通过提取该视频对象的字幕文件识别该字幕文件中的文本信息。
在过滤特征包括图像过滤信息的情况下,可以提取页面对象中任一图片对象或任一视频帧对象的图像信息,然后计算该图片对象或视频帧对象的图像信息与上述图像过滤信息之间的图像相似度,若计算出的图像相似度不大于预设的图像相似度阈值,则将上述图片对象或视频帧对象确定为匹配于用户设置的过滤特征的目标对象。
在一实施例中,对于上述文本相似度,可以按照文本信息中的相同文字占比、相同位置的相同文字占比、同音字占比、近义词占比、特殊符号占比、译文占比等多种因素综合计算。
在一实施例中,对于上述图像相似度,可以将上述图片对象或视频帧对象转换为与图像过滤信息对应的用户输入图片相同的格式和大小,如均转换为rgba格式,119*160的像素大小等,然后按照下式(1)计算上述图片对象或视频帧对象(不妨记为X)与用户输入图片(不妨记为S)之间的图像相似度:
Sim(X|S)=[x1(r,g,b,a)/s1(r,g,b,a)+x2(r,g,b,a)/s2(r,g,b,a)+…xn(r,g,b,a)/sn(r,g,b,a)]/n (1)
其中,x1(r,g,b,a)表示上述图片对象或视频帧对象的第一个像素点的各维度像素值,s1(r,g,b,a)表示上述用户输入图片的第一个像素点的各维度像素值,其他类似,不再赘述。可见,式(1)计算的Sim(X|S)越接近1,表明上述图片对象或视频帧对象与用户输入图片之间越相似。因此,在Sim(X|S)-1(或|Sim(X|S)-1|)满足预设的图像相似度阈值的情况下,可以认为上述图片对象或视频帧对象与用户输入图片足够相似,即判定上述图片对象或视频帧对象为目标对象。例如,可以在Sim(X|S)-1<0.2的情况下,判定上述图片对象或视频帧对象为目标对象。
当然,也可以通过下式(2)计算上述图片对象或视频帧对象与用户输入图片之间的偏差度:
Dev(X|S)={|[x1(r,g,b,a)-s1(r,g,b,a)]/s1(r,g,b,a)|+|[x2(r,g,b,a)-s2(r,g,b,a)]/s2(r,g,b,a)|…+|[xn(r,g,b,a)-sn(r,g,b,a)]/sn(r,g,b,a)|}/n (2)
其中,x1(r,g,b,a)表示上述图片对象或视频帧对象的第一个像素点的各维度像素值,s1(r,g,b,a)表示上述用户输入图片的第一个像素点的各维度像素值,其他类似,不再赘述。可见,式(2)计算的Dev(X|S)越接近0,表明上述图片对象或视频帧对象与用户输入图片之间越相似。因此,在Dev(X|S)满足预设的图像相似度阈值的情况下,可以认为上述图片对象或视频帧对象与用户输入图片足够相似,即判定上述图片对象或视频帧对象为目标对象。例如,可以在Dev(X|S)<0.5的情况下,判定上述图片对象或视频帧对象为目标对象。
在另一实施例中,对于上述图像相似度,在上述图片对象或视频帧对象与用户上传图片之间的大小不相同的情况下,可以按区域依次计算上述图片对象或视频帧对象的不同区域与用户上传图片之间的相似度。例如,可以确定用户上传图片的全部像素点或识别出的对应于特征信息的特征区域,然后在上述图片对象或视频帧对象的全部像素点中按照预设的像素点梯度依次滑动计算上述特征区域与上述图片对象或视频帧对象中相同大小的部分区域之间的区域相似度,并在计算出上述区域相似度满足预设的区域相似度阈值的情况下,将上述图片对象或视频帧对象中相应的相似区域确定为目标区域。
当然,对于相似度的计算,也可以通过其他公式进行,本公开对于相似度计算的具体方式并不进行限制。
在确定出页面对象中的全部目标对象(或者还包括目标区域)后,转入步骤212;否则,若未确定出任何目标对象(或者任何目标区域),转入步骤216。
步骤212,过滤页面对象中的目标对象并生成过滤后的DOM树。
步骤214,基于过滤后的DOM树进行页面渲染。
在一实施例中,可以直接将确定出的目标对象从初始页面的页面数据中删除,以实现目标对象的过滤,然后基于剩余的页面对象生成过滤后的DOM树。但需要说明的是,删除目标数据后的剩余页面对象应当保持原有的位置关系及引用关系不变,以保证过滤后页面的正常展示效果。
在另一实施例中,可以使用预设的替换对象替换页面数据中的上述目标对象,然后基于替换后的替换对象和页面数据中除目标对象之外的其余对象生成过滤后的DOM树,然后。其中,上述预设的替换对象可以为预设的符号,如“***”、“##”等,也可以为预设的文字,如“此处已替换”、“已过滤”等,也可以为文字与符合的组合,如“<已替换>”、“!已过滤”等,从而在目标对应的原有展示位置处展示上述替换对象,以明确告知用户相应位置处发生了对象替换,从而便于用户知晓替换详情并便于查看所展示的过滤后页面。
特殊的,在上述页面数据中某图片形式的目标对象存在目标区域的情况下,针对该目标对象的替换,可以替换整个目标对象,也可以将目标对象的目标区域内目标像素点的像素值设置为预设像素值,例如在RGB格式下,可以将目标像素点的像素值统一设置为(255、255、255),即将目标区域替换为纯白背景;也可以将目标像素点的像素值统一设置为该区域边缘像素点像素值的平均值,以尽量减少统一设置为预设颜色的背景后可能带来的展示效果突变。
在上述替换完成,按照上述过滤后的DOM树进行页面渲染(即对过滤后页面进行渲染),以生成相应的渲染数据。
步骤216,基于初始的DOM树进行页面渲染。
此时,页面数据中并不存在目标对象,即初始页面中并不存在用户敏感信息,因此并不需要对初始页面进行特殊处理,只需要按照初试页面的DOM数进行页面渲染,生成初始页面的渲染数据即可。
步骤218,按照渲染结果展示相应的页面。
基于步骤214生成的过滤后页面的渲染数据展示过滤后页面,或者基于步骤216生成的初始页面的渲染数据展示初始页面。其中,上述过滤后页面中的目标对象对应的展示位置处,不展示任何页面对象(空白),或者仅展示背景,或者展示相应的替换对象。
上述步骤214和步骤216中基于DOM树进行页面渲染以生成渲染数据,以及步骤218中基于渲染数据展示相应页面的具体过程,可以参见相关技术中公开的内容,本公开对此并不进行限制。
承接于前述用户设置文本形式的“心脏”为过滤特征的实施例,浏览器中当前网页的初始页面可以包含文本区域和图片区域,其中,文本区域中包含文字形式的目标对象,图片区域中包含图片形式的目标对象。
经过前述页面展示方法的处理判定出文本区域展示的文本对象中包含目标对象,因此使用预设的替换字符“***”对其进行替换。此时,文本区域中目标对象的显示位置处全部展示预设的替换字符“***”,而不显示原有的目标对象“心脏”,从而实现了针对初始页面中目标对象的过滤。
若用户还在前述特征设置界面中上传了关于心脏的特征图片,此时,经过前述页面展示方法的处理判定出图片区域展示的图片对象为目标对象,因此可以使用预设的替换图片对其进行替换。此时,图片区域中目标对象的显示位置处展示预设的替换图片,而不显示原有的逼真的心脏图片,从而实现了针对初始页面中目标对象的过滤,过滤后页面中展示的替换图片中可以包括“!原图片已被滤除”的说明文字,以告知用户替换效果。
另外,还可以将上述替换字符或替换图片分别对应关联至被替换的目标对象(相应的,可以在前述滤除过程中将被滤除的目标对象预先进行缓存),以使用户触发该替换字符或替换图片后,将被触发的替换字符或替换图片还原为相应的目标对象,从而便于用户灵活选择,从而避免遗漏过滤后页面中的关键信息。
至此,已完成对图2所示页面展示方法的说明。图2所示的实施例仅以用户预先设置过滤特征和基于更新DOM树实现对目标对象的过滤为例进行说明。实际上,也可以在初始页面展示之后获取过滤特征对以展示的初始页面进行过滤处理,并基于对象变更信息实现对目标对象的过滤,下面结合图3所示的又一种页面展示方法流程图对该方法进行说明,该方法可以包括下述步骤:
步骤302,获取初始页面数据并展示初始页面。
首先,页面展示设备可以在获取到初始页面的页面数据后,(通过页面展示软件)经过生成DOM树、页面渲染最后展示该初始页面。实际上,该过程即为相关技术中展示页面的常规方法,此处不再赘述。
步骤304,获取用户设置的过滤特征。
在展示上述初始页面后,用户可能发现初始页面中包含其认为的敏感信息,因此其可以根据页面展示软件提供的集成功能或功能插件设置相应的过滤特征,相应的特征设置界面和具体的设置过程可以参见前述步骤202-步骤204的记载,此处不再赘述。
在一实施例中,也可以由页面展示设备自动查询本地缓存以获取用户在历史时刻产生的输入信息,然后基于该输入信息确定相应的过滤特征。还可以由页面展示设备自动查询本地缓存以获取用户在历史时刻设置的过滤特征,以进一步加快过滤特征的速度。
步骤306,获取初始页面对应的DOM树并遍历其DOM树节点以确定页面对象。
步骤308,计算页面对象的对象信息与过滤特征的特征信息之间的对象相似度。
步骤310,判断对象相似度是否满足相似度阈值。
上述步骤306-步骤310的具体内容与前述步骤206-步骤210记载的内容并不存在本质区别,可参见前述内容,此处不再赘述。
步骤312,生成初始的DOM树中目标对象的对象变更信息。
如前所述,在确定出目标对象后,相应的过滤后页面有两种展示方式:展示空白或背景(对应于删除目标对象),展示替换对象(对应于使用替换对象替换目标对象)。因此,在本实施例中,可以根据实际需要或用户设置确定上述任一种展示方式,相应的,可以基于删除目标对象或替换目标对象生成相应的对象变更信息。
在一实施例中,上述对象变更信息可以包括目标对象的内容、展示位置和/或与其他页面对象之间的逻辑关系等信息,相应的变更操作为删除操作。在另一实施例中,上述对象变更信息可以包括目标对象的内容、展示位置和/或与其他页面对象之间的逻辑关系等信息,以及替换对象的内容,相应的变更操作为替换操作。
步骤314,基于初始的DOM树和对象变更信息进行页面渲染。
在生成上述对象变更信息后,可以基于初始页面的DOM树和上述对象变更信息进行页面渲染,从而生成过滤后页面的渲染数据。
步骤316,基于初始的DOM树进行页面渲染。
步骤318,按照渲染结果展示相应的页面。
上述步骤316-步骤318的具体内容与前述步骤216-步骤218记载的内容并不存在本质区别,可参见前述内容,此处不再赘述。
因为本实施例是在初始页面展示之后确定过滤特征并进行过滤处理的,因此可以理解的是,上述步骤318的展示过程实际上是对于已展示的初始页面的刷新过程——刷新前的页面(初始页面)中包含用户敏感的目标对象,刷新后的页面(过滤后页面)中不包含用户敏感的目标对象,从而实现对页面中页面对象的过滤。
在一实施例中,在已经展示出过滤后页面的情况下,用户可以选择清空全部过滤特征,在接收到用户发出的特征清空指令后,可以触发实现对当前已展示页面的刷新操作。例如,可以从服务器重新获取初始页面的页面数据并完成展示,也可以删除相应的对象变更信息,然后基于已经生成的初始信页面对应的DOM树展示相应的初始页面,从而实现对当前已展示过滤后页面的刷新。另外,在页面展示软件后台打开多个过滤后页面的情况下,可以仅刷新当前展示的过滤后页面,也可以对过滤后页面全部进行刷新,本公开对此并不进行限制。
与前述页面展示方法的实施例相对应地,本公开还提出了页面展示装置的实施例。
图4是根据本公开的实施例示出的一种页面展示装置的示意框图。本实施例所示的页面展示装置可以适用于页面展示应用,所述应用适用于页面展示设备,所述页面展示设备包括但不限于手机、平板电脑、可穿戴设备、个人计算机等电子设备。所述视频播放应用可以是安装在页面展示设备中的浏览器,也可以是其他具有页面展示功能的非浏览器应用如即时通讯应用,数据查询应用等,用户可以通过页面展示应用查看展示的页面。
如图4所示,所述页面展示装置可以包括:
页面对象确定模块401,被配置为确定初始页面的页面数据中包含的页面对象;
目标对象确定模块402,被配置为确定所述页面对象中匹配于用户设置的过滤特征的目标对象;
页面展示模块403,被配置为根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。
可选的,所述页面对象确定模块401还被配置为:
解析初始页面的页面数据以生成所述初始页面对应的文档对象模型页面结构文档;
通过遍历所述页面结构文档的节点确定所述页面数据中包含的页面对象。
可选的,所述装置还包括:
输入信息获取模块404,被配置为获取来自所述用户的输入信息;
其中,所述过滤特征包括所述输入信息和/或从所述输入信息中提取的特征信息。
可选的,所述输入信息获取模块404还被配置为:
从预设存储空间中读取所述用户在历史时刻产生的输入信息;
若从所述预设存储空间中读取失败,则展示特征设置界面,并接收所述用户在所述特征设置界面中形成的输入信息。
可选的,所述装置还包括:
扩展信息获取模块405,被配置为按照预设的扩展规则对所述输入信息和/或所述特征信息进行扩展得到扩展信息;
其中,所述过滤特征还包括所述扩展信息。
可选的,所述扩展规则包括下述至少之一:
同音字替换、近义词替换、特殊符号替换、译文替换。
可选的,所述过滤特征包括文本过滤信息,所述目标对象确定模块402包括:
文本对象确定单元402A,被配置为提取所述页面对象中的文本信息,计算所述文本信息与所述文本过滤信息的文本相似度,在所述文本相似度不大于预设的文本相似度阈值的情况下,将所述页面对象确定为匹配于用户设置的所述过滤特征的目标对象。
可选的,所述文本信息包含第一文本且所述文本过滤信息包含第二文本,所述文本对象确定单元402A还被配置为:
计算所述第一文本与所述第二文本之间的平均字面距离,并将所述平均字面距离确定为所述文本信息与所述文本过滤信息的文本相似度;或者,
计算所述第一文本与所述第二文本之间的余弦相似度,并将所述余弦相似度确定为所述文本信息与所述文本过滤信息的文本相似度;或者,
使用预先经过训练的语义相似度计算模型计算所述第一文本与所述第二文本之间的语义相似度,并将所述语义相似度确定为所述文本信息与所述文本过滤信息的文本相似度。
可选的,所述过滤特征包括图像过滤信息,所述目标对象确定模块402还包括:图像对象确定单元402B,被配置为提取所述页面对象中任一图片对象或任一视频帧对象的图像信息,计算所述图像信息与所述图像过滤信息的图像相似度,在所述图像相似度不大于预设的图像相似度阈值的情况下,将所述任一图片对象或所述任一视频帧对象确定为匹配于用户设置的所述过滤特征的目标对象。
可选的,所述图像信息包含第一图像且所述图像过滤信息包含第二图像,所述图像对象确定单元402B还被配置为:
采用特征区域提取算法分别提取所述第一图像中的第一特征区域和所述第二图像中的第二特征区域;
基于所述第一特征区域和第二特征区域内各像素点的像素值计算所述第一特征区域和第二特征区域之间的区域相似度;
将所述区域相似度确定为所述图像信息与所述图像过滤信息的图像相似度。可选的,还包括:
对象替换模块406,被配置为使用预设替换对象替换所述页面数据中的所述目标对象;
所述页面展示模块403还被配置为:根据所述预设替换对象和所述页面数据中除所述目标对象以外的其他对象,生成并展示所述初始页面对应的过滤后页面。
可选的,所述页面展示模块403包括:
元素滤除单元403A,被配置为滤除所述目标对象在所述初始页面的页面结构文档中对应的节点元素;
第一展示单元403B,被配置为根据滤除所述节点元素后的页面结构文档进行页面渲染,以展示所述过滤后页面。
可选的,所述页面展示模块403还包括:
替换记录单元403C,被配置为生成所述目标对象过滤前后的对象变更信息;
第二展示单元403D,被配置为根据所述对象变更信息和所述初始页面的页面结构文档进行页面渲染,以展示所述过滤后页面。
可选的,还包括:
特征清空模块407,被配置为在接收到所述用户针对所述过滤特征发出的特征清空指令后,触发执行针对所述过滤后页面的刷新操作。
本公开的实施例还提出一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述任一实施例所述的页面展示方法。
本公开的实施例还提出一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一实施例所述的页面展示方法。
本公开的实施例还提出一种计算机程序产品,所述计算机程序产品被配置为执行上述任一实施例所述的页面展示方法。
图5是根据本公开的实施例示出的一种电子设备的示意框图。例如,电子设备500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。,
参照图5,电子设备500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)的接口512,传感器组件514,以及通信组件518。
处理组件502通常控制电子设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述页面展示方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在电子设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理***,一个或多个电源,及其他与为电子设备500生成、管理和分配电力相关联的组件。
多媒体组件508包括在电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当电子设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件518发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为电子设备500提供各个方面的状态评估。例如,传感器组件514可以检测到电子设备500的打开/关闭状态,组件的相对定位,例如所述组件为电子设备500的显示器和小键盘,传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变,用户与电子设备500接触的存在或不存在,电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件518被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件518经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件518还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在本公开一实施例中,电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述页面展示方法。
在本公开一实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由电子设备500的处理器520执行以完成上述页面展示方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
需要说明的是,在本公开中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本公开实施例所提供的方法和装置进行了详细介绍,本文中应用了具体个例对本公开的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本公开的方法及其核心思想;同时,对于本领域的一般技术人员,依据本公开的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本公开的限制。
Claims (10)
1.一种页面展示方法,其特征在于,包括:
确定初始页面的页面数据中包含的页面对象;
确定所述页面对象中匹配于用户设置的过滤特征的目标对象;
根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。
2.根据权利要求1所述的方法,其特征在于,所述确定初始页面的页面数据中包含的页面对象,包括:
解析初始页面的页面数据以生成所述初始页面对应的页面结构文档;
通过遍历所述页面结构文档的节点确定所述页面数据中包含的页面对象。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取来自所述用户的输入信息;
其中,所述过滤特征包括所述输入信息和/或从所述输入信息中提取的特征信息。
4.根据权利要求3所述的方法,其特征在于,所述获取来自所述用户的输入信息,包括:
从预设存储空间中读取所述用户在历史时刻产生的输入信息;
若从所述预设存储空间中读取失败,则展示特征设置界面,并接收所述用户在所述特征设置界面中形成的输入信息。
5.根据权利要求3所述的方法,其特征在于,还包括:
按照预设的扩展规则对所述输入信息和/或所述特征信息进行扩展得到扩展信息;
其中,所述过滤特征还包括所述扩展信息。
6.根据权利要求5所述的方法,其特征在于,所述扩展规则包括下述至少之一:
同音字替换、近义词替换、特殊符号替换、译文替换。
7.根据权利要求1所述的方法,其特征在于,所述过滤特征包括文本过滤信息,所述确定所述页面对象中匹配于用户设置的过滤特征的目标对象,包括:
提取所述页面对象中的文本信息;
计算所述文本信息与所述文本过滤信息的文本相似度;
在所述文本相似度不大于预设的文本相似度阈值的情况下,将所述页面对象确定为匹配于用户设置的所述过滤特征的目标对象。
8.一种页面展示装置,其特征在于,包括:
页面对象确定模块,被配置为确定初始页面的页面数据中包含的页面对象;
目标对象确定模块,被配置为确定所述页面对象中匹配于用户设置的过滤特征的目标对象;
页面展示模块,被配置为根据滤除所述目标对象后的剩余页面对象,展示所述初始页面对应的过滤后页面。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的页面展示方法。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的页面展示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010789343.6A CN111984891A (zh) | 2020-08-07 | 2020-08-07 | 页面展示方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010789343.6A CN111984891A (zh) | 2020-08-07 | 2020-08-07 | 页面展示方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111984891A true CN111984891A (zh) | 2020-11-24 |
Family
ID=73445733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010789343.6A Pending CN111984891A (zh) | 2020-08-07 | 2020-08-07 | 页面展示方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111984891A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434070A (zh) * | 2020-12-14 | 2021-03-02 | 四川长虹电器股份有限公司 | 一种基于相似度算法的分页查询方法 |
CN112732398A (zh) * | 2021-02-02 | 2021-04-30 | 三盟科技股份有限公司 | 一种基于人工智能的大数据可视化管理方法及*** |
WO2022218351A1 (zh) * | 2021-04-14 | 2022-10-20 | 浙江口碑网络技术有限公司 | 页面元素展示方法、服务信息提供方法、设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101324888A (zh) * | 2007-06-13 | 2008-12-17 | 北京恒金恒泰信息技术有限公司 | 基于ie的过滤色情软件插件 |
CN102789484A (zh) * | 2012-06-28 | 2012-11-21 | 奇智软件(北京)有限公司 | 一种网页信息处理方法和装置 |
CN106055574A (zh) * | 2016-05-19 | 2016-10-26 | 微梦创科网络科技(中国)有限公司 | 一种识别非法统一资源标识符url的方法与装置 |
CN107329981A (zh) * | 2017-06-01 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 页面检测的方法和装置 |
CN107526842A (zh) * | 2017-09-22 | 2017-12-29 | 深圳互联先锋科技有限公司 | 一种批量监控多个网站页面方法及装置 |
CN107943954A (zh) * | 2017-11-24 | 2018-04-20 | 杭州安恒信息技术有限公司 | 网页敏感信息的检测方法、装置及电子设备 |
CN108304584A (zh) * | 2018-03-06 | 2018-07-20 | 百度在线网络技术(北京)有限公司 | 非法页面检测方法、装置、入侵检测***及存储介质 |
CN108319672A (zh) * | 2018-01-25 | 2018-07-24 | 南京邮电大学 | 基于云计算的移动终端不良信息过滤方法及*** |
CN110598115A (zh) * | 2019-09-18 | 2019-12-20 | 北京市博汇科技股份有限公司 | 一种基于人工智能多引擎的敏感网页识别方法及*** |
CN111258904A (zh) * | 2020-01-16 | 2020-06-09 | 恩亿科(北京)数据科技有限公司 | 一种网页元素测试方法和相关装置 |
CN111353112A (zh) * | 2020-02-27 | 2020-06-30 | 百度在线网络技术(北京)有限公司 | 页面处理方法、装置、电子设备和计算机可读介质 |
CN111382383A (zh) * | 2018-12-28 | 2020-07-07 | 广州市百果园信息技术有限公司 | 网页内容敏感类型确定方法、装置、介质和计算机设备 |
-
2020
- 2020-08-07 CN CN202010789343.6A patent/CN111984891A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101324888A (zh) * | 2007-06-13 | 2008-12-17 | 北京恒金恒泰信息技术有限公司 | 基于ie的过滤色情软件插件 |
CN102789484A (zh) * | 2012-06-28 | 2012-11-21 | 奇智软件(北京)有限公司 | 一种网页信息处理方法和装置 |
CN106055574A (zh) * | 2016-05-19 | 2016-10-26 | 微梦创科网络科技(中国)有限公司 | 一种识别非法统一资源标识符url的方法与装置 |
CN107329981A (zh) * | 2017-06-01 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 页面检测的方法和装置 |
CN107526842A (zh) * | 2017-09-22 | 2017-12-29 | 深圳互联先锋科技有限公司 | 一种批量监控多个网站页面方法及装置 |
CN107943954A (zh) * | 2017-11-24 | 2018-04-20 | 杭州安恒信息技术有限公司 | 网页敏感信息的检测方法、装置及电子设备 |
CN108319672A (zh) * | 2018-01-25 | 2018-07-24 | 南京邮电大学 | 基于云计算的移动终端不良信息过滤方法及*** |
CN108304584A (zh) * | 2018-03-06 | 2018-07-20 | 百度在线网络技术(北京)有限公司 | 非法页面检测方法、装置、入侵检测***及存储介质 |
CN111382383A (zh) * | 2018-12-28 | 2020-07-07 | 广州市百果园信息技术有限公司 | 网页内容敏感类型确定方法、装置、介质和计算机设备 |
CN110598115A (zh) * | 2019-09-18 | 2019-12-20 | 北京市博汇科技股份有限公司 | 一种基于人工智能多引擎的敏感网页识别方法及*** |
CN111258904A (zh) * | 2020-01-16 | 2020-06-09 | 恩亿科(北京)数据科技有限公司 | 一种网页元素测试方法和相关装置 |
CN111353112A (zh) * | 2020-02-27 | 2020-06-30 | 百度在线网络技术(北京)有限公司 | 页面处理方法、装置、电子设备和计算机可读介质 |
Non-Patent Citations (1)
Title |
---|
小乔与荞麦: "互联网潜规则二 敏感词屏蔽", 《微信公众平台》, pages 1 - 5 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434070A (zh) * | 2020-12-14 | 2021-03-02 | 四川长虹电器股份有限公司 | 一种基于相似度算法的分页查询方法 |
CN112732398A (zh) * | 2021-02-02 | 2021-04-30 | 三盟科技股份有限公司 | 一种基于人工智能的大数据可视化管理方法及*** |
WO2022218351A1 (zh) * | 2021-04-14 | 2022-10-20 | 浙江口碑网络技术有限公司 | 页面元素展示方法、服务信息提供方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111984891A (zh) | 页面展示方法、装置、电子设备和存储介质 | |
US20170154104A1 (en) | Real-time recommendation of reference documents | |
US20170371513A1 (en) | Method and apparatus for text selection | |
CN109471919B (zh) | 零代词消解方法及装置 | |
CN111898388A (zh) | 视频字幕翻译编辑方法、装置、电子设备及存储介质 | |
CN113673261A (zh) | 数据生成方法、装置及可读存储介质 | |
CN107424612B (zh) | 处理方法、装置和机器可读介质 | |
CN106503048B (zh) | 浏览器颜色设置方法和装置 | |
CN113343675A (zh) | 一种字幕生成方法、装置和用于生成字幕的装置 | |
WO2024124913A1 (zh) | 实体信息确定方法、装置和设备 | |
CN110781689B (zh) | 信息处理方法、装置及存储介质 | |
CN109977424B (zh) | 一种机器翻译模型的训练方法及装置 | |
CN114466204B (zh) | 一种视频弹幕的显示方法、装置、电子设备及存储介质 | |
CN115640093A (zh) | 一种页面渲染方法、装置、电子设备及存储介质 | |
CN108983992B (zh) | 一种具有标点符号的候选项展示方法和装置 | |
CN113127613B (zh) | 聊天信息处理方法及装置 | |
CN112579767B (zh) | 搜索处理方法、装置和用于搜索处理的装置 | |
CN114239531A (zh) | 模板推荐方法、装置、电子设备及存储介质 | |
CN115713641A (zh) | 视频获取方法、装置及存储介质 | |
CN106354749B (zh) | 信息显示方法及装置 | |
CN108241438B (zh) | 一种输入方法、装置和用于输入的装置 | |
CN113079311A (zh) | 图像获取方法及装置、电子设备、存储介质 | |
CN112182449A (zh) | 页面加载方法、装置、电子设备及存储介质 | |
CN111444687A (zh) | 一种标签生成方法、装置、服务器及存储介质 | |
WO2022105229A1 (zh) | 一种输入方法、装置和用于输入的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201124 |