CN108108382A - 收藏网页的处理方法及装置 - Google Patents

收藏网页的处理方法及装置 Download PDF

Info

Publication number
CN108108382A
CN108108382A CN201611063883.6A CN201611063883A CN108108382A CN 108108382 A CN108108382 A CN 108108382A CN 201611063883 A CN201611063883 A CN 201611063883A CN 108108382 A CN108108382 A CN 108108382A
Authority
CN
China
Prior art keywords
collection
title
webpage
participle
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611063883.6A
Other languages
English (en)
Inventor
高阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201611063883.6A priority Critical patent/CN108108382A/zh
Publication of CN108108382A publication Critical patent/CN108108382A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种收藏网页的处理方法及装置。该方法包括:获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页。通过本申请,解决了相关技术中收藏网页的效率较低,影响用户的体验度的问题。

Description

收藏网页的处理方法及装置
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种收藏网页的处理方法及装置。
背景技术
目前,chrome浏览器都有网页收藏夹的功能,用户可以建立多个收藏文件夹,在进行网页收藏时,用户可以选定对应分类的文件夹,然后将待收藏的网页收藏在对应分类的文件夹中,这都是按照网民自身对收藏网页内容的理解而进行的自定义收藏,如果用户未指定对应的收藏文件夹,则待收藏的网页会被收藏到一个默认的文件夹中。
当需要维护的收藏网页越来越多、收藏文件夹分类越来越多,也即,收藏文件夹变得复杂之后,用户选择收藏文件夹这个动作也会变得繁琐。例如,需要收藏一篇关于Soopat专利检索的网页,用户通常会将该类网页放在名称为专利的文件夹中,然而,在众多的收藏文件夹中找出名称为专利的文件夹,效率非常低,因此,导致收藏网页的效率较低,影响用户的体验度。
针对相关技术中收藏网页的效率较低,影响用户的体验度的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种收藏网页的处理方法及装置,以解决相关技术中收藏网页的效率较低,影响用户的体验度的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种收藏网页的处理方法。该方法包括:获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页。
进一步地,在获取收藏夹名称集合和待收藏网页的名称信息之前,该方法还包括:在当前浏览器上安装预设插件;获取收藏夹名称集合和待收藏网页的名称信息包括:当检测到在当前浏览器上执行网页收藏动作时,通过预设插件获取在当前浏览器中存储的所有收藏夹的名称,得到收藏夹名称集合;通过预设插件获取待收藏网页的html代码,从html代码中抓取待收藏网页的名称信息。
进一步地,根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值包括:对收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,其中,收藏夹名称分词集合包括至少一个收藏夹名称分词;根据至少一个网页名称分词对收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,确定与每个收藏夹的名称相关联的收藏夹名称分词与至少一个网页名称分词重合的个数;根据与至少一个网页名称分词重合的个数,得到每个收藏夹的名称的重合分值;将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
进一步地,按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面包括:在预设数据表中获取符合预设数值的重合分值;确定符合预设数值的重合分值对应的收藏夹的名称;将对应的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面。
进一步地,在按照预设规则将重合分值符合预设数值的收藏夹展示在当前浏览器的收藏界面之后,该方法还包括:接收选择指令,其中,选择指令用于指示在收藏界面上选择目标收藏夹;根据选择指令在收藏界面上选定目标收藏夹;将待收藏网页收藏在目标收藏夹中。
为了实现上述目的,根据本申请的另一方面,提供了一种收藏网页的处理装置。该装置包括:获取单元,用于获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;处理单元,用于对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;计算单元,用于根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及展示单元,用于按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页。
进一步地,该装置还包括:安装单元,用于在获取收藏夹名称集合和待收藏网页的名称信息之前,在当前浏览器上安装预设插件;获取单元包括:第一获取模块,用于当检测到在当前浏览器上执行网页收藏动作时,通过预设插件获取在当前浏览器中存储的所有收藏夹的名称,得到收藏夹名称集合;通过预设插件获取待收藏网页的html代码,从html代码中抓取待收藏网页的名称信息。
进一步地,计算单元包括:处理模块,用于对收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,其中,收藏夹名称分词集合包括至少一个收藏夹名称分词;第一确定模块,用于根据至少一个网页名称分词对收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,确定与每个收藏夹的名称相关联的收藏夹名称分词与至少一个网页名称分词重合的个数;第二确定模块,用于根据与至少一个网页名称分词重合的个数,得到每个收藏夹的名称的重合分值;存储模块,用于将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
进一步地,展示单元包括:第二获取模块,用于在预设数据表中获取符合预设数值的重合分值;第三确定模块,用于确定符合预设数值的重合分值对应的收藏夹的名称;展示模块,用于将对应的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面。
进一步地,该装置还包括:接收单元,用于在按照预设规则将重合分值符合预设数值的收藏夹展示在当前浏览器的收藏界面之后,接收选择指令,其中,选择指令用于指示在收藏界面上选择目标收藏夹;选择单元,用于根据选择指令在收藏界面上选定目标收藏夹;收藏单元,用于将待收藏网页收藏在目标收藏夹中。
通过本申请,采用以下步骤:获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页,解决了相关技术中收藏网页的效率较低,影响用户的体验度的问题。通过按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,提高了收藏网页的效率,进而也达到了提升用户的体验度的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的收藏网页的处理方法的流程图;以及
图2是根据本申请实施例提供的收藏网页的处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请的实施例,提供了一种收藏网页的处理方法。
图1是根据本申请实施例的收藏网页的处理方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称。
在当前浏览器上检测到执行了网页收藏动作时,获取当前浏览器上已存储的所有收藏夹的名称,例如,SUV汽车、汽车品牌、娱乐节目、工作资料等等收藏夹的名称。获取待收藏网页的名称信息,例如,在当前浏览器上检测到执行了网页收藏动作时,待收藏网页的名称信息为:suv汽车保养知识。
可选地,在本申请实施例提供的收藏网页的处理方法中,在获取收藏夹名称集合和待收藏网页的名称信息之前,该方法还包括:在当前浏览器上安装预设插件;获取收藏夹名称集合和待收藏网页的名称信息包括:当检测到在当前浏览器上执行网页收藏动作时,通过预设插件获取在当前浏览器中存储的所有收藏夹的名称,得到收藏夹名称集合;通过预设插件获取待收藏网页的html代码,从html代码中抓取待收藏网页的名称信息。
其中,该预设插件可以为chrome插件,当检测到在当前浏览器上执行网页收藏动作时,通过chrome插件获取在当前浏览器中存储的所有收藏夹的名称,得到收藏夹名称集合;通过chrome插件获取待收藏网页的html代码,从html代码中抓取待收藏网页的名称信息。需要说明的是,在本申请中,不限定通过chrome插件获取所有收藏夹的名称和待收藏网页的html代码的先后顺序。
步骤S102,对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词。
例如,待收藏网页的名称信息为:suv汽车保养知识。对其进行分词处理,得到多个网页名称分词,如:“suv”,“汽”,“车”,“保”,“养”,“知”,“识”。也即,网页名称分词集合中包括待收藏网页的名称信息的所有网页名称分词。
步骤S103,根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值。
可选地,在本申请实施例提供的收藏网页的处理方法中,根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值包括:对收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,其中,收藏夹名称分词集合包括至少一个收藏夹名称分词;根据至少一个网页名称分词对收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,确定与每个收藏夹的名称相关联的收藏夹名称分词与至少一个网页名称分词重合的个数;根据与至少一个网页名称分词重合的个数,得到每个收藏夹的名称的重合分值;将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
具体地,对收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,例如,对SUV汽车、汽车品牌、娱乐节目、工作资料分别进行分词处理,也即,对收藏夹名称为“SUV汽车”进行分词处理,得到其对应的收藏夹名称分词集合中包括:“SUV”,“汽”,“车”收藏夹名称分词;对收藏夹名称为“汽车品牌”进行分词处理,得到其对应的收藏夹名称分词集合中包括:“汽”,“车”,“品”,“牌”收藏夹名称分词;对收藏夹名称为“娱乐节目”进行分词处理,得到其对应的收藏夹名称分词集合中包括:“娱”,“乐”,“节”,“目”收藏夹名称分词,等等。
根据至少一个网页名称分词对收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,例如,根据“suv”,“汽”,“车”,“保”,“养”,“知”,“识”对“SUV”,“汽”,“车”进行求重运算,确定其重合的分词个数为3个。根据“suv”,“汽”,“车”,“保”,“养”,“知”,“识”对“汽”,“车”,“品”,“牌”进行求重运算,确定其重合的分词个数为2个。根据“suv”,“汽”,“车”,“保”,“养”,“知”,“识”对“娱”,“乐”,“节”,“目”进行求重运算,确定其重合的分词个数为0个,等等。根据与各个收藏夹名称分词集合重合的个数,得到每个收藏夹的名称的重合分值。例如,与收藏夹的名称为“SUV汽车”的重合分值为3,与收藏夹的名称为“汽车品牌”的重合分值为2,与收藏夹的名称为“娱乐节目”的重合分值为0,等等。然后将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
步骤S104,按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页。
也即,当用户待收藏网页时,自动将与之关联的收藏夹展示在当前浏览器的收藏界面,从而节省了用户从多个收藏夹中去寻找与待收藏的网页所匹配的收藏夹的时间,提升了用户的体验度。
可选地,在本申请实施例提供的收藏网页的处理方法中,按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面包括:在预设数据表中获取符合预设数值的重合分值;确定符合预设数值的重合分值对应的收藏夹的名称;将对应的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面。
例如,预设数值为3,也即,符合预设数值的重合分值对应的收藏夹的名称为“SUV汽车”,将“SUV汽车”的收藏夹展示在当前浏览器的收藏界面,便于用户收藏待收藏的网页。
也即,在本申请中通过将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面。从而实现自动为用户推荐收藏网页的收藏夹,节约用户收藏网页的时间,从而提升收藏网页的效率。
可选地,在本申请实施例提供的收藏网页的处理方法中,在按照预设规则将重合分值符合预设数值的收藏夹展示在当前浏览器的收藏界面之后,该方法还包括:接收选择指令,其中,选择指令用于指示在收藏界面上选择目标收藏夹;根据选择指令在收藏界面上选定目标收藏夹;将待收藏网页收藏在目标收藏夹中。
当符合预设数值的收藏夹的名称所关联的收藏夹为多个时,也即,存在多个收藏夹的重合分值符合预设数值,接收外部输入的选择指令,根据该选择指令从多个收藏夹中获取目标收藏夹,并将待收藏网页收藏在目标收藏夹中。
本申请实施例提供的收藏网页的处理方法,通过获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页,解决了相关技术中收藏网页的效率较低,影响用户的体验度的问题。通过按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,提高了收藏网页的效率,进而也达到了提升用户的体验度的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种收藏网页的处理装置,需要说明的是,本申请实施例的收藏网页的处理装置可以用于执行本申请实施例所提供的用于收藏网页的处理方法。以下对本申请实施例提供的收藏网页的处理装置进行介绍。
图2是根据本申请实施例的收藏网页的处理装置的示意图。如图2所示,该装置包括:获取单元10、处理单元20、计算单元30和展示单元40。
具体地,获取单元10,用于获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称。
处理单元20,用于对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词。
计算单元30,用于根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值。
展示单元40,用于按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页。
本申请实施例提供的收藏网页的处理装置,通过获取单元10获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;处理单元20对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;计算单元30根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及展示单元40按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页,解决了相关技术中收藏网页的效率较低,影响用户的体验度的问题,通过按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,提高了收藏网页的效率,进而也达到了提升用户的体验度的效果。
可选地,在本申请实施例提供的收藏网页的处理装置中,该装置还包括:安装单元,用于在获取收藏夹名称集合和待收藏网页的名称信息之前,在当前浏览器上安装预设插件;获取单元10包括:第一获取模块,用于当检测到在当前浏览器上执行网页收藏动作时,通过预设插件获取在当前浏览器中存储的所有收藏夹的名称,得到收藏夹名称集合;通过预设插件获取待收藏网页的html代码,从html代码中抓取待收藏网页的名称信息。
可选地,在本申请实施例提供的收藏网页的处理装置中,计算单元30包括:处理模块,用于对收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,其中,收藏夹名称分词集合包括至少一个收藏夹名称分词;第一确定模块,用于根据至少一个网页名称分词对收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,确定与每个收藏夹的名称相关联的收藏夹名称分词与至少一个网页名称分词重合的个数;第二确定模块,用于根据与至少一个网页名称分词重合的个数,得到每个收藏夹的名称的重合分值;存储模块,用于将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
可选地,在本申请实施例提供的收藏网页的处理装置中,展示单元40包括:第二获取模块,用于在预设数据表中获取符合预设数值的重合分值;第三确定模块,用于确定符合预设数值的重合分值对应的收藏夹的名称;展示模块,用于将对应的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面。
可选地,在本申请实施例提供的收藏网页的处理装置中,该装置还包括:接收单元,用于在按照预设规则将重合分值符合预设数值的收藏夹展示在当前浏览器的收藏界面之后,接收选择指令,其中,选择指令用于指示在收藏界面上选择目标收藏夹;选择单元,用于根据选择指令在收藏界面上选定目标收藏夹;收藏单元,用于将待收藏网页收藏在目标收藏夹中。
所述收藏网页的处理装置包括处理器和存储器,上述获取单元10、处理单元20、计算单元30和展示单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元实现相应功能。上述预设规则、预设数值、预设插件、预设数据表都可以存储在存储器中。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数处理收藏网页。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取收藏夹名称集合和待收藏网页的名称信息,其中,收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;对待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,网页名称分词集合包括至少一个网页名称分词;根据至少一个网页名称分词对收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在当前浏览器的收藏界面,其中,收藏界面用于引导收藏待收藏网页。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种收藏网页的处理方法,其特征在于,包括:
获取收藏夹名称集合和待收藏网页的名称信息,其中,所述收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;
对所述待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,所述网页名称分词集合包括至少一个网页名称分词;
根据所述至少一个网页名称分词对所述收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及
按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在所述当前浏览器的收藏界面,其中,所述收藏界面用于引导收藏所述待收藏网页。
2.根据权利要求1所述的方法,其特征在于,
在获取收藏夹名称集合和待收藏网页的名称信息之前,所述方法还包括:在所述当前浏览器上安装预设插件;
获取收藏夹名称集合和待收藏网页的名称信息包括:当检测到在所述当前浏览器上执行网页收藏动作时,通过所述预设插件获取在所述当前浏览器中存储的所有收藏夹的名称,得到所述收藏夹名称集合;通过所述预设插件获取所述待收藏网页的html代码,从所述html代码中抓取所述待收藏网页的名称信息。
3.根据权利要求1所述的方法,其特征在于,根据所述至少一个网页名称分词对所述收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值包括:
对所述收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,其中,收藏夹名称分词集合包括至少一个收藏夹名称分词;
根据所述至少一个网页名称分词对所述收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,确定与每个收藏夹的名称相关联的收藏夹名称分词与所述至少一个网页名称分词重合的个数;
根据与所述至少一个网页名称分词重合的个数,得到每个收藏夹的名称的重合分值;
将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
4.根据权利要求3所述的方法,其特征在于,按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在所述当前浏览器的收藏界面包括:
在所述预设数据表中获取符合预设数值的重合分值;
确定所述符合预设数值的重合分值对应的收藏夹的名称;
将所述对应的收藏夹的名称所关联的收藏夹展示在所述当前浏览器的收藏界面。
5.根据权利要求1所述的方法,其特征在于,在按照预设规则将重合分值符合预设数值的收藏夹展示在所述当前浏览器的收藏界面之后,所述方法还包括:
接收选择指令,其中,所述选择指令用于指示在所述收藏界面上选择目标收藏夹;
根据所述选择指令在所述收藏界面上选定所述目标收藏夹;
将所述待收藏网页收藏在所述目标收藏夹中。
6.一种收藏网页的处理装置,其特征在于,包括:
获取单元,用于获取收藏夹名称集合和待收藏网页的名称信息,其中,所述收藏夹名称集合包括当前浏览器中存储的所有收藏夹的名称;
处理单元,用于对所述待收藏网页的名称信息进行分词处理,得到网页名称分词集合,其中,所述网页名称分词集合包括至少一个网页名称分词;
计算单元,用于根据所述至少一个网页名称分词对所述收藏夹名称集合中每个收藏夹的名称进行求重运算,得到每个收藏夹的名称的重合分值;以及
展示单元,用于按照预设规则将重合分值符合预设数值的收藏夹的名称所关联的收藏夹展示在所述当前浏览器的收藏界面,其中,所述收藏界面用于引导收藏所述待收藏网页。
7.根据权利要求6所述的装置,其特征在于,
所述装置还包括:安装单元,用于在获取收藏夹名称集合和待收藏网页的名称信息之前,在所述当前浏览器上安装预设插件;
所述获取单元包括:第一获取模块,用于当检测到在所述当前浏览器上执行网页收藏动作时,通过所述预设插件获取在所述当前浏览器中存储的所有收藏夹的名称,得到所述收藏夹名称集合;通过所述预设插件获取所述待收藏网页的html代码,从所述html代码中抓取所述待收藏网页的名称信息。
8.根据权利要求6所述的装置,其特征在于,所述计算单元包括:
处理模块,用于对所述收藏夹名称集合中每个收藏夹的名称进行分词处理,得到收藏夹名称分词集合,其中,收藏夹名称分词集合包括至少一个收藏夹名称分词;
第一确定模块,用于根据所述至少一个网页名称分词对所述收藏夹名称分词集合中的至少一个收藏夹名称分词进行求重运算,确定与每个收藏夹的名称相关联的收藏夹名称分词与所述至少一个网页名称分词重合的个数;
第二确定模块,用于根据与所述至少一个网页名称分词重合的个数,得到每个收藏夹的名称的重合分值;
存储模块,用于将得到的每个收藏夹的名称的重合分值存储在预设数据表中。
9.根据权利要求8所述的装置,其特征在于,所述展示单元包括:
第二获取模块,用于在所述预设数据表中获取符合预设数值的重合分值;
第三确定模块,用于确定所述符合预设数值的重合分值对应的收藏夹的名称;
展示模块,用于将所述对应的收藏夹的名称所关联的收藏夹展示在所述当前浏览器的收藏界面。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
接收单元,用于在按照预设规则将重合分值符合预设数值的收藏夹展示在所述当前浏览器的收藏界面之后,接收选择指令,其中,所述选择指令用于指示在所述收藏界面上选择目标收藏夹;
选择单元,用于根据所述选择指令在所述收藏界面上选定所述目标收藏夹;
收藏单元,用于将所述待收藏网页收藏在所述目标收藏夹中。
CN201611063883.6A 2016-11-25 2016-11-25 收藏网页的处理方法及装置 Pending CN108108382A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611063883.6A CN108108382A (zh) 2016-11-25 2016-11-25 收藏网页的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611063883.6A CN108108382A (zh) 2016-11-25 2016-11-25 收藏网页的处理方法及装置

Publications (1)

Publication Number Publication Date
CN108108382A true CN108108382A (zh) 2018-06-01

Family

ID=62204625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611063883.6A Pending CN108108382A (zh) 2016-11-25 2016-11-25 收藏网页的处理方法及装置

Country Status (1)

Country Link
CN (1) CN108108382A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268184A (zh) * 2021-05-29 2021-08-17 五八到家有限公司 浏览器标签页切换方法及装置、电子设备及可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6100890A (en) * 1997-11-25 2000-08-08 International Business Machines Corporation Automatic bookmarks
CN102722322A (zh) * 2012-05-22 2012-10-10 百度在线网络技术(北京)有限公司 一种用于收藏页面对象的方法与设备
CN102830894A (zh) * 2012-05-11 2012-12-19 北京奇虎科技有限公司 一种收藏网页的方法和装置
CN103324669A (zh) * 2013-05-20 2013-09-25 北京奇虎科技有限公司 一种对网页书签进行处理的方法和客户端
CN103631796A (zh) * 2012-08-22 2014-03-12 纬创资通股份有限公司 网址分类管理方法及电子装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6100890A (en) * 1997-11-25 2000-08-08 International Business Machines Corporation Automatic bookmarks
CN102830894A (zh) * 2012-05-11 2012-12-19 北京奇虎科技有限公司 一种收藏网页的方法和装置
CN102722322A (zh) * 2012-05-22 2012-10-10 百度在线网络技术(北京)有限公司 一种用于收藏页面对象的方法与设备
CN103631796A (zh) * 2012-08-22 2014-03-12 纬创资通股份有限公司 网址分类管理方法及电子装置
CN103324669A (zh) * 2013-05-20 2013-09-25 北京奇虎科技有限公司 一种对网页书签进行处理的方法和客户端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
樊重俊 等: "《大数据分析与应用》", 31 January 2016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268184A (zh) * 2021-05-29 2021-08-17 五八到家有限公司 浏览器标签页切换方法及装置、电子设备及可读介质

Similar Documents

Publication Publication Date Title
CN104462152B (zh) 一种网页的识别方法及装置
CN103116638B (zh) 网页筛选方法及装置
CN103530365B (zh) 获取资源的下载链接的方法及***
CN104409080B (zh) 语音端点检测方法和装置
CN107122806A (zh) 一种敏感图像识别方法及装置
CN106446179B (zh) 热点话题的生成方法及装置
CA2612895A1 (en) Systems and methods for providing search results
CN104809751B (zh) 生成事件组演化图的方法和装置
CN104408102A (zh) 用于网络热词与对象的关联度的数据处理方法和装置
CN103984757B (zh) 在搜索结果页上***新闻信息条目的方法和***
CN105302815B (zh) 网页的统一资源定位符url的过滤方法和装置
CN107563974A (zh) 图像去噪方法、装置、电子设备及存储介质
CN110647896A (zh) 一种基于logo图像的钓鱼页面识别方法及相关设备
CN109409964A (zh) 优质品牌的识别方法及装置
CN107016589A (zh) 推荐产品的确定方法及装置
CN109634981A (zh) 一种数据库扩充方法及装置
CN102902790B (zh) 网页分类***及方法
CN103530337A (zh) 识别统一资源定位符url中无效参数的设备及方法
CN108108382A (zh) 收藏网页的处理方法及装置
CN104216820B (zh) 一种浏览器性能测试方法、装置及服务器
CN110647895A (zh) 一种基于登录框图像的钓鱼页面识别方法及相关设备
CN108920955B (zh) 一种网页后门检测方法、装置、设备及存储介质
CN105224533B (zh) 浏览器收藏夹整理方法和装置
CN105302715B (zh) 应用程序用户界面的获取方法和装置
CN106663317A (zh) 数字图像的形态学处理方法和数字图像处理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601

RJ01 Rejection of invention patent application after publication