CN111767439B - 基于页面分类标签的推荐方法、设备和介质 - Google Patents
基于页面分类标签的推荐方法、设备和介质 Download PDFInfo
- Publication number
- CN111767439B CN111767439B CN202010601019.7A CN202010601019A CN111767439B CN 111767439 B CN111767439 B CN 111767439B CN 202010601019 A CN202010601019 A CN 202010601019A CN 111767439 B CN111767439 B CN 111767439B
- Authority
- CN
- China
- Prior art keywords
- page
- title
- classification
- page title
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 239000000463 material Substances 0.000 claims abstract description 14
- 230000000875 corresponding effect Effects 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 26
- 238000013145 classification model Methods 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 6
- 230000002596 correlated effect Effects 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 5
- 230000003936 working memory Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供一种基于页面分类标签的推荐方法、设备和介质,涉及人工智能技术领域,可应用于智能推荐场景。所述基于页面分类标签的推荐方法包括:获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及基于所述目标页面标题相应的至少一个第一页面分类标签,以及所述至少一个相关页面标题中的每一个所述相关页面标题相应的至少一个第二页面分类标签,执行推荐物料。
Description
技术领域
本公开涉及人工智能技术领域,可应用于智能推荐场景,特别涉及一种基于页面分类标签的推荐方法、页面分类标签的推荐方法及设备和介质。
背景技术
相关技术中,根据用户搜索查询,以页面标题的形式推荐网页,用户可以通过页面标题来打开相应的网页。对于当前显示的页面,根据用户搜索查询中的关键词来召回广告,所述关键词为客户在关键词库中竞价投放的关键词。这种广告召回方式,存在单个客户投放的关键词稀疏,很难覆盖长尾流量等问题,从而导致客户流量遇到瓶颈,广告的准召率较低。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
根据本公开的一方面,提供一种基于页面分类标签的推荐方法,包括:获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及基于所述目标页面标题相应的至少一个第一页面分类标签,以及所述至少一个相关页面标题中的每一个所述相关页面标题相应的至少一个第二页面分类标签,执行推荐物料。
根据本公开的另一方面,还提供一种页面分类标签的推荐方法,包括:获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及将所述至少一个相关页面标题中的每一个相关页面标题相应的至少一个第二页面分类标签推荐给所述目标页面标题。
根据本公开的另一方面,还提供一种基于页面分类标签的推荐设备,包括:第一获取单元,被配置用于获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及第一推荐单元,被配置用于基于所述目标页面标题相应的至少一个第一页面分类标签,以及所述至少一个相关页面标题中的每一个相关页面标题相应的至少一个第二页面分类标签,执行推荐物料。
根据本公开的另一方面,还提供一种页面分类标签的推荐设备,包括:第二获取单元,被配置用于获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及第二推荐单元,被配置用于将所述至少一个相关页面标题中的每一个相关页面标题相应的至少一个第二页面分类标签推荐给所述目标页面标题。
根据本公开的另一方面,还提供一种电子设备,包括:处理器;以及存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据上述的基于页面分类标签的推荐方法或根据上述的页面分类标签的推荐方法。
根据本公开的另一方面,还提供一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据上述的基于页面分类标签的推荐方法或根据上述的页面分类标签的推荐方法。
根据本公开的另一方面,还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现上述方法的步骤。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1-图4是示出根据示例性实施例的基于页面分类标签的推荐方法的流程图;
图5是示出根据示例性实施例的页面分类标签的推荐方法的流程图;
图6是示出根据示例性实施例的基于页面分类标签的推荐设备的组成框图;
图7是示出根据示例性实施例的页面分类标签的推荐设备的组成框图;
图8是示出能够应用于示例性实施例的示例性计算设备的结构框图。
具体实施方式
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
相关技术中,基于用户搜索查询中的关键词来召回广告,并将召回的广告投放在当前显示的页面中。这种广告召回方式,存在单个客户投放的关键词稀疏,很难覆盖长尾流量等问题。从而导致客户流量遇到瓶颈,广告的准召率较低。
为了解决上述技术问题,本公开通过获取目标页面标题的相关页面标题,并根据目标页面标题的页面分类标签以及相关页面标题的页面分类标签,来召回广告。由此,能够基于页面分类标签的相关性来扩展目标网页的触发数据。由于基于目标页面标题的页面分类标签进行广告召回能够实现对某一类商品相应的广告进行召回,并且通过将相关页面标题的页面分类标签推荐给目标页面标题,从而能够基于相关的页面分类标签实现相关类商品相应的广告进行召回,能够覆盖长尾流量,提高广告的准召率,提升变现效率。
上述技术方案也可以被配置为基于关键词进行广告召回的一种有效补充,即可以同时利用上述技术方案和基于用户搜索询问的关键词进行广告召回。
需要说明的是,本公开的技术方案不局限于用于广告召回的应用场景,也可以应用于其它物料推荐应用场景。例如,在知识点投放***,可以根据页面分类标签的相关性,推荐用户可能感兴趣的相关知识点。
本公开的目标页面根据具体的应用场景,可以为相应的知识点页面、购买商品页面或多媒体播放页面等等,在此不作限定。
以下将以广告召回应用场景为例,结合附图对本公开的基于页面分类标签的推荐方法进行进一步描述。
图1是示出根据本公开示例性实施例的基于页面分类标签的推荐方法的流程图。如图1所示,所述推荐方法可以包括:步骤S101、获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及步骤S102、基于所述目标页面标题相应的至少一个第一页面分类标签,以及所述至少一个相关页面标题中的每一个所述相关页面标题相应的至少一个第二页面分类标签,执行推荐物料。
在广告召回应用场景中,推荐的物料可为广告。基于目标页面标题相应的至少一个第一页面分类标签能够实现对至少一类商品相应的广告进行召回,而通过将至少一个相关页面标题相应的至少一个第二页面分类标签推荐给目标页面标题,能够基于相关的至少一个第二页面分类标签实现对相关类商品相应的广告进行召回,从而能够覆盖长尾流量,提高广告的准召率,提升变现效率。
所述目标页面标题例如可以为当前显示页面的页面标题,也可以为在***日志中存储的近期展现过的历史页面的标题,在此不作限定。
所述页面扩展集可以但不限于从***日志中存储的最近一段时间内展现过的历史页面标题中获得。例如,在所述目标页面标题为当前显示页面的页面标题的情况下,所述页面扩展集也可以从打开当前显示页面的用户浏览过的历史页面标题中获得。至于如何确定一个历史页面标题是否与所述目标页面标题相关,将在以下内容中描述。
所述页面分类标签可以但不限于为基于页面标题和/或相应的页面内容进行分类打标而得到。根据一些实施例,所述页面分类标签可以包括多级分类标签,例如可以包括一级分类标签、二级分类标签和三级分类标签。在页面分类体系中,一级分类标签可以包括多个二级分类标签,二级分类标签也可以包括多个三级分类标签。例如,页面分类标签可以为“体育-篮球-篮球用品”、“体育-乒乓球-乒乓球用品”、“体育-篮球-篮球赛事”或“体育-篮球-篮球培训”。其中,“体育”为一级分类标签,可以包括二级分类标签“篮球”和“乒乓球”。二级分类标签“篮球”可以包括三级分类标签“篮球用品”、“篮球赛事”和“篮球篮球培训”。
本公开中,在显示页面标题相应的页面时,不显示页面分类标签。
根据一些实施例,如图2所示,所述推荐方法还可以包括:步骤S201、在所述执行推荐物料之前,从所述目标页面标题相应的多个第一页面分类标签中确定与所述目标页面标题相关性最好的所述至少一个第一页面分类标签。从而能够基于与目标页面标题相关性最好的页面分类标签来执行推荐物料,进一步提高广告的准召率。例如,目标页面标题为“CBA复赛”,所述多个第一页面分类标签可以包括:“体育-篮球-篮球用品”、“体育-篮球-篮球赛事”和“体育-篮球-篮球培训”。与目标页面标题相关性最好的所述至少一个页面分类标签可以包括:“体育-篮球-篮球用品”和“体育-篮球-篮球赛事”。
根据一些实施例,如图2所示,所述推荐方法还可以包括:步骤S202、在所述执行推荐物料之前,针对所述至少一个相关页面标题,从每一个所述相关页面标题相应的多个第二页面分类标签中确定与该相关页面标题相关性最好的所述至少一个第二页面分类标签。
需要说明的是,所述至少一个第一页面分类标签与所述目标页面标题相关性最好可以是指:在所述多个第一页面分类标签中,所述至少一个第一页面分类标签中的任一第一页面分类标签的相关分数大于剩余第一页面分类标签的相关分数。其中,所述第一页面分类标签的相关分数能够表征该第一页面分类标签与所述目标页面标题的相关程度。同样地,所述至少一个第二页面分类标签与所述相关页面标题相关性最好可以是指:在所述多个第二页面分类标签中,所述至少一个第二页面分类标签中的任一第二页面分类标签的相关分数大于剩余第二页面分类标签的相关分数。其中,所述第二页面分类标签的相关分数能够表征该第二页面分类标签与相应的所述相关页面标题的相关程度。
根据一些示例性实施例中,所述至少一个第一页面分类标签可以为:所述多个第一页面分类标签中的与所述目标页面标题相关性最好的页面分类标签,并且针对每一个相关页面标题,相应的所述至少一个第二页面分类标签可以为:该相关页面标题相应的多个第二页面分类标签中的与该相关页面标题相关性最好的页面分类标签。从而能够提高基于目标页面标题的所述至少一个第一页面分类标签进行广告召回的准召率,并且提高基于相关页面标题的所述至少一个第二页面分类标签进行广告召回的准召率,能够大大提高广告召回的准召率。可以理解的是,也可以仅执行上述步骤201或上述步骤202,即图2中可以不同时包括步骤201和步骤202。
以下将以示例性实施例来说明如何确定与目标页面标题相关性最好的所述至少一个第一页面分类标签,以及与每一个相关页面标题相关性最好的所述至少一个第二页面分类标签。
在一个示例性实施例中,如图3所示,所述推荐方法还可以包括:步骤S301、对第一预训练模型进行微调,得到分类模型;以及步骤S302、将所述目标页面标题以及相应的多个第一页面分类标签输入所述分类模型,获取所述分类模型输出的所述多个第一页面分类标签各自与所述目标页面标题相关的相关分数。其中,在所述多个第一页面分类标签中,所述至少一个第一页面分类标签的相关分数最高。由此,通过对预训练模型进行微调,能够加快训练得到分类模型,而且可以适用于训练数据较少的场景。另外,通过分类模型能够提高确定所述至少一个第一页面分类标签的效率。可以理解的是,也可以不基于预训练模型进行微调来得到所述分类模型,而是利用训练数据直接训练得到所述分类模型。
同样地,也可以利用分类模型来确定相关性最好的所述至少一个第二页面分类标签。在这种情况下,如图3所示,所述推荐方法还可以包括:步骤S303、将所述每一个相关页面标题和该相关页面标题相应的多个第二页面分类标签输入所述分类模型,获取所述分类模型输出的所述多个第二页面分类标签各自与该相关页面标题相关的相关分数。其中,在所述每一个相关页面标题的所述多个第二页面分类标签中,所述至少一个第二页面分类标签的相关分数最高。
所述第一预训练模型例如可以为ernie预训练模型。
上述给出了利用分类模型来确定所述至少一个第一页面分类标签和所述至少一个第二页面分类标签。可以理解的是,也可以利用其它方法(例如,支持向量机分类器)来确定所述至少一个第一页面分类标签和所述至少一个第二页面分类标签,在此不作限定。
根据一些实施例,也可以利用神经网络模型来确定所述目标页面标题的页面扩展集,即,利用神经网络模型来确定所述目标页面标题的相关页面标题。在这种情况下,如图4所示,所述推荐方法还可以包括:步骤S401、对第二预训练模型进行微调,得到句向量模型;以及步骤S402、将所述目标页面标题和设定的多个页面标题输入所述句向量模型,获取所述目标页面标题相应的句向量,以及所述设定的多个页面标题中的每一个页面标题相应的句向量。其中,步骤S101、获取目标页面标题的页面扩展集可以包括:步骤S1011、基于相应的句向量,从所述设定的多个页面标题中确定与所述目标页面标题相关的所述至少一个相关页面标题。由此,通过对预训练模型进行微调,能够加快训练得到句向量模型,而且可以适用于训练数据较少的场景。另外,通过句向量模型能够提高确定相关页面标题的效率。可以理解的是,也可以不基于预训练模型进行微调来得到所述句向量模型,而是利用训练数据直接训练得到所述句向量模型。例如,目标页面标题为“体育运动”,所述至少一个相关页面标题可以包括:“篮球运动”、“乒乓球运动”或“游泳”等等。
所述第二预训练模型例如可以为ernie预训练模型。
根据一些实施例,所述推荐方法还可以包括:利用所述设定的多个页面标题中的每一个页面标题相应的句向量,建立索引库(例如faiss索引库)。在这种情况下,步骤S1011可以包括:在所述索引库中进行检索,得到与所述目标页面标题的句向量语义相似度最高的多个句向量;将所述多个句向量中的每一个句向量相应的页面标题确定为所述相关页面标题。从而能够快速得到与所述目标页面标题的句向量语义相似度最高的所述多个句向量。例如,可以利用近似最近邻检索方法在所述索引库中进行检索。
根据一些实施例,可以在确定与目标页面标题语义相似度最高的所述至少一个相关页面标题之后,执行上述步骤S201(确定与目标页面标题相关性最好的所述至少一个第一页面标签)和步骤S202(确定与相关页面标题相关性最好的所述至少一个第二页面分类标签)中的至少其中之一,从而能够进一步提高广告的准召率,并提高召回效率。
需要说明的是,以上仅是以广告召回的应用场景为例来详细描述本公开中的基于面分类标签的推荐方法。本公开的技术方案也适用于其它推荐***。
根据本公开的另一个方面,还提供一种页面分类标签的推荐方法。如图5所示,所述推荐方法可以包括:步骤S501、获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及步骤S502、将所述至少一个相关页面标题中的每一个相关页面标题相应的至少一个第二页面分类标签推荐给所述目标页面标题。从而能够实现对目标页面标题需要的页面分类标签的相关扩展,可以基于扩展后的页面分类标签执行相应的操作(例如推荐物料)。
根据一些实施例,所述推荐方法还可以包括:从所述目标页面标题相应的多个第一页面分类标签中确定与所述目标页面标题相关性最好的所述至少一个第一页面分类标签;以及删除所述多个第一页面分类标签中的除所述至少一个第一页面分类标签以外的剩余第一页面分类标签。由此,通过删除与目标页面标题相关性不好的页面分类标签,能够避免不必要地占用机器资源,提升***性能。可以理解的是,也可以不删除与目标页面标题相关性不好的页面分类标签。
根据一些实施例,所述推荐方法可以包括:在将所述每一个相关页面标题相应的至少一个第二页面分类标签推荐给所述目标页面标题之前,针对所述至少一个相关页面标题,从每一个所述相关页面标题相应的多个第二页面分类标签中确定与该相关页面标题相关性最好的所述至少一个第二页面分类标签。从而能够将与相关页面标题相关性最好的页面分类标签推荐给目标页面标题,而不将与相关页面标题相关性不好的页面分类标签推荐给目标页面标题,能够避免不必要地占用机器资源,提升***性能。
根据一些示例性实施例,目标页面标题的扩展后的分类标签可以包括与所述目标页面标题相关性最好的所述至少一个第一页面分类标签,以及与所述至少一个相关页面标题中的每一个相关页面标题相关性最好的所述至少一个第二页面分类标签。由此,能够保证目标页面标题的扩展后的所有页面分类标签相关较好,提高基于扩展后的页面分类标签进行广告召回的准召率。可以理解的是,也可以仅确定与目标页面标题的相关性最好的所述至少一个第一页面分类标签或确定与相应的相关页面标题的相关性最好的所述至少一个第二页面分类标签。
根据本公开的另一个方面,如图6所示,还提供一种基于页面分类标签的推荐设备100,可以包括:第一获取单元101,被配置用于获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及第一推荐单元102,被配置用于基于所述目标页面标题相应的至少一个第一页面分类标签,以及所述至少一个相关页面标题中的每一个相关页面标题相应的至少一个第二页面分类标签,执行推荐物料。
这里,基于页面分类标签的推荐设备100的上述各单元101和102的操作分别与前面描述的步骤S101和S102的操作类似,在此不再赘述。
根据本公开的另一个方面,如图7所示,还提供一种页面分类标签的推荐设备500,可以包括:第二获取单元501,被配置用于获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及第二推荐单元502,被配置用于将所述至少一个相关页面标题中的每一个相关页面标题相应的至少一个第二页面分类标签推荐给所述目标页面标题。
这里,页面分类标签的推荐设备500的上述各单元501和502的操作分别与前面描述的步骤S501和S502的操作类似,在此不再赘述。
根据本公开的另一方面,还提供一种电子设备,可以包括:处理器;以及存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据上述的基于页面分类标签的推荐方法或根据上述的页面分类标签的推荐方法。
根据本公开的另一方面,还提供一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据上述的基于页面分类标签的推荐方法或根据上述的页面分类标签的推荐方法。
参见图8所示,现将描述计算设备2000,其是可以应用于本公开的各方面的硬件设备(电子设备)的示例。计算设备2000可以是被配置为执行处理和/或计算的任何机器,可以是但不限于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数字助理、机器人、智能电话、车载计算机或其任何组合。上述推荐方法可以全部或至少部分地由计算设备2000或类似设备或***实现。
计算设备2000可以包括(可能经由一个或多个接口)与总线2002连接或与总线2002通信的元件。例如,计算设备2000可以包括总线2002、一个或多个处理器2004、一个或多个输入设备2006以及一个或多个输出设备2008。一个或多个处理器2004可以是任何类型的处理器,并且可以包括但不限于一个或多个通用处理器和/或一个或多个专用处理器(例如特殊处理芯片)。输入设备2006可以是能向计算设备2000输入信息的任何类型的设备,并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或遥控器。输出设备2008可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。计算设备2000还可以包括非暂时性存储设备2010或者与非暂时性存储设备2010连接,非暂时性存储设备可以是非暂时性的并且可以实现数据存储的任何存储设备,并且可以包括但不限于磁盘驱动器、光学存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁介质,光盘或任何其他光学介质、ROM(只读存储器)、RAM(随机存取存储器)、高速缓冲存储器和/或任何其他存储器芯片或盒、和/或计算机可从其读取数据、指令和/或代码的任何其他介质。非暂时性存储设备2010可以从接口拆卸。非暂时性存储设备2010可以具有用于实现上述方法和步骤的数据/程序(包括指令)/代码。计算设备2000还可以包括通信设备2012。通信设备2012可以是使得能够与外部设备和/或与网络通信的任何类型的设备或***,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信设备和/或芯片组,例如蓝牙TM设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算设备2000还可以包括工作存储器2014,其可以是可以存储对处理器2004的工作有用的程序(包括指令)和/或数据的任何类型的工作存储器,并且可以包括但不限于随机存取存储器和/或只读存储器设备。
软件要素(程序)可以位于工作存储器2014中,包括但不限于操作***2016、一个或多个应用程序2018、驱动程序和/或其他数据和代码。用于执行上述方法和步骤的指令可以被包括在一个或多个应用程序2018中,并且上述推荐方法可以通过由处理器2004读取和执行一个或多个应用程序2018的指令来实现。更具体地,上述推荐方法中,步骤S101~步骤S102可以例如通过处理器2004执行具有步骤S101~步骤S102的指令的应用程序2018而实现。此外,上述推荐方法中的其它步骤可以例如通过处理器2004执行具有执行相应步骤中的指令的应用程序2018而实现。软件要素(程序)的指令的可执行代码或源代码可以存储在非暂时性计算机可读存储介质(例如上述存储设备2010)中,并且在执行时可以被存入工作存储器2014中(可能被编译和/或安装)。软件要素(程序)的指令的可执行代码或源代码也可以从远程位置下载。
还应该理解,可以根据具体要求而进行各种变型。例如,也可以使用定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语言或其任何组合来实现特定元件。例如,所公开的方法和设备中的一些或全部可以通过使用根据本公开的逻辑和算法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件(例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。
还应该理解,前述方法可以通过服务器-客户端模式来实现。例如,客户端可以接收用户输入的数据并将所述数据发送到服务器。客户端也可以接收用户输入的数据,进行前述方法中的一部分处理,并将处理所得到的数据发送到服务器。服务器可以接收来自客户端的数据,并且执行前述方法或前述方法中的另一部分,并将执行结果返回给客户端。客户端可以从服务器接收到方法的执行结果,并例如可以通过输出设备呈现给用户。
还应该理解,计算设备2000的组件可以分布在网络上。例如,可以使用一个处理器执行一些处理,而同时可以由远离该一个处理器的另一个处理器执行其他处理。计算***2000的其他组件也可以类似地分布。这样,计算设备2000可以被解释为在多个位置执行处理的分布式计算***。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、***和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
Claims (7)
1.一种基于页面分类标签的推荐方法,包括:
获取目标页面标题的页面扩展集,所述页面扩展集包括所述目标页面标题的至少一个相关页面标题;以及
基于所述目标页面标题相应的至少一个第一页面分类标签,以及所述至少一个相关页面标题中的每一个所述相关页面标题相应的至少一个第二页面分类标签,执行推荐物料,其中,所述至少一个第一页面分类标签和所述至少一个第二页面分类标签包括多级分类标签,
所述推荐方法还包括:
对第一预训练模型进行微调,得到分类模型;以及
将所述目标页面标题以及相应的多个第一页面分类标签输入所述分类模型,获取所述分类模型输出的所述多个第一页面分类标签各自与所述目标页面标题相关的相关分数,其中,在所述多个第一页面分类标签中,所述至少一个第一页面分类标签的相关分数最高,
所述推荐方法还包括:
对第二预训练模型进行微调,得到句向量模型;以及
将所述目标页面标题和设定的多个页面标题输入所述句向量模型,获取所述目标页面标题相应的句向量,以及所述设定的多个页面标题中的每一个页面标题相应的句向量,
其中,获取目标页面标题的页面扩展集包括:
基于相应的句向量,从所述设定的多个页面标题中确定与所述目标页面标题相关的所述至少一个相关页面标题;
其中,所述第一预训练模型为ernie预训练模型,并且所述第二预训练模型为ernie预训练模型。
2.如权利要求1所述的推荐方法,还包括:
在所述执行推荐物料之前,从所述目标页面标题相应的多个第一页面分类标签中确定与所述目标页面标题相关性最好的所述至少一个第一页面分类标签。
3.如权利要求1或2所述的推荐方法,还包括:
在所述执行推荐物料之前,针对所述至少一个相关页面标题,从每一个所述相关页面标题相应的多个第二页面分类标签中确定与该相关页面标题相关性最好的所述至少一个第二页面分类标签。
4.如权利要求1所述的推荐方法,还包括:
将所述每一个相关页面标题和该相关页面标题相应的多个第二页面分类标签输入所述分类模型,获取所述分类模型输出的所述多个第二页面分类标签各自与该相关页面标题相关的相关分数,
其中,在所述每一个相关页面标题的所述多个第二页面分类标签中,所述至少一个第二页面分类标签的相关分数最高。
5.如权利要求1所述的推荐方法,还包括:
利用所述设定的多个页面标题中的每一个页面标题相应的句向量,建立索引库,
其中,基于相应的句向量,从所述设定的多个页面标题中确定与所述目标页面标题相关的所述至少一个相关页面标题包括:
在所述索引库中进行检索,得到与所述目标页面标题的句向量语义相似度最高的多个句向量;
将所述多个句向量中的每一个句向量相应的页面标题确定为所述相关页面标题。
6.一种电子设备,包括:
处理器;以及
存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-5中任一项所述的基于页面分类标签的推荐方法。
7.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据权利要求1-5中任一项所述的基于页面分类标签的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010601019.7A CN111767439B (zh) | 2020-06-28 | 2020-06-28 | 基于页面分类标签的推荐方法、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010601019.7A CN111767439B (zh) | 2020-06-28 | 2020-06-28 | 基于页面分类标签的推荐方法、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111767439A CN111767439A (zh) | 2020-10-13 |
CN111767439B true CN111767439B (zh) | 2023-12-15 |
Family
ID=72722489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010601019.7A Active CN111767439B (zh) | 2020-06-28 | 2020-06-28 | 基于页面分类标签的推荐方法、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111767439B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7853622B1 (en) * | 2007-11-01 | 2010-12-14 | Google Inc. | Video-related recommendations using link structure |
CN101923545A (zh) * | 2009-06-15 | 2010-12-22 | 北京百分通联传媒技术有限公司 | 一种个性化信息推荐的方法 |
CN102880694A (zh) * | 2012-09-19 | 2013-01-16 | 北京奇虎科技有限公司 | 在新标签页中加载分类频道的浏览器客户端和方法 |
CN104199857A (zh) * | 2014-08-14 | 2014-12-10 | 西安交通大学 | 一种基于多标签分类的税务文档层次分类方法 |
CN108897871A (zh) * | 2018-06-29 | 2018-11-27 | 北京百度网讯科技有限公司 | 文档推荐方法、装置、设备及计算机可读介质 |
CN109376309A (zh) * | 2018-12-28 | 2019-02-22 | 北京百度网讯科技有限公司 | 基于语义标签的文档推荐方法和装置 |
CN109919641A (zh) * | 2017-12-12 | 2019-06-21 | 优视科技有限公司 | 一种广告投放方法及平台 |
CN110941740A (zh) * | 2019-11-08 | 2020-03-31 | 腾讯科技(深圳)有限公司 | 视频推荐方法及计算机可读存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814083A (zh) * | 2010-01-08 | 2010-08-25 | 上海复歌信息科技有限公司 | 网页自动分类方法和*** |
CN105868291A (zh) * | 2012-07-10 | 2016-08-17 | 北京奇虎科技有限公司 | 推荐网址的方法、装置及*** |
CN104281699B (zh) * | 2014-10-15 | 2017-11-17 | 百度在线网络技术(北京)有限公司 | 搜索推荐方法及装置 |
CN106294730A (zh) * | 2016-08-09 | 2017-01-04 | 百度在线网络技术(北京)有限公司 | 资讯信息的推荐方法及装置 |
CN109471937A (zh) * | 2018-10-11 | 2019-03-15 | 平安科技(深圳)有限公司 | 一种基于机器学习的文本分类方法及终端设备 |
CN109614482B (zh) * | 2018-10-23 | 2022-06-03 | 北京达佳互联信息技术有限公司 | 标签的处理方法、装置、电子设备及存储介质 |
-
2020
- 2020-06-28 CN CN202010601019.7A patent/CN111767439B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7853622B1 (en) * | 2007-11-01 | 2010-12-14 | Google Inc. | Video-related recommendations using link structure |
CN101923545A (zh) * | 2009-06-15 | 2010-12-22 | 北京百分通联传媒技术有限公司 | 一种个性化信息推荐的方法 |
CN102880694A (zh) * | 2012-09-19 | 2013-01-16 | 北京奇虎科技有限公司 | 在新标签页中加载分类频道的浏览器客户端和方法 |
CN104199857A (zh) * | 2014-08-14 | 2014-12-10 | 西安交通大学 | 一种基于多标签分类的税务文档层次分类方法 |
CN109919641A (zh) * | 2017-12-12 | 2019-06-21 | 优视科技有限公司 | 一种广告投放方法及平台 |
CN108897871A (zh) * | 2018-06-29 | 2018-11-27 | 北京百度网讯科技有限公司 | 文档推荐方法、装置、设备及计算机可读介质 |
CN109376309A (zh) * | 2018-12-28 | 2019-02-22 | 北京百度网讯科技有限公司 | 基于语义标签的文档推荐方法和装置 |
CN110941740A (zh) * | 2019-11-08 | 2020-03-31 | 腾讯科技(深圳)有限公司 | 视频推荐方法及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
在线百科间的标签推荐算法;刘阔;姚舒扬;邓志鸿;;计算机科学与探索(08);全文 * |
百度智能云视频AI技术助力媒体行业产业升级;叶芷;马彩虹;戴兵;;人工智能(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111767439A (zh) | 2020-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457581B (zh) | 一种资讯推荐方法、装置、电子设备及存储介质 | |
CN109634698B (zh) | 菜单显示方法、装置、计算机设备及存储介质 | |
US20210158164A1 (en) | Finding k extreme values in constant processing time | |
CN113486252A (zh) | 搜索结果展示方法、装置、设备和介质 | |
US11977589B2 (en) | Information search method, device, apparatus and computer-readable medium | |
US11164210B2 (en) | Method, device and computer storage medium for promotion displaying | |
CN108153909B (zh) | 关键词投放拓词方法、装置及电子设备、存储介质 | |
KR102069341B1 (ko) | 전자 문서 검색 방법 및 그 서버 | |
US20230147941A1 (en) | Method, apparatus and device used to search for content | |
Zhao et al. | Multi-modal microblog classification via multi-task learning | |
CN112364204A (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN105706081A (zh) | 结构化信息链接注释 | |
KR20190031536A (ko) | 어플리케이션 정보 트리거링 | |
CN113806588A (zh) | 搜索视频的方法和装置 | |
US20220366138A1 (en) | Rule-based machine learning classifier creation and tracking platform for feedback text analysis | |
CN110019813A (zh) | 寿险案例检索方法、检索装置、服务器及可读存储介质 | |
CN111767439B (zh) | 基于页面分类标签的推荐方法、设备和介质 | |
CN111753199B (zh) | 用户画像构建方法及设备、电子设备和介质 | |
US20240004888A1 (en) | Sorting method, apparatus and device, and computer storage medium | |
CN111797765B (zh) | 图像处理方法、装置、服务器及存储介质 | |
CN114611023A (zh) | 搜索结果的显示方法、装置、设备、介质及程序产品 | |
CN111310016B (zh) | 标签挖掘方法、装置、服务器和存储介质 | |
US20210232652A1 (en) | Event-based search engine | |
US20190179859A1 (en) | Method and apparatus for managing navigation of web content | |
CN110837579B (zh) | 视频分类方法、装置、计算机以及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |