CN108776901B - 基于搜索词的广告推荐方法及*** - Google Patents

基于搜索词的广告推荐方法及*** Download PDF

Info

Publication number
CN108776901B
CN108776901B CN201810392779.4A CN201810392779A CN108776901B CN 108776901 B CN108776901 B CN 108776901B CN 201810392779 A CN201810392779 A CN 201810392779A CN 108776901 B CN108776901 B CN 108776901B
Authority
CN
China
Prior art keywords
recommended
advertisement
current search
search word
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810392779.4A
Other languages
English (en)
Other versions
CN108776901A (zh
Inventor
彭红卿
吴春尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimeng Chuangke Network Technology China Co Ltd
Original Assignee
Weimeng Chuangke Network Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimeng Chuangke Network Technology China Co Ltd filed Critical Weimeng Chuangke Network Technology China Co Ltd
Priority to CN201810392779.4A priority Critical patent/CN108776901B/zh
Publication of CN108776901A publication Critical patent/CN108776901A/zh
Application granted granted Critical
Publication of CN108776901B publication Critical patent/CN108776901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及广告投放领域,具体涉及基于搜索词的广告推荐方法及***。所述方法包括:针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面。本发明能够推荐与搜索词相关程度强的广告,做到精确投放。

Description

基于搜索词的广告推荐方法及***
技术领域
本发明涉及广告投放领域,具体涉及基于搜索词的广告推荐方法及***。
背景技术
在现有技术中,通过搜索词本身匹配筛选广告;也就是说,根据搜索词跟广告文本的匹配程度来决定相关性,再根据相关性的高低对广告进行排序,最终获取推荐的广告。
现有技术有如下问题:
1、搜索词通常很短,外延大,信息少,会导致召回广告少。
2、词匹配程度不能反映广告跟搜索的相关程度;比如搜索词是“互联网大会”,含有“互联”;某一广告是一个路由器的产品,产品描述也有“互联”。这两者的相关程度其实很低。但根据词匹配,输入“互联网大会”,就会对应推荐该路由器的广告。这样,就会导致推荐的广告与搜索词本身相关程度并不强,影响广告的精确投放。
3、词匹配不上,流量有可能被浪费掉。
发明内容
本发明要解决的技术问题在于,克服现有的技术的不足,提供基于搜索词的广告推荐方法及***,其能够推荐与搜索词相关程度强的广告,做到精确投放。
为达到上述技术目的,一方面,本发明提供的基于搜索词的广告推荐方法,包括:
针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;
针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;
根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面。
另一方面,本发明提供的基于搜索词的广告推荐***,包括:
扩展单元,用于针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;
扩充单元,用于针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
计算单元,用于根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;
推荐单元,用于根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面。
在本发明中,将搜索词和待推荐广告分别进行扩展和扩充,得到扩展词组和扩充词组;再通过扩展词组和扩充词组计算搜索词和待推荐广告的综合得分;从而通过综合得分来选取推荐广告。由此,本发明在将搜索词扩展之后可以匹配出更多的广告,使得推荐广告有更多选择;使得推荐广告与搜索词之间有更强的关联性,从而可以做到广告的精确投放。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例的方法流程示意图;
图2为本发明实施例的***结构示意图;
图3为本发明实施例中具体工作流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1.1:如图1所示,本发明所述的基于搜索词的广告推荐方法,包括:
101、针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;
102、针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
103、根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;
104、根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面。
实施例1.2:接实施例1.1,所述针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组,之前还包括:
判定用户输入的当前搜索词为热搜词;所述热搜词为其词频超过预定词频的搜索词。
也就是说,当判断出用户输入的当前搜索词为热搜词时,执行针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组的步骤。
实施例1.3:接实施例1.1或1.2,所述针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组,之后还包括:
对当前搜索词的扩展词组依次进行分词、去单字和去停用词处理;
所述针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组,之后还包括:
对每条待推荐广告的文本关键词对应的扩充词组依次进行分词、去单字和去停用词处理。
在上述技术方案中,所述针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组,具体包括:
获取当前搜索词的扩展词,所述扩展词包括但不限于:相关词、印象词、同义词、共现词、关联词和日志扩展词;
将当前搜索词与对应扩展词组合成当前搜索词的扩展词组。
所述相关词,为同一用户在输入当前搜索词之后预定时间段内输入的单词;
所述印象词,为与当前搜索词有舆情关系的单词;
所述共现词,为与当前搜索词同时输入在搜索框内的单词;
所述关联词,为在词序列中与当前搜索词具有关联关系的单词;
所述日志扩展词,为通过搜索日志查看当前搜索词的上下文,在上下文中词频较高的单词。
在上述技术方案中,所述根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分,具体包括:
分别对当前搜索词的扩展词组和每条待推荐广告的扩充词组进行编码,得到当前搜索词的向量和每条待推荐广告的向量;
分别计算每条待推荐广告的向量针对当前搜索词的向量的余弦相似度,从而得到每条待推荐广告针对当前搜索词的词相似得分;
获取当前搜索词的扩展词组的各属性标签;
判定每条待推荐广告的扩充词组的各属性标签;
将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分;
将所述每条待推荐广告针对当前搜索词的词相似得分和属性相似得分进行相加或加权相加,得到每条待推荐广告针对当前搜索词的综合得分。
进一步地,所述属性标签包括:主题标签、类型标签和行业标签;
所述获取当前搜索词的扩展词组的各属性标签,具体包括:
根据历史数据,分别建立主体模型、类型模型和行业模型;
将当前搜索词的扩展词组分别输入主题模型、类型模型和行业模型,输出得到对应主题标签、类型标签和行业标签;
所述将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分,具体包括:
对比当前搜索词的扩展词组的主题标签与每条待推荐广告的扩充词组的主题标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第一预定分数计入当前待推荐广告针对当前搜索词的主题得分;
对比当前搜索词的扩展词组的类型标签与每条待推荐广告的扩充词组的类型标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第二预定分数计入当前待推荐广告针对当前搜索词的类型得分;
对比当前搜索词的扩展词组的行业标签与每条待推荐广告的扩充词组的行业标签;
若当前搜索词的扩展词组的行业标签与当前待推荐广告的扩充词组的行业标签相同,则将第三预定分数计入当前待推荐广告针对当前搜索词的行业得分;
将当前待推荐广告针对当前搜索词的主题得分、类型得分和行业得分相加或加权相加,得到当前待推荐广告针对当前搜索词的属性相似得分。
在上述技术方案中,根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面,具体包括:
将每条待推荐广告按其针对当前搜索词的综合得分,由高到低进行排序;
取前n(n>0)条待推荐广告作为推荐广告;
将推荐广告按照所述排序展示在当前搜索词的对应页面。
实施例2.1:如图2所示,本发明所述的基于搜索词的广告推荐***,包括:
扩展单元11,用于针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;
扩充单元12,用于针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
计算单元13,用于根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;
推荐单元14,用于根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面。
实施例2.2:接实施例2.1,作为一种可能结构,所述***还包括:
判断单元15,用于判定用户输入的当前搜索词为热搜词时触发扩展单元11;所述热搜词为其词频超过预定词频的搜索词。
实施例2.3:接实施例2.1或2.2,作为另一种可能结构,所述***还包括:
第一过滤单元16,用于对当前搜索词的扩展词组依次进行分词、去单字和去停用词处理;
第二过滤单元17,用于对每条待推荐广告的文本关键词对应的扩充词组依次进行分词、去单字和去停用词处理。
在上述技术方案中,所述扩展单元11,具体用于:
获取当前搜索词的扩展词,所述扩展词包括但不限于:相关词、印象词、同义词、共现词、关联词和日志扩展词;
将当前搜索词与对应扩展词组合成当前搜索词的扩展词组。
在上述技术方案中,所述计算单元13,包括:
编码模块,用于分别对当前搜索词的扩展词组和每条待推荐广告的扩充词组进行编码,得到当前搜索词的向量和每条待推荐广告的向量;
计算模块,用于分别计算每条待推荐广告的向量针对当前搜索词的向量的余弦相似度,从而得到每条待推荐广告针对当前搜索词的词相似得分;
获取模块,用于获取当前搜索词的扩展词组的各属性标签;
判定模块,用于判定每条待推荐广告的扩充词组的各属性标签;
匹配模块,用于将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分;
相加模块,用于将所述每条待推荐广告针对当前搜索词的词相似得分和属性相似得分进行相加或加权相加,得到每条待推荐广告针对当前搜索词的综合得分。
进一步地,所述属性标签包括:主题标签、类型标签和行业标签;
所述获取模块,具体用于:
根据历史数据,分别建立主体模型、类型模型和行业模型;
将当前搜索词的扩展词组分别输入主题模型、类型模型和行业模型,输出得到对应主题标签、类型标签和行业标签;
所述匹配模块,具体用于:
对比当前搜索词的扩展词组的主题标签与每条待推荐广告的扩充词组的主题标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第一预定分数计入当前待推荐广告针对当前搜索词的主题得分;
对比当前搜索词的扩展词组的类型标签与每条待推荐广告的扩充词组的类型标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第二预定分数计入当前待推荐广告针对当前搜索词的类型得分;
对比当前搜索词的扩展词组的行业标签与每条待推荐广告的扩充词组的行业标签;
若当前搜索词的扩展词组的行业标签与当前待推荐广告的扩充词组的行业标签相同,则将第三预定分数计入当前待推荐广告针对当前搜索词的行业得分;
将当前待推荐广告针对当前搜索词的主题得分、类型得分和行业得分相加或加权相加,得到当前待推荐广告针对当前搜索词的属性相似得分。
在上述技术方案中,所述推荐单元14,具体用于:
将每条待推荐广告按其针对当前搜索词的综合得分,由高到低进行排序;
取前n(n>0)条待推荐广告作为推荐广告;
将推荐广告按照所述排序展示在当前搜索词的对应页面。
以下结合应用实例对本发明实施例上述技术方案进行详细说明:
以微博为例;
如图3所示,基于搜索词的广告推荐方法,包括:
步骤1、判定用户输入的当前搜索词为热搜词;所述热搜词为其词频超过预定词频的搜索词;
用户每天进入微博搜索框的搜索量是巨大的,如果每个搜索词都进行扩展匹配广告的话,服务器的负担将会非常重。经过统计表明,在微博搜索框中与近段时间发生的热门时间有关的搜索词占绝大多数,所以某些搜索词的出现频率会非常高,这种词称之为热搜词。因此,本实例中,只对热搜词进行之后的扩展和匹配广告,既可以大大降低微博服务器的压力,也可以提高广告投放的效率。
步骤2、判断用户输入的当前搜索词和当前待推荐广告是否存储有综合得分;
在实际工作实现中,对于所有用户输入的每个搜索词都需要和所有待推荐广告计算综合得分。这样计算的工作量是巨大的,由于不同用户在某一时间段针对某个热门事件输入相同的搜索词,实际上,该搜索词也称之为热搜词,所以上述计算工作中,会有大量的重复计算。
因此,将同一搜索词与同一待推荐广告之间的综合得分存储至综合得分表,在计算当前搜索词和当前待推荐广告的综合得分之前,先查询综合得分表中是否有当前搜索词和当前待推荐广告的综合得分。
若当前搜索词和当前待推荐广告存储有综合得分,则直接返回该综合得分;
若当前搜索词和当前待推荐广告没存储有综合得分,也就表明,没有计算过综合得分,则进入步骤3。
需要说明的是,在工作实现中,省略步骤2也可以达到本发明的技术效果。
步骤3、判断用户输入的当前搜索词是否存储有扩展词组;
同理步骤2,在实际工作实现中,针对每个用户输入的每个搜索词都需要进行扩展处理。这样就产生了大量的工作量,所以进行扩展处理后的搜索词(热搜词)都会存储至扩展词组存储表。
若扩展词组存储表中存储有当前搜索词的扩展词组,则直接返回至该扩展词组;
若扩展词组存储表中没有当前搜索词的扩展词组,则进入步骤4。
需要说明的是,在工作实现中,省略步骤3也可以达到本发明的技术效果。
步骤4、针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;具体地:
获取当前搜索词的扩展词,所述扩展词包括但不限于:相关词、印象词、同义词、共现词、关联词和日志扩展词;
将当前搜索词与对应扩展词组合成当前搜索词的扩展词组。
所述相关词,为同一用户在输入当前搜索词之后预定时间段内输入的单词;
所述印象词,为与当前搜索词有舆情关系的单词;
所述共现词,为与当前搜索词同时输入在搜索框内的单词;
所述关联词,为在词序列中与当前搜索词具有关联关系的单词;
所述日志扩展词,为通过搜索日志查看当前搜索词的上下文,在上下文中词频较高的单词。
在实际工作实现中,当前搜索词的扩展词也可以不限于上述单词。
步骤5、判断当前待推荐广告是否存储有扩充词组;
同理步骤3,在实际工作实现中,针对每个待推荐广告都需要进行扩充处理。这样就产生了大量的工作量,所以进行扩充处理后的待推荐广告都会存储至扩充词组存储表。
若扩充词组存储表中存储有当前待推荐广告的扩展词组,则直接返回至该扩展词组;
若扩充词组存储表中没有当前待推荐广告的扩展词组,则进入步骤6。
需要说明的是,在工作实现中,省略步骤5也可以达到本发明的技术效果。
步骤6、针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
在对待推荐广告进行扩充处理前,需要找到当前待推荐广告中的关键词,然后对所述关键词进行扩充处理,得到当前待推荐广告的扩充词组。
步骤7、对当前搜索词的扩展词组依次进行分词、去单字和去停用词处理;
步骤8、对每条待推荐广告的文本关键词对应的扩充词组依次进行分词、去单字和去停用词处理;
对扩展词组和扩充词组进行分词时,可以采用分词专业转件。去单字就是将扩展词组和扩充词组中出现的单独一个字形成的词去掉。停用词,一般由开发人员根据实际工作状况确定,在通常情况下,包括:的、地、得、a、b、c等不含具体意义的词。
步骤9、根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;具体地:
步骤9.1、分别对当前搜索词的扩展词组和每条待推荐广告的扩充词组进行编码,得到当前搜索词的向量和每条待推荐广告的向量;
例如,当前搜索词的扩展词组为:“某明星、儿子、出生、奶爸”;
当前待推荐广告的扩充词组为:“德国、奶粉、奶爸”;
将当前扩展词组和扩充词组进行编码;
首先,合并当前扩展词组和扩充词组,得到组合词组:“某明星、儿子、出生、奶爸、德国、奶粉”;
然后,将当前扩展词组与组合词组进行对比,遇到相同的单词编码为1,遇到不同的单词编码为0;得到当前搜索词的向量A为【1,1,1,1,0,0】;
将当前扩充词组与组合词组进行对比,遇到相同的单词编码为1,遇到不同的单词编码为0;得到当前搜索词的向量B为【0,0,0,1,1,1】;
步骤9.2、分别计算每条待推荐广告的向量针对当前搜索词的向量的余弦相似度,从而得到每条待推荐广告针对当前搜索词的词相似得分;
运用欧式距离,计算A和B的余弦相似度;如下式:
Similarity=cos(theta)=A·B/||A||||B||(1)
步骤9.3、获取当前搜索词的扩展词组的各属性标签;
根据历史数据,分别建立主体模型、类型模型和行业模型;
将当前搜索词的扩展词组分别输入主题模型、类型模型和行业模型,输出得到对应主题标签、类型标签和行业标签。
在主题层面,联合历史的热搜数据和广告的文本内筒,用文档主题生成模型LDA等训练主题模型。将当前搜索词的扩展词组作为主题模型的输入,输出得到至少一个主题。
预定义出各种类型,根据历史数据建立分类模型,典型地,用支持向量机svm或者贝叶斯
Figure BDA0001643830820000091
Bayes来进行分类。
步骤9.4、判定每条待推荐广告的扩充词组的各属性标签;
步骤9.5、将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分;具体地:
对比当前搜索词的扩展词组的主题标签与每条待推荐广告的扩充词组的主题标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第一预定分数计入当前待推荐广告针对当前搜索词的主题得分;
对比当前搜索词的扩展词组的类型标签与每条待推荐广告的扩充词组的类型标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第二预定分数计入当前待推荐广告针对当前搜索词的类型得分;
对比当前搜索词的扩展词组的行业标签与每条待推荐广告的扩充词组的行业标签;
若当前搜索词的扩展词组的行业标签与当前待推荐广告的扩充词组的行业标签相同,则将第三预定分数计入当前待推荐广告针对当前搜索词的行业得分;
将当前待推荐广告针对当前搜索词的主题得分、类型得分和行业得分相加或加权相加,得到当前待推荐广告针对当前搜索词的属性相似得分。
在主题模型输出得到至少一个主题后,并跟当前待推荐广告的主题比对。若有一个主题匹配,设第一预定分数为10分,则当前待推荐广告针对当前搜索词的主题得分为10分。若有两个主题匹配,则当前待推荐广告针对当前搜索词的主题得分为20分;以此类推。
对于类型得分的计算同理与主题得分的计算。类型都是预定义的,对热搜扩展词直接用分类模型分出来类别后跟广告的博文的分类进行比较,如果匹配,则加上第二预定分数。如果采用层级分类体系,那么第二预定分数可以通过不同层之间的相关性得分,取加权平均值得到。
步骤9.6、将所述词相似得分和各属性相似得分,进行相加或加权相加得到综合得分。
步骤10、根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面;具体地:
步骤10.1、将每条待推荐广告按其针对当前搜索词的综合得分,由高到低进行排序;
步骤10.2、取前n(n>0)条待推荐广告作为推荐广告;
这里也可以选综合分数超过某个预定分数的各待推荐广告作为推荐广告。
步骤10.3、将推荐广告按照所述排序展示在当前搜索词的对应页面。
在现有技术中,在匹配搜索词和待推荐广告时,只有关键词的限制,多个关键词之间没有顺序,导致缺乏汉语语言模型n-gram或者句子级别的语义表达。在本发明中。加入主题、类别和行业等信息后,能生成更多的语义匹配,从而通过当前搜索词可以找到更匹配的广告,使广告得到精确投放,并且使广告召回的增加。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个***的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于搜索词的广告推荐方法,其特征在于,所述方法包括:
针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;
针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;
根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面;
其中,所述根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分,具体包括:
分别对当前搜索词的扩展词组和每条待推荐广告的扩充词组进行编码,得到当前搜索词的向量和每条待推荐广告的向量;
分别计算每条待推荐广告的向量针对当前搜索词的向量的余弦相似度,从而得到每条待推荐广告针对当前搜索词的词相似得分;
获取当前搜索词的扩展词组的各属性标签;
判定每条待推荐广告的扩充词组的各属性标签;
将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分;
将所述每条待推荐广告针对当前搜索词的词相似得分和属性相似得分进行相加或加权相加,得到每条待推荐广告针对当前搜索词的综合得分;
其中,所述属性标签包括:主题标签、类型标签和行业标签;
所述获取当前搜索词的扩展词组的各属性标签,具体包括:
根据历史数据,分别建立主体模型、类型模型和行业模型;
将当前搜索词的扩展词组分别输入主题模型、类型模型和行业模型,输出得到对应主题标签、类型标签和行业标签;
所述将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分,具体包括:
对比当前搜索词的扩展词组的主题标签与每条待推荐广告的扩充词组的主题标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第一预定分数计入当前待推荐广告针对当前搜索词的主题得分;
对比当前搜索词的扩展词组的类型标签与每条待推荐广告的扩充词组的类型标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第二预定分数计入当前待推荐广告针对当前搜索词的类型得分;
对比当前搜索词的扩展词组的行业标签与每条待推荐广告的扩充词组的行业标签;
若当前搜索词的扩展词组的行业标签与当前待推荐广告的扩充词组的行业标签相同,则将第三预定分数计入当前待推荐广告针对当前搜索词的行业得分;
将当前待推荐广告针对当前搜索词的主题得分、类型得分和行业得分相加或加权相加,得到当前待推荐广告针对当前搜索词的属性相似得分。
2.根据权利要求1所述的基于搜索词的广告推荐方法,其特征在于,所述针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组,之前还包括:
判定用户输入的当前搜索词为热搜词;所述热搜词为其词频超过预定词频的搜索词。
3.根据权利要求1或2所述的基于搜索词的广告推荐方法,其特征在于,所述针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组,具体包括:
获取当前搜索词的扩展词,所述扩展词包括但不限于:相关词、印象词、同义词、共现词、关联词和日志扩展词;
将当前搜索词与对应扩展词组合成当前搜索词的扩展词组。
4.根据权利要求1或2所述的基于搜索词的广告推荐方法,其特征在于,所述针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组,之后还包括:
对当前搜索词的扩展词组依次进行分词、去单字和去停用词处理;
所述针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组,之后还包括:
对每条待推荐广告的文本关键词对应的扩充词组依次进行分词、去单字和去停用词处理。
5.根据权利要求1或2所述的基于搜索词的广告推荐方法,其特征在于,根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面,具体包括:
将每条待推荐广告按其针对当前搜索词的综合得分,由高到低进行排序;
取前n(n>0)条待推荐广告作为推荐广告;
将推荐广告按照所述排序展示在当前搜索词的对应页面。
6.一种基于搜索词的广告推荐***,其特征在于,所述***包括:
扩展单元,用于针对用户输入的当前搜索词进行扩展处理,得到当前搜索词的扩展词组;
扩充单元,用于针对每条待推荐广告的文本关键词进行扩充处理,得到每条待推荐广告的扩充词组;
计算单元,用于根据当前搜索词的扩展词组和每条待推荐广告的扩充词组,计算得到每条待推荐广告针对当前搜索词的综合得分;
推荐单元,用于根据每条待推荐广告针对当前搜索词的综合得分,从待推荐广告中选出至少一条推荐广告展示在当前搜索词的对应页面;
其中,所述计算单元,包括:
编码模块,用于分别对当前搜索词的扩展词组和每条待推荐广告的扩充词组进行编码,得到当前搜索词的向量和每条待推荐广告的向量;
计算模块,用于分别计算每条待推荐广告的向量针对当前搜索词的向量的余弦相似度,从而得到每条待推荐广告针对当前搜索词的词相似得分;
获取模块,用于获取当前搜索词的扩展词组的各属性标签;
判定模块,用于判定每条待推荐广告的扩充词组的各属性标签;
匹配模块,用于将当前搜索词的扩展词组的各属性标签分别与每条待推荐广告的扩充词组的各属性标签进行匹配,计算得到每条待推荐广告针对当前搜索词的属性相似得分;
相加模块,用于将所述每条待推荐广告针对当前搜索词的词相似得分和属性相似得分进行相加或加权相加,得到每条待推荐广告针对当前搜索词的综合得分;
所述属性标签包括:主题标签、类型标签和行业标签;
所述获取模块,具体用于:
根据历史数据,分别建立主体模型、类型模型和行业模型;
将当前搜索词的扩展词组分别输入主题模型、类型模型和行业模型,输出得到对应主题标签、类型标签和行业标签;
所述匹配模块,具体用于:
对比当前搜索词的扩展词组的主题标签与每条待推荐广告的扩充词组的主题标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第一预定分数计入当前待推荐广告针对当前搜索词的主题得分;
对比当前搜索词的扩展词组的类型标签与每条待推荐广告的扩充词组的类型标签;
若当前搜索词的扩展词组的主题标签与当前待推荐广告的扩充词组的主题标签相同,则将第二预定分数计入当前待推荐广告针对当前搜索词的类型得分;
对比当前搜索词的扩展词组的行业标签与每条待推荐广告的扩充词组的行业标签;
若当前搜索词的扩展词组的行业标签与当前待推荐广告的扩充词组的行业标签相同,则将第三预定分数计入当前待推荐广告针对当前搜索词的行业得分;
将当前待推荐广告针对当前搜索词的主题得分、类型得分和行业得分相加或加权相加,得到当前待推荐广告针对当前搜索词的属性相似得分。
7.根据权利要求6所述的基于搜索词的广告推荐***,其特征在于,所述***还包括:
判断单元,用于判定用户输入的当前搜索词为热搜词时触发所述扩展单元;所述热搜词为其词频超过预定词频的搜索词。
8.根据权利要求6或7所述的基于搜索词的广告推荐***,其特征在于,所述扩展单元,具体用于:
获取当前搜索词的扩展词,所述扩展词包括但不限于:相关词、印象词、同义词、共现词、关联词和日志扩展词;
将当前搜索词与对应扩展词组合成当前搜索词的扩展词组。
9.根据权利要求6或7所述的基于搜索词的广告推荐***,其特征在于,所述***还包括:
第一过滤单元,用于对当前搜索词的扩展词组依次进行分词、去单字和去停用词处理;
第二过滤单元,用于对每条待推荐广告的文本关键词对应的扩充词组依次进行分词、去单字和去停用词处理。
10.根据权利要求6或7所述的基于搜索词的广告推荐***,其特征在于,所述推荐单元,具体用于:
将每条待推荐广告按其针对当前搜索词的综合得分,由高到低进行排序;
取前n(n>0)条待推荐广告作为推荐广告;
将推荐广告按照所述排序展示在当前搜索词的对应页面。
CN201810392779.4A 2018-04-27 2018-04-27 基于搜索词的广告推荐方法及*** Active CN108776901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810392779.4A CN108776901B (zh) 2018-04-27 2018-04-27 基于搜索词的广告推荐方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810392779.4A CN108776901B (zh) 2018-04-27 2018-04-27 基于搜索词的广告推荐方法及***

Publications (2)

Publication Number Publication Date
CN108776901A CN108776901A (zh) 2018-11-09
CN108776901B true CN108776901B (zh) 2021-01-15

Family

ID=64026649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810392779.4A Active CN108776901B (zh) 2018-04-27 2018-04-27 基于搜索词的广告推荐方法及***

Country Status (1)

Country Link
CN (1) CN108776901B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111383069A (zh) * 2018-12-29 2020-07-07 美宅科技(北京)有限公司 一种家具组件推荐方法和推荐装置
CN109885753A (zh) * 2019-01-16 2019-06-14 苏宁易购集团股份有限公司 一种扩大商品搜索召回的方法及装置
CN110222147A (zh) * 2019-05-15 2019-09-10 北京百度网讯科技有限公司 标签扩充方法、装置、计算机设备及存储介质
CN110781204B (zh) * 2019-09-09 2024-02-20 腾讯大地通途(北京)科技有限公司 目标对象的标识信息确定方法、装置、设备及存储介质
CN110706021A (zh) * 2019-09-12 2020-01-17 微梦创科网络科技(中国)有限公司 一种广告投放方法及***
CN113111216B (zh) * 2020-01-13 2023-11-03 百度在线网络技术(北京)有限公司 广告推荐方法、装置、设备和存储介质
CN112256822A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 文本搜索方法、装置、计算机设备和存储介质
CN112559693A (zh) * 2020-12-25 2021-03-26 鼎易创展咨询(北京)有限公司 文本词语的相似词搜索方法、装置、设备和介质
CN113297489A (zh) * 2021-05-28 2021-08-24 平安科技(深圳)有限公司 康复辅具推荐方法、装置、计算机设备和存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063468A (zh) * 2010-12-03 2011-05-18 百度在线网络技术(北京)有限公司 一种用于确定查询序列的查询类别的设备及其方法
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法
CN102855252A (zh) * 2011-06-30 2013-01-02 北京百度网讯科技有限公司 一种基于需求的数据检索方法和装置
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
CN103853722A (zh) * 2012-11-29 2014-06-11 腾讯科技(深圳)有限公司 一种基于检索串的关键词扩展方法、装置和***
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104199822A (zh) * 2014-07-11 2014-12-10 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和***
CN105912630A (zh) * 2016-04-07 2016-08-31 北京搜狗科技发展有限公司 一种信息扩展方法及装置
CN105975596A (zh) * 2016-05-10 2016-09-28 上海珍岛信息技术有限公司 一种搜索引擎查询扩展的方法及***
CN106528588A (zh) * 2016-09-14 2017-03-22 厦门幻世网络科技有限公司 一种为文本信息匹配资源的方法及装置
CN106557476A (zh) * 2015-09-24 2017-04-05 北京奇虎科技有限公司 相关信息的获取方法及装置
CN106610972A (zh) * 2015-10-21 2017-05-03 阿里巴巴集团控股有限公司 查询改写方法及装置
CN107544982A (zh) * 2016-06-24 2018-01-05 中兴通讯股份有限公司 文本信息处理方法、装置及终端
CN107609152A (zh) * 2017-09-22 2018-01-19 百度在线网络技术(北京)有限公司 用于扩展查询式的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567408B (zh) * 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063468A (zh) * 2010-12-03 2011-05-18 百度在线网络技术(北京)有限公司 一种用于确定查询序列的查询类别的设备及其方法
CN102855252A (zh) * 2011-06-30 2013-01-02 北京百度网讯科技有限公司 一种基于需求的数据检索方法和装置
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法
CN103853722A (zh) * 2012-11-29 2014-06-11 腾讯科技(深圳)有限公司 一种基于检索串的关键词扩展方法、装置和***
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104199822A (zh) * 2014-07-11 2014-12-10 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和***
CN106557476A (zh) * 2015-09-24 2017-04-05 北京奇虎科技有限公司 相关信息的获取方法及装置
CN106610972A (zh) * 2015-10-21 2017-05-03 阿里巴巴集团控股有限公司 查询改写方法及装置
CN105912630A (zh) * 2016-04-07 2016-08-31 北京搜狗科技发展有限公司 一种信息扩展方法及装置
CN105975596A (zh) * 2016-05-10 2016-09-28 上海珍岛信息技术有限公司 一种搜索引擎查询扩展的方法及***
CN107544982A (zh) * 2016-06-24 2018-01-05 中兴通讯股份有限公司 文本信息处理方法、装置及终端
CN106528588A (zh) * 2016-09-14 2017-03-22 厦门幻世网络科技有限公司 一种为文本信息匹配资源的方法及装置
CN107609152A (zh) * 2017-09-22 2018-01-19 百度在线网络技术(北京)有限公司 用于扩展查询式的方法和装置

Also Published As

Publication number Publication date
CN108776901A (zh) 2018-11-09

Similar Documents

Publication Publication Date Title
CN108776901B (zh) 基于搜索词的广告推荐方法及***
US11403680B2 (en) Method, apparatus for evaluating review, device and storage medium
CN109145153B (zh) 意图类别的识别方法和装置
CN107704512B (zh) 基于社交数据的金融产品推荐方法、电子装置及介质
US10515125B1 (en) Structured text segment indexing techniques
CN104850574B (zh) 一种面向文本信息的敏感词过滤方法
CN106462604B (zh) 识别查询意图
CN109637537B (zh) 一种自动获取标注数据优化自定义唤醒模型的方法
KR102170206B1 (ko) 키워드와 관계 정보를 이용한 정보 검색 시스템 및 방법
CN111241267A (zh) 摘要提取和摘要抽取模型训练方法及相关装置、存储介质
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
CN105095204A (zh) 同义词的获取方法及装置
CN109858626B (zh) 一种知识库构建方法及装置
CN111414757B (zh) 一种文本识别方法及装置
CN106776566B (zh) 情感词汇的识别方法及装置
CN115438166A (zh) 基于关键词和语义的搜索方法、装置、设备及存储介质
CN106777236B (zh) 基于深度问答的查询结果的展现方法和装置
CN111310440A (zh) 文本的纠错方法、装置和***
CN111160007B (zh) 基于bert语言模型的搜索方法、装置、计算机设备及存储介质
CN109255022B (zh) 一种用于网络文章的摘要自动提取方法
CA3233457A1 (en) Machine learning-implemented chat bot database query system for multi-format database queries
CN106021532B (zh) 关键词的显示方法和装置
CN113836938A (zh) 文本相似度的计算方法及装置、存储介质、电子装置
CN113988057A (zh) 基于概念抽取的标题生成方法、装置、设备及介质
CN107239455B (zh) 核心词识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant