CN113505194B - 改写词生成模型的训练方法及装置 - Google Patents

改写词生成模型的训练方法及装置 Download PDF

Info

Publication number
CN113505194B
CN113505194B CN202110662998.1A CN202110662998A CN113505194B CN 113505194 B CN113505194 B CN 113505194B CN 202110662998 A CN202110662998 A CN 202110662998A CN 113505194 B CN113505194 B CN 113505194B
Authority
CN
China
Prior art keywords
keyword
search
rewrite
generation model
rewritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110662998.1A
Other languages
English (en)
Other versions
CN113505194A (zh
Inventor
杨俭
王宗宇
谢睿
武威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202110662998.1A priority Critical patent/CN113505194B/zh
Publication of CN113505194A publication Critical patent/CN113505194A/zh
Application granted granted Critical
Publication of CN113505194B publication Critical patent/CN113505194B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供了一种改写词生成模型的训练方法及装置。所述方法包括:获取初始改写词生成模型;将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;获取所述搜索关键词与所述改写关键词之间的偏差分值;根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。本公开的实施例可以提高查询改写的准确率和覆盖率。

Description

改写词生成模型的训练方法及装置
技术领域
本公开的实施例涉及模型训练技术领域,尤其涉及一种改写词生成模型的训练方法及装置。
背景技术
查询改写(又称查询扩展)是在搜索引擎中对用户搜索的查询词进行改写,提升搜索引擎召回结果的一种方法。在美团点评搜索引擎中,通常一个商户或者菜品会有不同的多种表达方式;例如“火锅”也称为“涮锅”。有时不同的词语表述相同的用户意图;例如“婚纱摄影”和“婚纱照”,“配眼镜”和“眼镜店”等。
搜索引擎的查询改写可以看做是针对搜索引擎的召回优化,在不改变用户意图的情况下,尽可能多的召回满足用户意图的搜索结果,提升用户的搜索体验。
目前,常用的查询改写方法为:数据挖掘的方法,其是通过用户的行为进行挖掘,通常行为比较密集的热门查询关键词上挖掘的准确率比较高,但是用户行为稀疏的长尾流量上准确率比较低。在使用中通常使用准确率比较高的挖掘数据,所以在长尾流量上通常覆盖较低,进而导致查询改写的准确率和覆盖率较低。
发明内容
本公开的实施例提供一种改写词生成模型的训练方法及装置,用以提升查询改写的准确率和覆盖率。
根据本公开的实施例的第一方面,提供了一种改写词生成模型的训练方法,包括:
获取初始改写词生成模型;
将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;
获取所述搜索关键词与所述改写关键词之间的偏差分值;
根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
可选地,所述获取初始改写词生成模型,包括:
根据搜索日志,获取查询关键词集合;
基于所述查询关键词集合中的查询关键词,对待训练改写词生成模型进行训练,得到所述初始改写词生成模型。
可选地,所述获取所述搜索关键词与所述改写关键词之间的偏差分值,包括:
获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度;
获取所述搜索关键词与所述改写关键词之间的语义相似度;
根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值。
可选地,所述获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度,包括:
获取所述搜索关键词对应的第一曝光结果和第一点击结果,及所述改写关键词对应的第二曝光结果和第二点击结果;
根据所述第一曝光结果和所述第二曝光结果,确定所述搜索关键词与所述改写关键词之间的曝光交叉度;
根据所述第一点击结果和所述第二点击结果,确定所述搜索关键词与所述改写关键词之间的点击交叉度。
可选地,所述获取所述搜索关键词与所述改写关键词之间的语义相似度,包括:
将所述搜索关键词和所述改写关键词输入至语义判别模型;
获取由所述语义判别模型输出的所述搜索关键词与所述改写关键词之间的语义相似度。
可选地,所述根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值,包括:
获取所述曝光交叉度对应的第一权重、所述点击交叉度对应的第二权重、及所述语义相似度对应的第三权重;
基于所述曝光交叉度、所述第一权重、所述点击交叉度、所述第二权重、所述语义相似度和所述第三权重,确定所述搜索关键词与所述改写关键词之间的偏差分值。
可选地,所述根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型,包括:
将所述偏差分值、所述搜索关键词和所述改写关键词输入至所述初始改写词生成模型,以由所述初始改写词生成模型根据所述偏差分值对所述搜索关键词和所述改写关键词进行处理;
获取由所述初始改写词生成模型输出的所述搜索关键词对应的目标改写关键词;
迭代执行设定次数的所述将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词,至所述根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练的步骤,直至所述初始改写词生成模型收敛,得到目标改写词生成模型。
根据本公开的实施例的第二方面,提供了一种改写词生成模型的训练装置,包括:
初始生成模型获取模块,用于获取初始改写词生成模型;
改写关键词获取模块,用于将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;
偏差分值获取模块,用于获取所述搜索关键词与所述改写关键词之间的偏差分值;
目标生成模型获取模块,用于根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
可选地,所述初始生成模型获取模块包括:
关键词集合获取单元,用于根据搜索日志,获取查询关键词集合;
初始生成模型获取单元,用于基于所述查询关键词集合中的查询关键词,对待训练改写词生成模型进行训练,得到所述初始改写词生成模型。
可选地,所述偏差分值获取模块包括:
交叉度获取单元,用于获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度;
相似度获取单元,用于获取所述搜索关键词与所述改写关键词之间的语义相似度;
偏差分值确定单元,用于根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值。
可选地,所述交叉度获取单元包括:
曝光点击结果获取子单元,用于获取所述搜索关键词对应的第一曝光结果和第一点击结果,及所述改写关键词对应的第二曝光结果和第二点击结果;
曝光交叉度确定子单元,用于根据所述第一曝光结果和所述第二曝光结果,确定所述搜索关键词与所述改写关键词之间的曝光交叉度;
点击交叉度确定子单元,用于根据所述第一点击结果和所述第二点击结果,确定所述搜索关键词与所述改写关键词之间的点击交叉度。
可选地,所述相似度获取单元包括:
关键词输入子单元,用于将所述搜索关键词和所述改写关键词输入至语义判别模型;
相似度获取子单元,用于获取由所述语义判别模型输出的所述搜索关键词与所述改写关键词之间的语义相似度。
可选地,所述偏差分值确定单元包括:
权重获取子单元,用于获取所述曝光交叉度对应的第一权重、所述点击交叉度对应的第二权重、及所述语义相似度对应的第三权重;
偏差分值确定子单元,用于基于所述曝光交叉度、所述第一权重、所述点击交叉度、所述第二权重、所述语义相似度和所述第三权重,确定所述搜索关键词与所述改写关键词之间的偏差分值。
可选地,所述目标生成模型获取模块包括:
关键词输入单元,用于将所述偏差分值、所述搜索关键词和所述改写关键词输入至所述初始改写词生成模型,以由所述初始改写词生成模型根据所述偏差分值对所述搜索关键词和所述改写关键词进行处理;
目标改写词获取单元,用于获取由所述初始改写词生成模型输出的所述搜索关键词对应的目标改写关键词;
目标改写词模型获取单元,用于迭代执行设定次数的所述将搜索关键词输入至所述改写关键词获取模块、所述偏差分值获取模块和所述目标生成模型获取模块,直至所述初始改写词生成模型收敛,得到目标改写词生成模型。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的改写词生成模型的训练方法。
根据本公开的实施例对第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述中任一项所述的改写词生成模型的训练方法。
本公开的实施例提供了一种改写词生成模型的训练方法及装置,通过获取初始改写词生成模型,将搜索关键词输入至初始改写词生成模型,并获取由初始改写词生成模型输出的搜索关键词对应的改写关键词,获取搜索关键词与改写关键词之间的偏差分值,根据偏差分值、搜索关键词和改写关键词对初始改写词模型进行训练,得到目标改写词生成模型。本公开的实施例通过先获取搜索关键词和改写关键词之间的偏差分值,并结合偏差分值、搜索关键词和改写关键词对模型进行进一步地训练,从而可以在搜索***的最终结果上更符合用户搜索需求,提高了查询改写的准确率和覆盖率。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开的实施例提供的一种改写词生成模型的训练方法的步骤流程图;
图2为本公开的实施例提供的另一种改写词生成模型的训练方法的步骤流程图;
图3为本公开的实施例提供的一种改写词生成模型的训练装置的结构示意图;
图4为本公开的实施例提供的另一种改写词生成模型的训练装置的结构示意图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,示出了本公开的实施例提供的一种改写词生成模型的训练方法的步骤流程图,如图1所示,该改写词生成模型的训练方法具体可以包括如下步骤:
步骤101:获取初始改写词生成模型。
本公开的实施例可以应用于结合搜索关键词、改写关键词及两个关键词之间的偏差分值进行模型训练的场景中。
初始改写词生成模型是指预训练得到的需要进行进一步训练的改写词生成模型,对于初始改写生成模型的获取方式可以为,结合预先搜集的相似的查询关键词对对待训练改写词生成模型进行训练之后得到的模型,对于初始改写词生成模型的具体训练过程将在下述实施例二中进行详细描述,本实施例在此不再加以赘述。
在获取到初始改写词生成模型之后,执行步骤102。
步骤102:将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词。
搜索关键词是指输入的用于对初始改写词生成模型进行训练的样本关键词。
改写关键词是指通过初始改写词生成模型预测得到对搜索关键词对应的改写词,在本示例中,一个搜索关键词可以对应于一个改写关键词,也可以对应于两个或两个以上的改写关键词,具体地,可以根据实际情况而定,本实施例对此不加以限制。
在获取到初始改写词生成模型之后,可以将搜索关键词输入至初始改写词生成模型,以获取由初始改写词生成模型输出的搜索关键词对应的改写关键词。
在获取到由初始改写词生成模型输出的搜索关键词对应的改写关键词之后,执行步骤103。
步骤103:获取所述搜索关键词与所述改写关键词之间的偏差分值。
偏差分值是指用于指示搜索关键词与改写关键词之间的偏差程度的分值。
在获取到由初始改写词生成模型输出的搜索关键词对应的改写关键词之后,可以获取搜索关键词与改写关键词之间的偏差分值,该偏差分值可以是结合搜索关键词与改写关键词之间的曝光结果交叉度、点击结果交叉度和相似度分值确定的,具体地,对于该过程将在下述实施例二中进行详细描述,本实施例在此不再加以赘述。
在获取到搜索关键词与改写关键词之间的偏差分值之后,执行步骤104。
步骤104:根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
在获取到搜索关键词与改写关键词之间的偏差分值之后,可以根据偏差分值、搜索关键词和改写关键词对初始改写模型进行训练,以得到目标改写词生成模型,具体地,可以将搜索关键词、改写关键词和偏差分值输入至初始改写词生成模型,并对初始改写词生成模型进行训练。
本公开的实施例通过先获取搜索关键词和改写关键词之间的偏差分值,并结合偏差分值、搜索关键词和改写关键词对模型进行进一步地训练,从而可以在搜索***的最终结果上更符合用户搜索需求,提高了查询改写的准确率和覆盖率。
本公开的实施例提供的改写词生成模型的训练方法,通过获取初始改写词生成模型,将搜索关键词输入至初始改写词生成模型,并获取由初始改写词生成模型输出的搜索关键词对应的改写关键词,获取搜索关键词与改写关键词之间的偏差分值,根据偏差分值、搜索关键词和改写关键词对初始改写词模型进行训练,得到目标改写词生成模型。本公开的实施例通过先获取搜索关键词和改写关键词之间的偏差分值,并结合偏差分值、搜索关键词和改写关键词对模型进行进一步地训练,从而可以在搜索***的最终结果上更符合用户搜索需求,提高了查询改写的准确率和覆盖率。
实施例二
参照图2,示出了本公开的实施例提供的另一种改写词生成模型的训练方法的步骤流程图,如图2所示,该改写词生成模型的训练方法具体可以包括如下步骤:
步骤201:根据搜索日志,获取查询关键词集合。
本公开的实施例可以应用于结合搜索关键词、改写关键词及两个关键词之间的偏差分值进行模型训练的场景中。
搜索日志是指历史时段内,用户在各搜索平台内进行搜索而生成的日志。
在需要进行改写词生成模型的训练时,可以获取搜索日志,并根据搜索日志获取查询关键词,将相似的查询关键词组成查询关键词集合。
在根据搜索日志获取到查询关键词集合之后,执行步骤202。
步骤202:基于所述查询关键词集合中的查询关键词,对待训练改写词生成模型进行训练,得到所述初始改写词生成模型。
在根据搜索日志获取到查询关键词集合之后,可以基于查询关键词集合中的查询关键词对待训练改写词生成模型进行训练,以得到初始改写词生成模型,具体地训练过程可以为结合预设数量的查询关键词集合对待训练改写词生成模型进行训练,以得到初始改写词生成模型;或者是,结合查询关键词集合对待训练改写词生成模型进行训练,直至得到的待训练改写词生成模型的损失值处于预设范围内等。
在基于查询关键词集合中的查询关键词对待训练改写词生成模型进行训练得到初始改写词生成模型之后,执行步骤203。
步骤203:将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词。
搜索关键词是指输入的用于对初始改写词生成模型进行训练的样本关键词。
改写关键词是指通过初始改写词生成模型预测得到对搜索关键词对应的改写词,在本示例中,一个搜索关键词可以对应于一个改写关键词,也可以对应于两个或两个以上的改写关键词,具体地,可以根据实际情况而定,本实施例对此不加以限制。
在获取到初始改写词生成模型之后,可以将搜索关键词输入至初始改写词生成模型,以获取由初始改写词生成模型输出的搜索关键词对应的改写关键词。
在获取到由初始改写词生成模型输出的搜索关键词对应的改写关键词之后,执行步骤204和步骤205。
步骤204:获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度。
曝光交叉度是指模拟的搜索关键词与改写关键词进行信息检索得到的检索结果的交叉程度。
点击交叉度是指模拟搜索关键词与改写关键词进行信息检索得到的结果中,用户点击检索结果的交叉程度。
在获取到搜索关键词对应的改写关键词之后,可以获取搜索关键词与改写关键词之间的曝光交叉度和点击交叉度,具体地,可以结合下述具体实现方式进行详细描述。
在本公开的一种具体实现方式中,上述步骤204可以包括:
子步骤S1:获取所述搜索关键词对应的第一曝光结果和第一点击结果,及所述改写关键词对应的第二曝光结果和第二点击结果。
在本实施例中,第一曝光结果是指模拟搜索关键词在搜索平台上进行信息检索得到的结果。
第一点击结果是指模拟搜索关键词进行信息检索的结果中,用户点击检索结果的结果。
第二曝光结果是指模拟改写关键词在搜索平台上进行信息检索得到的结果。
第二点击结果是指模拟改写关键词进行信息检索的结果中,用户点击检索结果的结果。
在获取到搜索关键词和搜索关键词对应的改写关键词之后,可以获取搜索关键词对应的第一曝光结果和第一点击结果,以及改写关键词对应的第二曝光结果和第二点击结果。
在获取到第一曝光结果、第一点击结果、第二曝光结果和第二点击结果之后,执行子步骤S2和子步骤S3。
子步骤S2:根据所述第一曝光结果和所述第二曝光结果,确定所述搜索关键词与所述改写关键词之间的曝光交叉度。
子步骤S3:根据所述第一点击结果和所述第二点击结果,确定所述搜索关键词与所述改写关键词之间的点击交叉度。
在获取到第一曝光结果和第二曝光结果之后,可以根据第一曝光结果和第二曝光结果确定搜索关键词与改写关键词之间的曝光交叉度。
在获取到第一点击结果和第二点击结果之后,可以根据第一点击结果和第二点击结果确定搜索关键词与改写关键词之间的点击交叉度。
在本实施例中,搜索关键词和改写关键词在改写关键词离线模拟搜索环境中计算得到搜索关键词和改写关键词的曝光结果和点击结果,并计算原词和改写词的曝光结果交叉度和点击结果交叉度。在本示例中使用较长一段时间的搜索曝光和点击日志来模拟线上实际的结果,节省整个迭代过程的训练时间。
步骤205:获取所述搜索关键词与所述改写关键词之间的语义相似度。
语义相似度是指搜索关键词与改写关键词之间的语义相似程度。
在获取到搜索关键词对应的改写关键词之后,可以获取搜索关键词与改写关键词之间的语义相似度,具体地,可以将搜索关键词和改写关键词输入至语义判别模型,以获取由语义判别模型输出的搜索关键词与改写关键词之间的语义相似度,具体地,可以获取语义判别模型输出的搜索关键词与改写关键词分别对应的关键词向量,然后求解两个向量的余弦距离或欧式距离,以得到搜索关键词与改写关键词之间的语义相似度。
在获取到搜索关键词与改写关键词之间的语义相似度之后,执行步骤206。
步骤206:根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值。
偏差分值是指用于指示搜索关键词与改写关键词之间的偏差程度的分值。
在获取到搜索关键词与改写关键词之间的曝光交叉度、点击交叉度和语义相似度之后,可以根据曝光交叉度、点击交叉度和语义相似度确定出搜索关键词与改写关键词之间的偏差分值,具体地,可以结合下述具体实现方式进行详细描述。
在本公开的一种具体实现方式中,上述步骤206可以包括:
子步骤M1:获取所述曝光交叉度对应的第一权重、所述点击交叉度对应的第二权重、及所述语义相似度对应的第三权重。
在本实施例中,第一权重是指曝光交叉度对应的权重。
第二权重是指点击交叉度对应的权重。
第三权重是指语义相似度对应的权重。
在获取到搜索关键词与改写关键词对应的曝光交叉度、点击交叉度和语义相似度之后,可以获取曝光交叉度对应的第一权重、点击交叉度对应的第二权重、以及语义相似度对应对第三权重。
在获取到第一权重、第二权重和第三权重之后,执行子步骤M2。
子步骤M2:基于所述曝光交叉度、所述第一权重、所述点击交叉度、所述第二权重、所述语义相似度和所述第三权重,确定所述搜索关键词与所述改写关键词之间的偏差分值。
在获取到第一权重、第二权重和第三权重之后,可以基于曝光交叉度、第一权重、点击交叉度、第二权重、语义相似度和第三权重,确定出搜索关键词与改写关键词之间的偏差分值。
在本示例中,对于环境输出的原词和改写词的曝光结果交叉度、点击结果交叉度以及BERT语义判别模型赋予不同的权重得到归一化的分值,该分值即可以作为偏差分值。
在获取到搜索关键词与改写关键词之间的偏差分值之后,执行步骤207。
步骤207:将所述偏差分值、所述搜索关键词和所述改写关键词输入至所述初始改写词生成模型,以由所述初始改写词生成模型根据所述偏差分值对所述搜索关键词和所述改写关键词进行处理。
在获取到搜索关键词与改写关键词之间的偏差分值之后,可以将偏差分值、搜索关键词和改写关键词输入至初始改写词生成模型,以由初始改写词生成模型根据偏差分值对搜索关键词和改写关键词进行处理。
该搜索关键词和改写关键词对应于一个初始差异值。
在将偏差分值、搜索关键词和改写关键词输入至初始改写词生成模型之后,执行步骤208。
步骤208:获取由所述初始改写词生成模型输出的所述搜索关键词对应的目标改写关键词。
目标改写关键词是指由初始改写词生成模型输出的搜索关键词对应的目标改写词。
在将偏差分值、搜索关键词和改写关键词输入至初始改写词生成模型之后,可以通过初始改写词生成模型根据偏差分值对搜索关键词和改写关键词进行处理,以得到搜索关键词对应的目标改写关键词,并初始该目标改写关键词。
在获取到由初始改写词生成模型输出的搜索关键词对应的目标改写关键词之后,执行步骤209。
步骤209:迭代执行设定次数的所述将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词,至所述根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练的步骤,直至所述初始改写词生成模型收敛,得到目标改写词生成模型。
在获取到由初始改写词生成模型输出的搜索关键词之后,可以迭代执行设定次数的将搜索关键词输入至所述初始改写词生成模型,并获取由初始改写词生成模型输出的搜索关键词对应的改写关键词,至根据偏差分值、搜索关键词和改写关键词对初始改写词模型进行训练的步骤,即迭代执行上述训练过程,直到初始改写词生成模型在“点击、曝光和语义判别”上收敛至最小偏差,即可得到目标改写词生成模型。
本公开的实施例提供的改写词生成模型的训练方法,通过获取初始改写词生成模型,将搜索关键词输入至初始改写词生成模型,并获取由初始改写词生成模型输出的搜索关键词对应的改写关键词,获取搜索关键词与改写关键词之间的偏差分值,根据偏差分值、搜索关键词和改写关键词对初始改写词模型进行训练,得到目标改写词生成模型。本公开的实施例通过先获取搜索关键词和改写关键词之间的偏差分值,并结合偏差分值、搜索关键词和改写关键词对模型进行进一步地训练,从而可以在搜索***的最终结果上更符合用户搜索需求,提高了查询改写的准确率和覆盖率。
实施例三
参照图3,示出了本公开的实施例提供的一种改写词生成模型的训练装置的结构示意图,如图3所示,该改写词生成模型的训练装置300具体可以包括如下模块:
初始生成模型获取模块310,用于获取初始改写词生成模型;
改写关键词获取模块320,用于将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;
偏差分值获取模块330,用于获取所述搜索关键词与所述改写关键词之间的偏差分值;
目标生成模型获取模块340,用于根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
本公开的实施例提供的改写词生成模型的训练装置,通过获取初始改写词生成模型,将搜索关键词输入至初始改写词生成模型,并获取由初始改写词生成模型输出的搜索关键词对应的改写关键词,获取搜索关键词与改写关键词之间的偏差分值,根据偏差分值、搜索关键词和改写关键词对初始改写词模型进行训练,得到目标改写词生成模型。本公开的实施例通过先获取搜索关键词和改写关键词之间的偏差分值,并结合偏差分值、搜索关键词和改写关键词对模型进行进一步地训练,从而可以在搜索***的最终结果上更符合用户搜索需求,提高了查询改写的准确率和覆盖率。
实施例四
参照图4,示出了本公开的实施例提供的另一种改写词生成模型的训练装置的结构示意图,如图4所示,该改写词生成模型的训练装置400具体可以包括如下模块:
初始生成模型获取模块410,用于获取初始改写词生成模型;
改写关键词获取模块420,用于将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;
偏差分值获取模块430,用于获取所述搜索关键词与所述改写关键词之间的偏差分值;
目标生成模型获取模块440,用于根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
可选地,所述初始生成模型获取模块410包括:
关键词集合获取单元411,用于根据搜索日志,获取查询关键词集合;
初始生成模型获取单元412,用于基于所述查询关键词集合中的查询关键词,对待训练改写词生成模型进行训练,得到所述初始改写词生成模型。
可选地,所述偏差分值获取模块430包括:
交叉度获取单元431,用于获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度;
相似度获取单元432,用于获取所述搜索关键词与所述改写关键词之间的语义相似度;
偏差分值确定单元433,用于根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值。
可选地,所述交叉度获取单元431包括:
曝光点击结果获取子单元,用于获取所述搜索关键词对应的第一曝光结果和第一点击结果,及所述改写关键词对应的第二曝光结果和第二点击结果;
曝光交叉度确定子单元,用于根据所述第一曝光结果和所述第二曝光结果,确定所述搜索关键词与所述改写关键词之间的曝光交叉度;
点击交叉度确定子单元,用于根据所述第一点击结果和所述第二点击结果,确定所述搜索关键词与所述改写关键词之间的点击交叉度。
可选地,所述相似度获取单元432包括:
关键词输入子单元,用于将所述搜索关键词和所述改写关键词输入至语义判别模型;
相似度获取子单元,用于获取由所述语义判别模型输出的所述搜索关键词与所述改写关键词之间的语义相似度。
可选地,所述偏差分值确定单元433包括:
权重获取子单元,用于获取所述曝光交叉度对应的第一权重、所述点击交叉度对应的第二权重、及所述语义相似度对应的第三权重;
偏差分值确定子单元,用于基于所述曝光交叉度、所述第一权重、所述点击交叉度、所述第二权重、所述语义相似度和所述第三权重,确定所述搜索关键词与所述改写关键词之间的偏差分值。
可选地,所述目标生成模型获取模块440包括:
关键词输入单元441,用于将所述偏差分值、所述搜索关键词和所述改写关键词输入至所述初始改写词生成模型,以由所述初始改写词生成模型根据所述偏差分值对所述搜索关键词和所述改写关键词进行处理;
目标改写词获取单元442,用于获取由所述初始改写词生成模型输出的所述搜索关键词对应的目标改写关键词;
目标改写词模型获取单元443,用于迭代执行设定次数的所述将搜索关键词输入至所述改写关键词获取模块、所述偏差分值获取模块和所述目标生成模型获取模块,直至所述初始改写词生成模型收敛,得到目标改写词生成模型。
本公开的实施例提供的改写词生成模型的训练装置,通过获取初始改写词生成模型,将搜索关键词输入至初始改写词生成模型,并获取由初始改写词生成模型输出的搜索关键词对应的改写关键词,获取搜索关键词与改写关键词之间的偏差分值,根据偏差分值、搜索关键词和改写关键词对初始改写词模型进行训练,得到目标改写词生成模型。本公开的实施例通过先获取搜索关键词和改写关键词之间的偏差分值,并结合偏差分值、搜索关键词和改写关键词对模型进行进一步地训练,从而可以在搜索***的最终结果上更符合用户搜索需求,提高了查询改写的准确率和覆盖率。
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的改写词生成模型的训练方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的改写词生成模型的训练方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种改写词生成模型的训练方法,其特征在于,包括:
获取初始改写词生成模型;
将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;
获取所述搜索关键词与所述改写关键词之间的偏差分值,所述偏差分值是指用于指示搜索关键词与改写关键词之间的偏差程度的分值;
所述获取所述搜索关键词与所述改写关键词之间的偏差分值,具体包括:获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度,其中,所述曝光交叉度是指模拟的搜索关键词与改写关键词进行信息检索得到的结果的交叉度,所述点击交叉度是指模拟搜索关键词与改写关键词进行信息检索得到的结果中,用户点击检索结果的交叉程度;获取所述搜索关键词与所述改写关键词之间的语义相似度;根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值;所述偏差分值是指用于指示搜索关键词与改写关键词之间的偏差程度的分值;
根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
2.根据权利要求1所述的方法,其特征在于,所述获取初始改写词生成模型,包括:
根据搜索日志,获取查询关键词集合;
基于所述查询关键词集合中的查询关键词,对待训练改写词生成模型进行训练,得到所述初始改写词生成模型。
3.根据权利要求1所述的方法,其特征在于,所述获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度,包括:
获取所述搜索关键词对应的第一曝光结果和第一点击结果,及所述改写关键词对应的第二曝光结果和第二点击结果;
根据所述第一曝光结果和所述第二曝光结果,确定所述搜索关键词与所述改写关键词之间的曝光交叉度;
根据所述第一点击结果和所述第二点击结果,确定所述搜索关键词与所述改写关键词之间的点击交叉度。
4.根据权利要求1所述的方法,其特征在于,所述获取所述搜索关键词与所述改写关键词之间的语义相似度,包括:
将所述搜索关键词和所述改写关键词输入至语义判别模型;
获取由所述语义判别模型输出的所述搜索关键词与所述改写关键词之间的语义相似度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值,包括:
获取所述曝光交叉度对应的第一权重、所述点击交叉度对应的第二权重、及所述语义相似度对应的第三权重;
基于所述曝光交叉度、所述第一权重、所述点击交叉度、所述第二权重、所述语义相似度和所述第三权重,确定所述搜索关键词与所述改写关键词之间的偏差分值。
6.根据权利要求1所述的方法,其特征在于,所述根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型,包括:
将所述偏差分值、所述搜索关键词和所述改写关键词输入至所述初始改写词生成模型,以由所述初始改写词生成模型根据所述偏差分值对所述搜索关键词和所述改写关键词进行处理;
获取由所述初始改写词生成模型输出的所述搜索关键词对应的目标改写关键词;
迭代执行设定次数的所述将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词,至所述根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练的步骤,直至所述初始改写词生成模型收敛,得到目标改写词生成模型。
7.一种改写词生成模型的训练装置,其特征在于,包括:
初始生成模型获取模块,用于获取初始改写词生成模型;
改写关键词获取模块,用于将搜索关键词输入至所述初始改写词生成模型,并获取由所述初始改写词生成模型输出的所述搜索关键词对应的改写关键词;
偏差分值获取模块,用于获取所述搜索关键词与所述改写关键词之间的偏差分值;所述偏差分值是指用于获取指示搜索关键词与改写关键词之间的偏差程度分值;
所述偏差分值获取模块,包括:交叉度获取单元,用于获取所述搜索关键词与所述改写关键词之间的曝光交叉度和点击交叉度,其中,所述曝光交叉度是指模拟的搜索关键词与改写关键词进行信息检索得到的结果的交叉度,所述点击交叉度是指模拟搜索关键词与改写关键词进行信息检索得到的结果中,用户点击检索结果的交叉程度;相似度获取单元,用于获取所述搜索关键词与所述改写关键词之间的语义相似度;偏差分值确定单元,用于根据所述曝光交叉度、所述点击交叉度和所述语义相似度,确定所述搜索关键词与所述改写关键词之间的偏差分值;
目标生成模型获取模块,用于根据所述偏差分值、所述搜索关键词和所述改写关键词对所述初始改写词模型进行训练,得到目标改写词生成模型。
8.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至6中任一项所述的改写词生成模型的训练方法。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至6中任一项所述的改写词生成模型的训练方法。
CN202110662998.1A 2021-06-15 2021-06-15 改写词生成模型的训练方法及装置 Active CN113505194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110662998.1A CN113505194B (zh) 2021-06-15 2021-06-15 改写词生成模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110662998.1A CN113505194B (zh) 2021-06-15 2021-06-15 改写词生成模型的训练方法及装置

Publications (2)

Publication Number Publication Date
CN113505194A CN113505194A (zh) 2021-10-15
CN113505194B true CN113505194B (zh) 2022-09-13

Family

ID=78010112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110662998.1A Active CN113505194B (zh) 2021-06-15 2021-06-15 改写词生成模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN113505194B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878476A (zh) * 2007-06-22 2010-11-03 谷歌公司 用于查询扩展的机器翻译
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN106815252A (zh) * 2015-12-01 2017-06-09 阿里巴巴集团控股有限公司 一种搜索方法和设备
CN110909021A (zh) * 2018-09-12 2020-03-24 北京奇虎科技有限公司 查询改写模型的构建方法、装置及其应用
CN110969024A (zh) * 2018-09-30 2020-04-07 北京奇虎科技有限公司 一种查询语句的改写方法及装置
CN111428119A (zh) * 2020-02-18 2020-07-17 北京三快在线科技有限公司 查询改写方法、装置、电子设备
CN112256953A (zh) * 2019-07-22 2021-01-22 腾讯科技(深圳)有限公司 查询改写方法、装置、计算机设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9507861B2 (en) * 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US9547690B2 (en) * 2014-09-15 2017-01-17 Google Inc. Query rewriting using session information
US11086866B2 (en) * 2016-04-15 2021-08-10 Verizon Media Inc. Method and system for rewriting a query
CN106095912B (zh) * 2016-06-08 2020-12-08 北京百度网讯科技有限公司 用于生成扩展查询词的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878476A (zh) * 2007-06-22 2010-11-03 谷歌公司 用于查询扩展的机器翻译
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN106815252A (zh) * 2015-12-01 2017-06-09 阿里巴巴集团控股有限公司 一种搜索方法和设备
CN110909021A (zh) * 2018-09-12 2020-03-24 北京奇虎科技有限公司 查询改写模型的构建方法、装置及其应用
CN110969024A (zh) * 2018-09-30 2020-04-07 北京奇虎科技有限公司 一种查询语句的改写方法及装置
CN112256953A (zh) * 2019-07-22 2021-01-22 腾讯科技(深圳)有限公司 查询改写方法、装置、计算机设备和存储介质
CN111428119A (zh) * 2020-02-18 2020-07-17 北京三快在线科技有限公司 查询改写方法、装置、电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Using terminological feedback for web search refinement: a log-based study";Peter Anick;《SIGIR "03: Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval》;20030728;第88-95页 *
一种基于影视素材本体的关键词查询扩展方法研究;沈熠等;《微型机与应用》;20160810(第15期);第79-81+85页 *

Also Published As

Publication number Publication date
CN113505194A (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
US20230252327A1 (en) Neural architecture search for convolutional neural networks
WO2018171717A1 (zh) 面向神经网络处理器的自动化设计方法和***
CN106446005B (zh) 因子分解模型
US11797839B2 (en) Training neural networks using priority queues
EP4053718A1 (en) Watermark information embedding method and apparatus
CN109688428B (zh) 视频评论生成方法和装置
CN112580720A (zh) 一种模型训练方法及装置
US20230177089A1 (en) Identifying similar content in a multi-item embedding space
CN116601626A (zh) 个人知识图谱构建方法、装置及相关设备
EP4295277A2 (en) Full-stack hardware accelerator search
US20220383119A1 (en) Granular neural network architecture search over low-level primitives
CN115757692A (zh) 一种数据处理方法及其装置
WO2022041980A1 (en) Concept prediction to create new intents and assign examples automatically in dialog systems
CN113505194B (zh) 改写词生成模型的训练方法及装置
CN115129460A (zh) 获取算子硬件时间的方法、装置、计算机设备和存储介质
CN117371428A (zh) 基于大语言模型的文本处理方法与装置
CN115829159B (zh) 社交媒体粉丝新增预测方法、装置、设备及存储介质
WO2016155384A1 (zh) 一种搜索优化方法、装置和***
CN108229572B (zh) 一种参数寻优方法及计算设备
CN109472023A (zh) 一种基于实体及文本联合嵌入的实体关联度衡量方法、***及存储介质
CN114707070A (zh) 一种用户行为预测方法及其相关设备
CN110188274B (zh) 搜索纠错方法及装置
KR20230049486A (ko) 정치성향 분석 장치 및 이를 이용한 서비스 제공 방법
CN109597873B (zh) 语料数据的处理方法、装置、计算机可读介质及电子设备
EP4182850A1 (en) Hardware-optimized neural architecture search

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant