CN117725165A - 模型训练方法、搜索方法及相关产品 - Google Patents

模型训练方法、搜索方法及相关产品 Download PDF

Info

Publication number
CN117725165A
CN117725165A CN202311247539.2A CN202311247539A CN117725165A CN 117725165 A CN117725165 A CN 117725165A CN 202311247539 A CN202311247539 A CN 202311247539A CN 117725165 A CN117725165 A CN 117725165A
Authority
CN
China
Prior art keywords
training
search
target
search result
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311247539.2A
Other languages
English (en)
Inventor
李军伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xingyin Information Technology Shanghai Co ltd
Original Assignee
Xingyin Information Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xingyin Information Technology Shanghai Co ltd filed Critical Xingyin Information Technology Shanghai Co ltd
Priority to CN202311247539.2A priority Critical patent/CN117725165A/zh
Publication of CN117725165A publication Critical patent/CN117725165A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种模型训练方法、搜索方法及相关产品。该方法包括:获取待训练文本模型和训练数据,训练数据包括训练搜索词、训练搜索词的至少一个训练搜索结果和至少一个训练搜索结果的至少一个商品属性,训练数据的标签包括训练搜索词与至少一个训练搜索结果的至少一个真实匹配度;利用待训练文本模型对训练搜索词和至少一个商品属性进行特征提取,得到训练文本特征;基于训练文本特征与至少一个训练搜索结果,确定训练搜索词与至少一个训练搜索结果的至少一个预测匹配度,预测匹配度与训练搜索结果一一对应;基于至少一个预测匹配度和至少一个真实匹配度,确定总损失;基于总损失更新待训练文本模型的参数,得到目标文本模型。

Description

模型训练方法、搜索方法及相关产品
技术领域
本申请涉及搜索技术领域,尤其涉及一种模型训练方法、搜索方法及相关产品。
背景技术
通过对待训练文本模型进行训练,可使待训练文本模型具备提取文本的特征的能力,进而可基于所提取出的文本的特征,对文本进行相应的处理,如,基于搜索词的特征确定与搜索词匹配的文本。因此,如何对待训练文本模型进行训练具有非常重要的意义。
发明内容
本申请提供一种模型训练方法、搜索方法及相关产品。
第一方面,提供了一种模型训练方法,所述方法包括:
获取训练数据,所述训练数据包括训练搜索词、所述训练搜索词的至少一个训练搜索结果和所述至少一个训练搜索结果的至少一个商品属性,所述训练数据的标签包括所述训练搜索词与所述至少一个训练搜索结果的至少一个真实匹配度;
利用待训练文本模型对所述训练搜索词和所述至少一个商品属性进行特征提取,得到训练文本特征;
基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,所述预测匹配度与所述训练搜索结果一一对应;
基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失;
基于所述总损失更新所述待训练文本模型的参数,得到目标文本模型。
结合本申请任一实施方式,所述基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,包括:
获取待训练多模态模型;
利用所述待训练多模态模型对所述至少一个训练搜索结果进行特征提取,得到至少一个搜索结果特征;
基于所述训练文本特征与所述至少一个搜索结果特征,确定所述至少一个预测匹配度。
结合本申请任一实施方式,在基于所述至少一个预测匹配度和所述训练数据的标签确定总损失之后,所述方法还包括:
基于所述总损失更新所述待训练多模态模型,得到目标多模态模型。
结合本申请任一实施方式,在训练搜索结果的数量大于1的情况下,所述至少一个训练搜索结果包括与所述训练搜索词匹配的至少两个同类搜索结果;
所述基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失,包括:
从所述至少一个真实匹配度中确定与所述至少两个同类搜索结果对应的至少两个参考匹配度;
确定所述至少两个参考匹配度的参考分布;
从所述至少一个预测匹配度中确定与所述至少两个同类搜索结果对应的至少两个同类匹配度;
确定所述至少两个同类匹配度的目标分布;
基于所述参考分布与所述目标分布的差异,确定所述总损失,所述总损失与所述差异呈正相关。
结合本申请任一实施方式,所述确定所述至少两个参考匹配度的参考分布,包括:
按照从大到小的顺序对所述至少两个参考匹配度进行排序,得到所述参考分布;
所述确定所述至少两个同类匹配度的目标分布,包括:
按照从大到小的顺序对所述至少两个同类匹配度进行排序,得到所述目标分布。
结合本申请任一实施方式,所述基于所述参考分布与所述目标分布的差异,确定所述总损失,包括:
基于所述参考分布与所述目标分布的差异,确定第一损失,所述第一损失与所述差异呈正相关;
基于所述至少两个同类匹配度,确定第二损失,所述第二损失与所述至少两个同类匹配度呈负相关;
基于所述第一损失和所述第二损失,确定所述总损失,所述第一损失、所述第二损失均与所述总损失呈正相关。
结合本申请任一实施方式,所述至少一个训练搜索结果包括与所述训练搜索词不匹配的至少一个异类搜索结果;
在所述基于所述至少两个同类匹配度,确定第二损失之前,所述方法还包括:
从所述至少一个预测匹配度中确定与所述至少一个异类搜索结果对应的至少一个异类匹配度;
所述基于所述至少两个同类匹配度,确定第二损失,包括:
基于所述至少两个同类匹配度和所述至少一个异类匹配度,确定第二损失,所述第二损失与所述至少一个异类匹配度呈正相关。
结合本申请任一实施方式,所述至少两个同类搜索结果包括目标搜索结果中被选中次数最多的k个,所述目标搜索结果为以所述训练搜索词为依据搜索得到的搜索结果。
结合本申请任一实施方式,所述至少一个商品属性包括以下至少一个:品牌、品类、系列词。
结合本申请任一实施方式,所述训练搜索结果为文档。
第二方面,提供了一种搜索方法,所述方法包括:
获取目标搜索词;
利用目标文本模型对所述目标搜索词进行特征提取,得到目标文本特征,所述目标文本模型是根据第一方面及其任一实施方式训练得到的;
获取待搜索数据库,所述待搜索数据库包括待搜索数据;
利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果。
结合本申请任一实施方式,所述利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果,包括:
利用所述目标多模态模型对所述待搜索数据进行特征提取,得到待搜索特征,所述目标多模态模型是根据第一方面的实施方式训练得到的;
确定所述目标文本特征与所述待搜索特征的相似度;
在所述相似度大于或等于阈值的情况下,确定所述待搜索特征所对应的待搜索数据为所述目标搜索词的搜索结果。
第三方面,提供了一种模型训练装置,所述模型训练装置包括:
获取单元,用于获取训练数据,所述训练数据包括训练搜索词、所述训练搜索词的至少一个训练搜索结果和所述至少一个训练搜索结果的至少一个商品属性,所述训练数据的标签包括所述训练搜索词与所述至少一个训练搜索结果的至少一个真实匹配度;
提取单元,用于利用待训练文本模型对所述训练搜索词和所述至少一个商品属性进行特征提取,得到训练文本特征;
确定单元,用于基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,所述预测匹配度与所述训练搜索结果一一对应;
所述确定单元,用于基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失;
更新单元,用于基于所述总损失更新所述待训练文本模型的参数,得到目标文本模型结合本申请任一实施方式,所述确定单元,用于:
获取待训练多模态模型;
利用所述待训练多模态模型对所述至少一个训练搜索结果进行特征提取,得到至少一个搜索结果特征;
基于所述训练文本特征与所述至少一个搜索结果特征,确定所述至少一个预测匹配度。
结合本申请任一实施方式,所述更新单元,还用于基于所述总损失更新所述待训练多模态模型,得到目标多模态模型。
结合本申请任一实施方式,在训练搜索结果的数量大于1的情况下,所述至少一个训练搜索结果包括与所述训练搜索词匹配的至少两个同类搜索结果;
所述确定单元,用于:
从所述至少一个真实匹配度中确定与所述至少两个同类搜索结果对应的至少两个参考匹配度;
确定所述至少两个参考匹配度的参考分布;
从所述至少一个预测匹配度中确定与所述至少两个同类搜索结果对应的至少两个同类匹配度;
确定所述至少两个同类匹配度的目标分布;
基于所述参考分布与所述目标分布的差异,确定所述总损失,所述总损失与所述差异呈正相关。
结合本申请任一实施方式,所述确定单元,用于:
按照从大到小的顺序对所述至少两个参考匹配度进行排序,得到所述参考分布;
所述确定单元,用于:
按照从大到小的顺序对所述至少两个同类匹配度进行排序,得到所述目标分布。
结合本申请任一实施方式,所述确定单元,用于:
基于所述参考分布与所述目标分布的差异,确定第一损失,所述第一损失与所述差异呈正相关;
基于所述至少两个同类匹配度,确定第二损失,所述第二损失与所述至少两个同类匹配度呈负相关;
基于所述第一损失和所述第二损失,确定所述总损失,所述第一损失、所述第二损失均与所述总损失呈正相关。
结合本申请任一实施方式,所述至少一个训练搜索结果包括与所述训练搜索词不匹配的至少一个异类搜索结果;
所述确定单元,还用于:
从所述至少一个预测匹配度中确定与所述至少一个异类搜索结果对应的至少一个异类匹配度;
基于所述至少两个同类匹配度和所述至少一个异类匹配度,确定第二损失,所述第二损失与所述至少一个异类匹配度呈正相关。
结合本申请任一实施方式,所述至少两个同类搜索结果包括目标搜索结果中被选中次数最多的k个,所述目标搜索结果为以所述训练搜索词为依据搜索得到的搜索结果。
结合本申请任一实施方式,所述至少一个商品属性包括以下至少一个:品牌、品类、系列词。
结合本申请任一实施方式,所述训练搜索结果为文档。
第四方面,提供了一种搜索装置,所述搜索装置包括:
获取单元,用于获取目标搜索词;
提取单元,用于利用所述目标文本模型对所述目标搜索词进行特征提取,得到目标文本特征,所述目标文本模型是根据第一方面及其任一实施方式训练得到的;
所述获取单元,用于获取待搜索数据库,所述待搜索数据库包括待搜索数据;
确定单元,用于利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果。
结合本申请任一实施方式,所述确定单元,用于:
利用所述目标多模态模型对所述待搜索数据进行特征提取,得到待搜索特征,所述目标多模态模型是根据第一方面的实施方式训练得到的;
确定所述目标文本特征与所述待搜索特征的相似度;
在所述相似度大于或等于阈值的情况下,确定所述待搜索特征所对应的待搜索数据为所述目标搜索词的搜索结果。
第五方面,提供了一种电子设备,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任一实施方式;在所述处理器执行所述计算机指令的情况下,所述电子设备或者执行如上述第二方面及其任一实施方式。
第六方面,提供了另一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;
在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任一实施方式;在所述处理器执行所述计算机指令的情况下,所述电子设备或者执行如上述第二方面及其任一实施方式。
第七方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令;
在所述程序指令被处理器执行的情况下,使所述处理器执行如上述第一方面及其任一实施方式;在所述程序指令被处理器执行的情况下,或者使所述处理器或者执行如上述第二方面及其任一实施方式。
第八方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或指令;在所述计算机程序或指令在计算机上运行的情况下,使得所述计算机执行上述第一方面及其任一实施方式;在所述程序指令被处理器执行的情况下,或者使所述处理器执行如上述第二方面及其任一实施方式。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请。
本申请中,训练数据包括训练搜索词、训练搜索词的至少一个训练搜索结果和至少一个搜索结果的至少一个商品属性。由于至少一个训练搜索结果均为训练搜索的搜索结果,至少一个商品属性均为至少一个训练搜索结果的商品属性,因此,至少一个商品属性可作为与训练搜索词相关的商品信息。于是,在模型训练装置利用训练数据训练待训练文本模型的过程中,利用待训练文本模型对训练搜索结果和至少一个商品属性进行特征提取,得到训练文本特征,可使训练文本特征既携带训练搜索词的语义信息,又携带与训练搜索词相关的商品信息。这样,再基于训练文本特征与至少一个训练搜索结果,确定训练搜索词与至少一个训练搜索结果的至少一个预测匹配度,可利用训练文本特征中的训练搜索词的特征信息和至少一个商品属性的特征信息,确定至少一个预测匹配度,也就是说,至少一个预测匹配度的准确度可反应待训练文本模型从训练搜索词中提取到的训练文本特征所携带的信息的准确度。因此在确定至少一个预测匹配度后,基于预测匹配度和真实匹配度确定总损失,并在确定总损失后基于总损失更新待训练文本模型的参数,可使待训练文本模型具备从搜索词中提取搜索词的语义信息和与搜索词相关的商品信息的能力。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1为本申请实施例提供的一种模型训练方法的流程示意图;
图2为本申请实施例提供的一种模型训练框架示意图;
图3为本申请实施例提供的一种搜索方法的流程示意图;
图4为本申请实施例提供的一种模型训练装置的结构示意图;
图5为本申请实施例提供的一种搜索装置的结构示意图;
图6为本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所提供的模型训练方法的执行主体为模型训练装置,其中,模型训练装置可以是任意一种可执行模型训练方法的实施例所公开的技术方案的电子设备。可选的,模型训练装置可以是以下中的一种:计算机、服务器。
应理解,模型训练方法的实施例还可以通过处理器执行计算机程序代码的方式实现。下面结合本申请实施例中的附图对本申请实施例进行描述。请参阅图1,图1是本申请实施例提供的一种模型训练方法的流程示意图。
101、获取训练数据。
本申请实施例中,训练数据包括训练搜索词、训练搜索词的至少一个训练搜索结果和至少一个训练搜索结果的至少一个商品属性,训练搜索词可以是任意词语。训练搜索结果为以训练搜索词为依据搜索得到的搜索结果,其中,搜索结果包括:文档、图像、视频、音频,例如,训练搜索词为洗发水,训练搜索结果可以是洗发水相关的文档,训练搜索也可以是与洗发水相关的图像,训练搜索结果还可以是与洗发水相关的视频,训练搜索结果还可以是与洗发水相关的音频。训练搜索词具有至少一个训练搜索结果即说明以训练搜索词为依据搜索得到的搜索结果的数量为一个或一个以上。应理解,在训练搜索结果的数量超过1的情况下,至少一个训练搜索结果可以包括至少两种类型的数据,例如,至少一个训练搜索结果包括训练搜索结果a和训练搜索结果b,其中,训练搜索结果a为文档,训练搜索结果b为图像。
商品属性为训练搜索结果中与商品相关的属性,可选的,商品属性包括:品牌、品类、系列词,其中,品牌为商品的品牌,品类为商品所属的品类,系列词为商品所属的系列产品的名称。例如,训练搜索结果为一篇文档,文档中出现了洗发水、洗发水品牌,其中,洗发水的品类为日用品,此时该文档中的商品属性包括日用品(品类)、洗发水品牌(品牌)。又例如,训练搜索结果为一张图像,图像中包括洗发水,而且该洗发水属于A系列产品,其中,洗发水的品类为日用品,此时该图像中的商品属性包括日用品(品类)、A(系列词)。至少一个训练搜索结果的至少一个商品属性为至少一个训练搜索结果中的商品属性的集合,即商品属性的数量为一个或一个以上。
训练数据的标签包括训练搜索词与至少一个训练搜索结果的至少一个真实匹配度,其中,真实匹配度与训练搜索结果一一对应。在一种获取训练数据的实现方式中,模型训练装置接收用户通过输入组件输入的训练数据获取训练数据。可选的,输入组件可以是以下中的任意一种:键盘、鼠标、触控屏、触控板和音频输入器。
在另一种获取训练数据的实现方式中,模型训练装置接收终端发送的训练数据获取训练数据。可选的,终端可以是以下中的任意一种:手机、计算机、平板电脑、服务器、可穿戴设备。
102、利用待训练文本模型对上述训练搜索词和上述至少一个商品属性进行特征提取,得到训练文本特征。
本申请实施例中,待训练文本模型为任意用于处理文本的模型。待训练文本模型在通过执行步骤102得到训练文本特征的情况下,训练文本特征既携带训练搜索词的特征信息,还携带至少一个商品属性的特征信息。
在一种可能实现的方式中,待训练文本模型对训练搜索词和至少一个商品属性进行拼接(concat),得到扩展文本。例如,训练搜索词为洗发水,至少一个商品属性包括日用品和洗发水品牌,通过对训练搜索词和至少一个商品属性进行拼接得到的扩展文本为(洗发水,日用品,洗发水品牌)。通过对扩展文本进行特征提取,得到训练文本特征。
103、基于上述训练文本特征与上述至少一个训练搜索结果,确定上述训练搜索词与上述至少一个训练搜索结果的至少一个预测匹配度。
本申请实施例中,预测匹配度为基于待训练文本模型提取出的训练文本特征与至少一个训练搜索结果,确定的训练搜索词与训练搜索结果的匹配度,且预测匹配度与训练搜索结果一一对应。在一种可能实现的方式中,模型训练装置确定训练文本特征与各个搜索结果的相似度得到至少一个预测匹配度。例如,至少一个训练搜索结果包括训练搜索结果a和训练搜索结果b,其中,训练文本特征与训练搜索结果a的相似度为c,训练文本特征与训练搜索结果b的相似度为d,此时训练搜索词与训练搜索结果a的预测匹配度为c,训练搜索词与训练搜索结果b的预测匹配度为d。
104、基于上述至少一个预测匹配度和上述至少一个真实匹配度,确定总损失。
本申请实施例中,真实匹配度为真值(Ground Truth,GT),因此可以真实匹配度为依据,确定预测匹配度的准确度。而预测匹配度是基于待训练文本模型提取得到的训练文本特征得到的,预测匹配度的准确度可反应待训练文本模型从训练搜索词中提取到的训练文本特征的准确度。因此,基于预测匹配度和真实匹配度确定总损失,并在确定总损失后基于总损失更新待训练文本模型的参数,可使待训练文本模型从训练搜索词中提取出的训练文本特征更准确。
作为一种可选的实施方式,模型训练装置基于至少一个预测匹配度和至少一个真实匹配度的差异确定总损失,其中,总损失与该差异呈相关。在一种可能实现的方式中,模型训练装置计算各个预测匹配度与对应的真实匹配度的差异的平均值作为总损失。例如,至少一个训练搜索结果包括训练搜索结果a和训练搜索结果b,至少一个预测匹配度包括训练搜索词与训练搜索结果a的预测匹配度c、训练搜索词与训练搜索结果b的预测匹配度d,至少一个真实匹配度包括训练搜索词与训练搜索结果a的真实匹配度e、训练搜索词与训练搜索结果b的真实匹配度f。此时,预测匹配度c与真实匹配度e对应,预测匹配度d与真实匹配度f对应。模型训练装置计算预测匹配度c与真实匹配度e的差得到第一差值,计算预测匹配度d与真实匹配度f的差得到第二差值,最后计算第一差值与第二差值的平均值得到总损失。
在另一种可能实现的方式中,模型训练装置计算各个预测匹配度与对应的真实匹配度的差异的中值作为总损失。
105、基于上述总损失更新上述待训练文本模型的参数,得到目标文本模型。
如步骤104所述,基于总损失更新待训练文本模型的参数,可使待训练文本模型从训练搜索词中提取出的训练文本特征更准确。因此,模型训练装置通过执行步骤105得到目标文本模型,可提高目标文本模型从训练搜索词中提取出的训练文本特征的准确度,换句话说,利用目标文本模型提取任意搜索词的特征,均可提高所提取出的搜索词的特征的准确度。应理解,搜索词的特征的准确度指,搜索词的特征所携带的与商品相关的信息的准确度。
在一种可能实现的方式中,模型训练装置基于总损失对待训练文本模型进行反向梯度传播更新待训练文本模型的参数,直至总损失收敛得到目标文本模型。
本申请实施例中,训练数据包括训练搜索词、训练搜索词的至少一个训练搜索结果和至少一个搜索结果的至少一个商品属性。由于至少一个训练搜索结果均为训练搜索的搜索结果,至少一个商品属性均为至少一个训练搜索结果的商品属性,因此,至少一个商品属性可作为与训练搜索词相关的商品信息。于是,在模型训练装置利用训练数据训练待训练文本模型的过程中,利用待训练文本模型对训练搜索结果和至少一个商品属性进行特征提取,得到训练文本特征,可使训练文本特征既携带训练搜索词的语义信息,又携带与训练搜索词相关的商品信息。这样,再基于训练文本特征与至少一个训练搜索结果,确定训练搜索词与至少一个训练搜索结果的至少一个预测匹配度,可利用训练文本特征中的训练搜索词的特征信息和至少一个商品属性的特征信息,确定至少一个预测匹配度,也就是说,至少一个预测匹配度的准确度可反应待训练文本模型从训练搜索词中提取到的训练文本特征所携带的信息的准确度。因此在确定至少一个预测匹配度后,基于预测匹配度和真实匹配度确定总损失,并在确定总损失后基于总损失更新待训练文本模型的参数,可使待训练文本模型具备从搜索词中提取搜索词的语义信息和与搜索词相关的商品信息的能力。
作为一种可选的实施方式,模型训练装置在执行步骤103的过程中执行以下步骤:
2001、获取待训练多模态模型。
本申请实施例中,待训练多模态模型为具备提取目标类型的数据的特征的模型,其中,目标类型为训练搜索结果的类型。例如,训练搜索结果为文档,那么训练搜索结果的类型为文档,相应的,目标类型为文档,待训练多模态模型为具备提取文档的特征的模型。例如,训练搜索结果为图像,那么训练搜索结果的类型为图像,相应的,目标类型为图像,待训练多模态模型为具备提取图像的特征的模型。
在一种获取待训练多模态模型的实现方式中,模型训练装置接收用户通过输入组件输入的待训练多模态模型获取待训练多模态模型。
在另一种获取待训练多模态模型的实现方式中,模型训练装置接收终端发送的待训练多模态模型获取待训练多模态模型。
2002、利用上述待训练多模态模型对上述至少一个训练搜索结果进行特征提取,得到至少一个搜索结果特征。
模型训练装置利用待训练多模态模型分别对各个训练搜索结果进行特征提取,得到至少一个搜索结果特征,即搜索结果特征与训练搜索结果一一对应。
2003、基于上述训练文本特征与上述至少一个搜索结果特征,确定上述至少一个预测匹配度。
在一种可能实现的方式中,模型训练装置通过计算训练文本特征与各个搜索结果特征的相似度确定至少一个预测匹配度。
在该种实施方式中,模型训练装置在获取待训练多模态模型后,利用待训练模态模型对至少一个训练搜索结果进行特征提取,得到至少一个搜索结果特征,进而可基于训练文本特征与至少一个搜索结果特征,确定至少一个预测匹配度。
作为一种可选的实施方式,模型训练装置通过执行步骤201~步骤203确定至少一个预测匹配度。此时模型训练装置在基于至少一个预测匹配度和训练数据的标签确定总损失之后,还执行以下步骤:基于总损失更新待训练多模态模型,得到目标多模态模型。
由于预测匹配度是基于待训练多模态模型提取得到的搜索结果特征得到的,故预测匹配度的准确度可反应待训练多模态模型从训练搜索结果中提取到的搜索结果特征的准确度。因此,在基于预测匹配度和真实匹配度确定总损失后,基于总损失更新待训练多模态模型的参数,可使待训练多模态模型从训练搜索结果中提取出的搜索结果特征更准确。
作为一种可选的实施方式,在训练搜索结果的数量大于1的情况下,至少一个训练搜索结果包括与训练搜索词匹配的至少两个同类搜索结果,换句话说,任意一个同类搜索结果均与训练搜索词匹配。训练搜索词与同类搜索结果匹配,说明同类搜索结果是以训练搜索词为依据搜索得到的搜索结果。
可选的,训练数据的标签包括训练搜索词的标签和训练搜索结果的标签,其中,训练搜索词的标签与同类搜索结果的标签相同,即表征训练搜索词与同类搜索结果匹配。例如,至少一个训练搜索结果包括训练搜索结果a、训练搜索结果b和训练搜索结果c。训练搜索词的标签、训练搜索结果a的标签和训练搜索结果b的标签均为1,训练搜索结果c的标签为2,那么训练搜索结果a、训练搜索结果b均与训练搜索词匹配,训练搜索结果c与训练搜索词不匹配,即训练搜索结果a和训练搜索结果b均为同类搜索结果。
在该种实施方式中,模型训练装置在执行步骤104的过程中执行以下步骤:
3001、从上述至少一个真实匹配度中确定与上述至少两个同类搜索结果对应的至少两个参考匹配度。
本申请实施例中,参考匹配度为同类搜索结果与训练搜索词的真实匹配度,即参考匹配度与同类搜索结果一一对应。应理解,在训练搜索结果的数量大于1的情况下,真实匹配度的数量为两个或两个以上,因此,可从至少一个真实匹配度中确定至少两个参考匹配度。
3002、确定上述至少两个参考匹配度的参考分布。
本申请实施例中,参考分布为至少两个参考匹配度的分布。在一种可能实现的方式中,模型训练装置按照从大到小的顺序对至少两个参考匹配度进行排序得到参考分布。
在另一种可能实现的方式中,模型训练装置按照小到大的顺序对至少两个参考匹配度进行排序得到参考分布。
在又一种可能实现的方式中,模型训练装置统计至少两个参考匹配度中落入第一范围内的参考匹配度的第一数量以及落入第二范围内的参考匹配度的第二数量,得到参考分布,其中,第一范围与第二范围无交集。例如,第一范围为大于或等于0且小于或等于0.5,第二范围为大于0.5且小于或等于1。若在至少两个参考匹配度中,有3个参考匹配度的值大于或等于0且小于或等于0.5,有5个参考匹配度的值大于0.5且小于或等于1,那么第一数量为3,第二数量为4,即参考分布包括第一数量为3、第二数量为4。
3003、从上述至少一个预测匹配度中确定与上述至少两个同类搜索结果对应的至少两个同类匹配度。
本申请实施例中,同类匹配度为同类搜索结果与训练搜索词的预测匹配度,即同类匹配度与同类搜索结果一一对应。应理解,在训练搜索结果的数量大于1的情况下,预测匹配度的数量为两个或两个以上,因此,可从至少一个预测匹配度中确定至少两个同类匹配度。
3004、确定上述至少两个同类匹配度的目标分布。
本申请实施例中,目标分布为至少两个同类匹配度的分布,而且确定目标分布的方式与确定参考分布的方式相同。在一种可能实现的方式中,在模型训练装置按照大到小的顺序对至少两个参考匹配度进行排序得到参考分布的情况下,模型训练装置按照大到小的顺序对至少两个同类匹配度进行排序得到目标分布。
在另一种可能实现的方式中,在模型训练装置按照小到大的顺序对至少两个参考匹配度进行排序得到参考分布的情况下,模型训练装置按照小到大的顺序对至少两个同类匹配度进行排序得到目标分布。
在又一种可能实现的方式中,在模型训练装置通过统计至少两个参考匹配度中落入第一范围内的参考匹配度的第一数量以及落入第二范围内的参考匹配度的第二数量得到参考分布的情况下,模型训练装置通过统计至少两个同类匹配度中落入第一范围内的同类匹配度的第三数量以及落入第二范围内的同类匹配度的第四数量得到目标分布。
3005、基于上述参考分布与上述目标分布的差异,确定上述总损失。
本申请实施例中,参考分布基于训练搜索词与至少两个同类搜索结果的真实匹配度确定,因此目标分布可作为GT。目标分布是基于训练搜索词与至少两个同类搜索结果的预测匹配度确定的,因此基于目标分布与参考分布的差异,可确定预测匹配度的准确度,而总损失表征的是预测匹配度的准确度,进而可基于参考分布与目标分布的差异确定总损失。其中,参考分布与目标分布的差异越大,说明预测匹配度的准确度越低,相应的总损失就越大,因此,总损失与该差异呈正相关。
在一种可能实现的方式中,模型训练装置通过计算参考分布与目标分布的(Kullback-Leibler divergence,KL)散度,确定参考分布与目标分布的差异,并将参考分布与目标分布的KL散度作为总损失。
在另一种可能实现的方式中,模型训练装置通过计算参考分布与目标分布的距离,确定参考分布与目标分布的差异,进而可基于参考分布与目标分布的距离确定总损失。
在该种实施方式中,模型训练装置从至少一个真实匹配度中确定与至少两个同类搜索结果对应的至少两个参考匹配度,并确定至少两个参考匹配度的参考分布。从至少一个预测匹配度中确定与至少两个同类搜索结果对应的至少两个同类匹配度,并确定至少两个同类匹配度的目标分布。然后基于参考分布与目标分布的差异确定总损失,这样相较于基于各个预测匹配度与对应的真实匹配度的差异确定总损失,可基于至少一个预测匹配度与至少一个真实匹配度在整体上的差异确定总损失,从而可使总损失能更好的反应至少一个预测匹配度与至少一个真实匹配度在整体上的差异。
作为一种可选的实施方式,模型训练装置在执行步骤3005的过程中执行以下步骤:
4001、基于上述参考分布与上述目标分布的差异,确定第一损失。
本申请实施例中,第一损失与该差异呈正相关,而且第一损失可表征预测匹配度的准确度。本步骤的实现方式可参见步骤3005的实现方式,此处将不再赘述,应理解,在步骤3005中,基于参考分布与目标分布的差异得到的是总损失,但在本步骤中,基于参考分布与目标分布的差异得到的第一损失,不是总损失。
4002、基于上述至少两个同类匹配度,确定第二损失。
由于同类匹配度表征训练搜索词与同类搜索结果的匹配度,而训练搜索词与同类搜索结果匹配,故同类匹配度越大,说明同类匹配度越准,相应的,用于表征同类匹配度的第二损失就越小。因此模型训练装置在第二损失与至少两个同类匹配度呈负相关的情况下,基于至少两个同类匹配度确定第二损失,可使第二损失更好的表征同类匹配度的准确度。
在一种可能实现的方式中,模型训练装置基于至少两个同类匹配度中所有同类匹配度的和确定第二损失,其中,所有同类匹配度的和与第二损失呈负相关。
在另一种可能实现的方式中,模型训练装置基于至少两个同类匹配度中所有同类匹配度的平均值确定第二损失,其中,所有同类匹配度的平均值与第二损失呈负相关。
4003、基于上述第一损失和上述第二损失,确定上述总损失。
由于第一损失和第二损失均可表征预测匹配度的准确度,故模型训练装置可基于第一损失和第二损失,确定总损失,其中,第一损失、第二损失均与总损失呈正相关。应理解,同类匹配度为预测匹配度,因此第二损失可征同类匹配度的准确度即第二损失可征预测匹配度的准确度。
在该种实施方式中,模型训练装置基于参考分布与目标分布的差异确定第一损失,在至少两个同类匹配度与第二损失满足负相关的情况下,基于至少两个同类匹配度确定第二损失,最后在第一损失、第二损失均与总损失呈正相关的情况下,基于第一损失和第二损失确定总损失,可使总损失能更好的表征预测匹配度的准确度和同类匹配度的准确度。
作为一种可选的实施方式,至少一个训练搜索结果不仅包括至少两个同类搜索结果,还包括与训练搜索词不匹配的至少一个异类搜索结果,换句话说,任意一个异类搜索结果均与训练搜索词不匹配,应理解此时训练搜索结果的数量为三个或三个以上。训练搜索词与异类搜索结果不匹配,说明异类搜索结果不是以训练搜索词为依据搜索得到的搜索结果。
在一种可能实现的方式中,至少两个同类搜索结果包括目标搜索结果中被选中次数最多的k个,其中,k为大于1的正整数,目标搜索结果为以训练搜索词为依据搜索得到的搜索结果。例如,以训练搜索词为依据搜索得到的搜索结果包括目标搜索结果a、目标搜索结果b、目标搜索结果c,其中,目标搜索结果a被选中的次数为40,目标搜索结果b被选中的次数为100,目标搜索结果c被选中的次数为80。若k=2,则至少两个同类搜索结果包括被选中次数最多的两个目标搜索结果,即为目标搜索结果b和目标搜索结果c。
应理解,目标搜索结果被选中可以是目标搜索结果被查看。例如,电子设备以训练搜索词依据搜索得到的搜索结果包括目标搜索结果a和目标搜索结果b,并通过将目标搜索结果a和目标搜索结果b进行展示以供用户查看。用户通过点击目标搜索结果a查看目标搜索结果a,此时目标搜索结果a为被选中的目标搜索结果。
可选的,训练数据的标签包括训练搜索词的标签和训练搜索结果的标签,其中,训练搜索词的标签与异类搜索结果的标签不同,即表征训练搜索词与异类搜索结果不匹配。例如,至少一个训练搜索结果包括训练搜索结果a、训练搜索结果b和训练搜索结果c。训练搜索词的标签、训练搜索结果a的标签和训练搜索结果b的标签均为1,训练搜索结果c的标签为2,那么训练搜索结果a、训练搜索结果b均与训练搜索词匹配,训练搜索结果c与训练搜索词不匹配,即训练搜索结果c均为异类搜索结果。
在该种实施方式中,模型训练装置在执行步骤4002之前,还执行以下步骤:
5001、从上述至少一个预测匹配度中确定与上述至少一个异类搜索结果对应的至少一个异类匹配度。
本申请实施例中,异类匹配度为异类搜索结果与训练搜索词的预测匹配度,即异类匹配度与异类搜索结果一一对应。应理解,在训练搜索结果的数量为三个或三个以上的情况下,预测匹配度的数量也为三个或三个以上,因此,可在从至少一个预测匹配度中确定至少两个同类匹配度的情况下,从至少一个预测匹配度中确定至少一个异类匹配度。
在确定至少一个异类匹配度的情况下,模型训练装置在执行步骤402的过程中执行以下步骤:
5002、基于上述至少两个同类匹配度和上述至少一个异类匹配度,确定第二损失。
由于异类匹配度表征训练搜索词与异类搜索结果的匹配度,而训练搜索词与异类搜索结果不匹配,故异类匹配度越小,说明异类匹配度越准,相应的,用于表征异类匹配度的第二损失就越小。因此模型训练装置在第二损失与至少一个异类匹配度呈正相关的情况下,基于至少一个异类匹配度确定第二损失,可使第二损失更好的表征异类匹配度的准确度。
在一种可能实现的方式中,模型训练装置基于至少两个同类匹配度中所有同类匹配度的和,以及至少一个异类匹配度中所有异类匹配度的和,确定第二损失,其中,所有同类匹配度的和与第二损失呈负相关,所有异类匹配度的和与第二损失呈正相关。
在另一种可能实现的方式中,模型训练装置基于至少两个同类匹配度中所有同类匹配度的平均值,以及至少一个异类匹配度中所有异类匹配度的平均值,确定第二损失,其中,所有同类匹配度的平均值与第二损失呈负相关,所有异类匹配度的平均值与第二损失呈正相关。
在该种实施方式中,模型训练装置首先从至少一个预测匹配度中确定与至少一个异类搜索结果对应的至少一个异类匹配度,然后在至少一个异类匹配度与第二损失呈正相关,且至少两个同类匹配度与第二损失呈负相关的情况下,基于至少一个异类匹配度和至少两个同类匹配度,确定第二损失。这样可使第二损失既能更好的表征同类匹配度的准确度,又能更好的表征异类匹配度的准确度。
基于本申请实施例提供的模型训练方法,本申请实施例还提供了一种可能的模型训练实施方式。请参阅图2,图2所示为本申请实施例提供的一种模型训练框架示意图,如图2所示,该训练框架的输入为上述训练数据,应理解,训练数据中的训练搜索词的数量可以是一个或一个以上。在图2的训练框架中,训练数据包括各个训练搜索词的至少两个同类搜索结果,且至少两个同类搜索结果包括目标搜索结果中被选中次数最多的k个。
通过对各个训练搜索词与对应的至少一个商品属性进行拼接可得到至少一个扩展文本。然后将至少一个扩展文本输入至待训练文本模型,将训练搜索结果输入至待训练多模态模型,应理解,图2中的训练搜索结果即为各个训练搜索词的至少两个同类搜索结果。经待训练文本模型对各个扩展文本进行特征提取得到各个扩展文本的训练文本特征,经待训练多模态模型对各个训练搜索结果进行特征提取得到各个训练搜索结果的搜索结果特征。再基于训练文本特征与搜索结果特征,可确定第一损失和第二损失(具体实现过程可参见前文所述的确定第一损失和第二损失的实现过程)。
可选的,在训练搜索词与训练搜索结果均具有标签的情况下,基于对比学习损失函数计算第二损失:Loss2=contrastive({Bitem,Lablequery})...公式(1),其中,Bitem表示一个具有相同标签的搜索结果,Lablequery表示根据Bitem所对应的训练搜索词的标签。
最后通过对第一损失和第二损失进行求和得到总损失,并基于总损失更新待训练文本模型的参数得到目标文本模型,以及基于总损失更新待训练多模态模型的参数得到目标多模态模型。
基于通过前文所提供的模型训练方法所得到的目标文本模型,本申请实施例还提供了一种搜索方法。本申请实施例所提供的搜索方法的执行主体为搜索装置,其中,搜索装置可以是任意一种可执行搜索方法的实施例所公开的技术方案的电子设备。可选的,搜索装置可以是以下中的一种:计算机、服务器。
应理解,搜索方法的实施例还可以通过处理器执行计算机程序代码的方式实现。下面结合本申请实施例中的附图对本申请实施例进行描述。请参阅图3,图3是本申请实施例提供的一种搜索方法的流程示意图。
301、获取目标搜索词。
本申请实施例中,目标搜索词可以是任意搜索词。在一种可能实现的方式中,搜索装置通过获取针对目标搜索词的搜索请求获取目标搜索词,该目标搜索词可视为搜索依据,搜索请求用于请求以目标搜索词为依据进行搜索。
302、利用目标文本模型对上述目标搜索词进行特征提取,得到目标文本特征。
本申请实施例中,目标文本模型是根据模型训练方法训练得到的。由于通过前文所述的模型训练方法训练得到的目标文本模型可提取出搜索词的信息和与搜索词相关的商品信息,通过执行步骤302得到的目标文本特征既携带目标搜索词的信息又携带与目标搜索词相关的商品信息。
303、获取待搜索数据库。
本申请实施例中,待搜索数据库包括待搜索数据,待搜索数据可以是任意类型的数据,例如,待搜索数据可以是文档,待搜索数据也可以是图像,待搜索数据还可以是视频,待搜索数据还可以是音频。
304、利用上述目标文本特征对上述待搜索数据库进行搜索,确定具有与上述目标文本特征匹配的特征的待搜索数据,作为上述目标搜索词的搜索结果。
本申请实施例中,待搜索数据的特征即为待搜索数据的特征表达,目标文本特征与待搜索数据的特征匹配,说明目标搜索词与待搜索数据匹配。
在步骤301至步骤304中,搜索装置在获取目标搜索词和目标文本模型后,利用目标文本模型对目标搜索词进行特征提取,得到目标文本特征,可使目标文本特征所携带的目标搜索词的信息和与目标搜索词相关的商品信息更准确。这样在获取待搜索数据库后,利用目标文本特征对待搜索数据库中的待搜索数据进行搜索,可从待搜索数据库中搜索得到与所携带的商品信息与目标文本特征中的商品信息匹配的搜索结果。因此,通过利用目标文本特征对待搜索数据库进行搜索,得到目标搜索词的搜索结果,可提升该搜索结果与目标搜索词在商品信息上的匹配度。例如,目标搜索词为洗发水,可从待搜索数据库中搜索得到与洗发水相关的搜索结果。
作为一种可选的实施方式,搜索装置在执行步骤304的过程中执行以下步骤:
6001、利用上述目标多模态模型对上述待搜索数据进行特征提取,得到待搜索特征。
本申请实施例中,目标多模态模型是根据模型训练方法训练得到的。由于通过前文所述的模型训练方法训练得到的目标多模态模型可提取出搜索结果中的商品信息,通过执行步骤6001得到的待搜索特征,有利于丰富待搜索特征所携带待搜索数据中的商品信息。
6002、确定上述目标文本特征与上述待搜索特征的相似度。
6003、在上述相似度大于或等于阈值的情况下,确定上述待搜索特征所对应的待搜索数据为上述目标搜索词的搜索结果。
目标文本特征与待搜索特征的相似度大于或等于阈值,说明目标文本特征与待搜索特征匹配,即目标搜索词与待搜索数据匹配。因此,搜索装置可确定待搜索特征所对应的待搜索数据为目标搜索词的搜索结果。
在该种实施方式中,搜索装置在获取目标多模态模型后,利用目标多模态模型对待搜索数据进行特征提取得到待搜索特征,可丰富待搜索特征所携带待搜索数据中的商品信息。这样,再在目标文本特征与待搜索特征的相似度大于或等于阈值的情况下,确定目标搜索词与待搜索数据匹配,并确定待搜索特征所对应的待搜索数据为目标搜索词的搜索结果,可提升该搜索结果与目标搜索词在商品信息上的匹配度。
在一个可能实现的场景中,随着用户原创内容(user generated content,UGC)社区的快速发展,UGC社区的应用也越来越广,在用户通过UGC社区搜索商品时,可基于本申请实施例提供的搜索方法确定与用户输入的目标搜索词在商业信息匹配的搜索结果,并将该搜索结果推送给用户,从而提升用户的搜索体验。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参阅图4,图4为本申请实施例提供的一种模型训练装置的结构示意图,该模型训练装置1包括:获取单元11、提取单元12、确定单元13、更新单元14,具体的:
获取单元11,用于获取训练数据,所述训练数据包括训练搜索词、所述训练搜索词的至少一个训练搜索结果和所述至少一个训练搜索结果的至少一个商品属性,所述训练数据的标签包括所述训练搜索词与所述至少一个训练搜索结果的至少一个真实匹配度;
提取单元12,用于利用待训练文本模型对所述训练搜索词和所述至少一个商品属性进行特征提取,得到训练文本特征;
确定单元13,用于基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,所述预测匹配度与所述训练搜索结果一一对应;
所述确定单元13,用于基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失;
更新单元14,用于基于所述总损失更新所述待训练文本模型的参数,得到目标文本模型。
结合本申请任一实施方式,所述确定单元13,用于:
获取待训练多模态模型;
利用所述待训练多模态模型对所述至少一个训练搜索结果进行特征提取,得到至少一个搜索结果特征;
基于所述训练文本特征与所述至少一个搜索结果特征,确定所述至少一个预测匹配度。
结合本申请任一实施方式,所述更新单元14,还用于基于所述总损失更新所述待训练多模态模型,得到目标多模态模型。
结合本申请任一实施方式,在训练搜索结果的数量大于1的情况下,所述至少一个训练搜索结果包括与所述训练搜索词匹配的至少两个同类搜索结果;
所述确定单元13,用于:
从所述至少一个真实匹配度中确定与所述至少两个同类搜索结果对应的至少两个参考匹配度;
确定所述至少两个参考匹配度的参考分布;
从所述至少一个预测匹配度中确定与所述至少两个同类搜索结果对应的至少两个同类匹配度;
确定所述至少两个同类匹配度的目标分布;
基于所述参考分布与所述目标分布的差异,确定所述总损失,所述总损失与所述差异呈正相关。
结合本申请任一实施方式,所述确定单元13,用于:
按照从大到小的顺序对所述至少两个参考匹配度进行排序,得到所述参考分布;
所述确定单元13,用于:
按照从大到小的顺序对所述至少两个同类匹配度进行排序,得到所述目标分布。
结合本申请任一实施方式,所述确定单元13,用于:
基于所述参考分布与所述目标分布的差异,确定第一损失,所述第一损失与所述差异呈正相关;
基于所述至少两个同类匹配度,确定第二损失,所述第二损失与所述至少两个同类匹配度呈负相关;
基于所述第一损失和所述第二损失,确定所述总损失,所述第一损失、所述第二损失均与所述总损失呈正相关。
结合本申请任一实施方式,所述至少一个训练搜索结果包括与所述训练搜索词不匹配的至少一个异类搜索结果;
所述确定单元13,还用于:
从所述至少一个预测匹配度中确定与所述至少一个异类搜索结果对应的至少一个异类匹配度;
基于所述至少两个同类匹配度和所述至少一个异类匹配度,确定第二损失,所述第二损失与所述至少一个异类匹配度呈正相关。
结合本申请任一实施方式,所述至少两个同类搜索结果包括目标搜索结果中被选中次数最多的k个,所述目标搜索结果为以所述训练搜索词为依据搜索得到的搜索结果。
结合本申请任一实施方式,所述至少一个商品属性包括以下至少一个:品牌、品类、系列词。
结合本申请任一实施方式,所述训练搜索结果为文档。
本申请实施例中,训练数据包括训练搜索词、训练搜索词的至少一个训练搜索结果和至少一个搜索结果的至少一个商品属性。由于至少一个训练搜索结果均为训练搜索的搜索结果,至少一个商品属性均为至少一个训练搜索结果的商品属性,因此,至少一个商品属性可作为与训练搜索词相关的商品信息。于是,在模型训练装置利用训练数据训练待训练文本模型的过程中,利用待训练文本模型对训练搜索结果和至少一个商品属性进行特征提取,得到训练文本特征,可使训练文本特征既携带训练搜索词的语义信息,又携带与训练搜索词相关的商品信息。这样,再基于训练文本特征与至少一个训练搜索结果,确定训练搜索词与至少一个训练搜索结果的至少一个预测匹配度,可利用训练文本特征中的训练搜索词的特征信息和至少一个商品属性的特征信息,确定至少一个预测匹配度,也就是说,至少一个预测匹配度的准确度可反应待训练文本模型从训练搜索词中提取到的训练文本特征所携带的信息的准确度。因此在确定至少一个预测匹配度后,基于预测匹配度和真实匹配度确定总损失,并在确定总损失后基于总损失更新待训练文本模型的参数,可使待训练文本模型具备从搜索词中提取搜索词的语义信息和与搜索词相关的商品信息的能力。
请参阅图5,图5为本申请实施例提供的一种搜索装置的结构示意图,该搜索装置2包括:获取单元21、提取单元22、确定单元23,具体的:
获取单元21,用于获取目标搜索词;
提取单元22,用于利用所述目标文本模型对所述目标搜索词进行特征提取,得到目标文本特征,所述目标文本模型是根据模型训练方法训练得到的;
所述获取单元21,用于获取待搜索数据库,所述待搜索数据库包括待搜索数据;
确定单元23,用于利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果。
结合本申请任一实施方式,所述确定单元23,用于:
利用目标多模态模型对所述待搜索数据进行特征提取,得到待搜索特征,所述目标文本模型是根据模型训练方法训练得到的;
确定所述目标文本特征与所述待搜索特征的相似度;
在所述相似度大于或等于阈值的情况下,确定所述待搜索特征所对应的待搜索数据为所述目标搜索词的搜索结果。
本申请实施例中,搜索装置在获取目标搜索词和目标文本模型后,利用目标文本模型对目标搜索词进行特征提取,得到目标文本特征,可使目标文本特征所携带的目标搜索词的信息和与目标搜索词相关的商品信息更准确。这样在获取待搜索数据库后,利用目标文本特征对待搜索数据库中的待搜索数据进行搜索,可从待搜索数据库中搜索得到与所携带的商品信息与目标文本特征中的商品信息匹配的搜索结果。因此,通过利用目标文本特征对待搜索数据库进行搜索,得到目标搜索词的搜索结果,可提升该搜索结果与目标搜索词在商品信息上的匹配度。例如,目标搜索词为洗发水,可从待搜索数据库中搜索得到与洗发水相关的搜索结果。
在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
图6为本申请实施例提供的一种电子设备的硬件结构示意图。该电子设备3包括处理器31,存储器32。可选的,该电子设备3还包括输入装置33,输出装置34。该处理器31、存储器32、输入装置33和输出装置34通过连接器相耦合,该连接器包括各类接口、传输线或总线等等,本申请实施例对此不作限定。应当理解,本申请的各个实施例中,耦合是指通过特定方式的相互联系,包括直接相连或者通过其他设备间接相连,例如可以通过各类接口、传输线、总线等相连。
处理器31可以包括是一个或多个处理器,例如包括一个或多个中央处理器(central processing unit,CPU),在处理器是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。可选的,处理器31可以是多个CPU构成的处理器组,多个处理器之间通过一个或多个总线彼此耦合。可选的,该处理器还可以为其他类型的处理器等等,本申请实施例不作限定。
存储器32可用于存储计算机程序指令,以及用于执行本申请方案的程序代码在内的各类计算机程序代码。可选地,存储器包括但不限于是随机存储记忆体(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasableprogrammable read only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置33用于输入数据和/或信号,以及输出装置34用于输出数据和/或信号。输入装置33和输出装置34可以是独立的器件,也可以是一个整体的器件。
可理解,本申请实施例中,存储器32不仅可用于存储相关指令,还可用于存储相关数据,本申请实施例对于该存储器中具体所存储的数据不作限定。
可以理解的是,图6仅仅示出了一种电子设备的简化设计。在实际应用中,电子设备还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、存储器等,而所有可以实现本申请实施例的电子设备都在本申请的保护范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员还可以清楚地了解到,本申请各个实施例描述各有侧重,为描述的方便和简洁,相同或类似的部分在不同实施例中可能没有赘述,因此,在某一实施例未描述或未详细描述的部分可以参见其他实施例的记载。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digitalversatiledisc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。

Claims (16)

1.一种模型训练方法,其特征在于,所述方法包括:
获取训练数据,所述训练数据包括训练搜索词、所述训练搜索词的至少一个训练搜索结果和所述至少一个训练搜索结果的至少一个商品属性,所述训练数据的标签包括所述训练搜索词与所述至少一个训练搜索结果的至少一个真实匹配度;
利用待训练文本模型对所述训练搜索词和所述至少一个商品属性进行特征提取,得到训练文本特征;
基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,所述预测匹配度与所述训练搜索结果一一对应;
基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失;
基于所述总损失更新所述待训练文本模型的参数,得到目标文本模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,包括:
获取待训练多模态模型;
利用所述待训练多模态模型对所述至少一个训练搜索结果进行特征提取,得到至少一个搜索结果特征;
基于所述训练文本特征与所述至少一个搜索结果特征,确定所述至少一个预测匹配度。
3.根据权利要求2所述的方法,其特征在于,在基于所述至少一个预测匹配度和所述训练数据的标签确定总损失之后,所述方法还包括:
基于所述总损失更新所述待训练多模态模型,得到目标多模态模型。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,在训练搜索结果的数量大于1的情况下,所述至少一个训练搜索结果包括与所述训练搜索词匹配的至少两个同类搜索结果;
所述基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失,包括:
从所述至少一个真实匹配度中确定与所述至少两个同类搜索结果对应的至少两个参考匹配度;
确定所述至少两个参考匹配度的参考分布;
从所述至少一个预测匹配度中确定与所述至少两个同类搜索结果对应的至少两个同类匹配度;
确定所述至少两个同类匹配度的目标分布;
基于所述参考分布与所述目标分布的差异,确定所述总损失,所述总损失与所述差异呈正相关。
5.根据权利要求4所述的方法,其特征在于,所述确定所述至少两个参考匹配度的参考分布,包括:
按照从大到小的顺序对所述至少两个参考匹配度进行排序,得到所述参考分布;
所述确定所述至少两个同类匹配度的目标分布,包括:
按照从大到小的顺序对所述至少两个同类匹配度进行排序,得到所述目标分布。
6.根据权利要求4所述的方法,其特征在于,所述基于所述参考分布与所述目标分布的差异,确定所述总损失,包括:
基于所述参考分布与所述目标分布的差异,确定第一损失,所述第一损失与所述差异呈正相关;
基于所述至少两个同类匹配度,确定第二损失,所述第二损失与所述至少两个同类匹配度呈负相关;
基于所述第一损失和所述第二损失,确定所述总损失,所述第一损失、所述第二损失均与所述总损失呈正相关。
7.根据权利要求6所述的方法,其特征在于,所述至少一个训练搜索结果包括与所述训练搜索词不匹配的至少一个异类搜索结果;
在所述基于所述至少两个同类匹配度,确定第二损失之前,所述方法还包括:
从所述至少一个预测匹配度中确定与所述至少一个异类搜索结果对应的至少一个异类匹配度;
所述基于所述至少两个同类匹配度,确定第二损失,包括:
基于所述至少两个同类匹配度和所述至少一个异类匹配度,确定第二损失,所述第二损失与所述至少一个异类匹配度呈正相关。
8.根据权利要求4所述的方法,其特征在于,所述至少两个同类搜索结果包括目标搜索结果中被选中次数最多的k个,所述目标搜索结果为以所述训练搜索词为依据搜索得到的搜索结果。
9.根据权利要求1至3中任意一项所述的方法,其特征在于,所述至少一个商品属性包括以下至少一个:品牌、品类、系列词。
10.根据权利要求1至3中任意一项所述的方法,其特征在于,所述训练搜索结果为文档。
11.一种搜索方法,其特征在于,所述方法包括:
获取目标搜索词;
利用目标文本模型对所述目标搜索词进行特征提取,得到目标文本特征,所述目标文本模型是根据权利要求1至10中任意一项所述的方法训练得到的;
获取待搜索数据库,所述待搜索数据库包括待搜索数据;
利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果。
12.根据权利要求11所述的方法,其特征在于,所述利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果,包括:
利用目标多模态模型对所述待搜索数据进行特征提取,得到待搜索特征,所述目标多模态模型是根据权利要求3所述的方法训练得到的;
确定所述目标文本特征与所述待搜索特征的相似度;
在所述相似度大于或等于阈值的情况下,确定所述待搜索特征所对应的待搜索数据为所述目标搜索词的搜索结果。
13.一种模型训练装置,其特征在于,所述模型训练装置包括:
获取单元,用于获取训练数据,所述训练数据包括训练搜索词、所述训练搜索词的至少一个训练搜索结果和所述至少一个训练搜索结果的至少一个商品属性,所述训练数据的标签包括所述训练搜索词与所述至少一个训练搜索结果的至少一个真实匹配度;
提取单元,用于利用待训练文本模型对所述训练搜索词和所述至少一个商品属性进行特征提取,得到训练文本特征;
确定单元,用于基于所述训练文本特征与所述至少一个训练搜索结果,确定所述训练搜索词与所述至少一个训练搜索结果的至少一个预测匹配度,所述预测匹配度与所述训练搜索结果一一对应;
所述确定单元,用于基于所述至少一个预测匹配度和所述至少一个真实匹配度,确定总损失;
更新单元,用于基于所述总损失更新所述待训练文本模型的参数,得到目标文本模型。
14.一种搜索装置,其特征在于,所述搜索装置包括:
获取单元,用于获取目标搜索词;
提取单元,用于利用目标文本模型对所述目标搜索词进行特征提取,得到目标文本特征,所述目标文本模型是根据权利要求1至10中任意一项所述的方法训练得到的;
所述获取单元,用于获取待搜索数据库,所述待搜索数据库包括待搜索数据;
确定单元,用于利用所述目标文本特征对所述待搜索数据库进行搜索,确定具有与所述目标文本特征匹配的特征的待搜索数据,作为所述目标搜索词的搜索结果。
15.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;
在所述处理器执行所述计算机指令的情况下,所述电子设备执行如权利要求1至10中任意一项所述的方法;
在所述处理器执行所述计算机指令的情况下,所述电子设备或者执行如权利要求12或13所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令;
在所述程序指令被处理器执行的情况下,使所述处理器执行权利要求1至10中任意一项所述的方法;
在所述程序指令被处理器执行的情况下,或者使所述处理器执行权利要求12或13所述的方法。
CN202311247539.2A 2023-09-25 2023-09-25 模型训练方法、搜索方法及相关产品 Pending CN117725165A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311247539.2A CN117725165A (zh) 2023-09-25 2023-09-25 模型训练方法、搜索方法及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311247539.2A CN117725165A (zh) 2023-09-25 2023-09-25 模型训练方法、搜索方法及相关产品

Publications (1)

Publication Number Publication Date
CN117725165A true CN117725165A (zh) 2024-03-19

Family

ID=90198586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311247539.2A Pending CN117725165A (zh) 2023-09-25 2023-09-25 模型训练方法、搜索方法及相关产品

Country Status (1)

Country Link
CN (1) CN117725165A (zh)

Similar Documents

Publication Publication Date Title
CN112164391B (zh) 语句处理方法、装置、电子设备及存储介质
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN109086303B (zh) 基于机器阅读理解的智能对话方法、装置、终端
US20180336193A1 (en) Artificial Intelligence Based Method and Apparatus for Generating Article
CN110019732B (zh) 一种智能问答方法以及相关装置
US20110106805A1 (en) Method and system for searching multilingual documents
CN112559684A (zh) 一种关键词提取及信息检索方法
CN113806588B (zh) 搜索视频的方法和装置
CN111459977A (zh) 自然语言查询的转换
CN112287069A (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN112818091A (zh) 基于关键词提取的对象查询方法、装置、介质与设备
CN112836057B (zh) 知识图谱的生成方法、装置、终端以及存储介质
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
CN110674388A (zh) 推送项目的配图方法、装置、存储介质和终端设备
CN113761124A (zh) 文本编码模型的训练方法、信息检索方法及设备
CN113139558A (zh) 确定物品的多级分类标签的方法和装置
CN116662495A (zh) 问答处理方法、训练问答处理模型的方法及装置
CN116775980B (zh) 一种跨模态搜索方法及相关设备
CN114443864A (zh) 跨模态数据的匹配方法、装置及计算机程序产品
CN117725165A (zh) 模型训练方法、搜索方法及相关产品
CN117235137B (zh) 一种基于向量数据库的职业信息查询方法及装置
CN113793191B (zh) 商品的匹配方法、装置及电子设备
CN118051653B (zh) 基于语义关联的多模态数据检索方法、***和介质
CN113505889B (zh) 图谱化知识库的处理方法、装置、计算机设备和存储介质
CN117743505A (zh) 查询词改写模型的训练方法、查询方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination