CN111241850B - 提供业务模型的方法及装置 - Google Patents

提供业务模型的方法及装置 Download PDF

Info

Publication number
CN111241850B
CN111241850B CN202010329629.6A CN202010329629A CN111241850B CN 111241850 B CN111241850 B CN 111241850B CN 202010329629 A CN202010329629 A CN 202010329629A CN 111241850 B CN111241850 B CN 111241850B
Authority
CN
China
Prior art keywords
model
candidate
semantic vector
target
models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010329629.6A
Other languages
English (en)
Other versions
CN111241850A (zh
Inventor
王力
周俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010329629.6A priority Critical patent/CN111241850B/zh
Publication of CN111241850A publication Critical patent/CN111241850A/zh
Application granted granted Critical
Publication of CN111241850B publication Critical patent/CN111241850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种提供业务模型的方法,通过本说明书实施例提供的方法和装置,在服务端预先存储大量候选模型,并存储对各候选模型的训练数据进行编码得到的候选语义向量,在客户端需要业务模型时,可以上传由自有业务数据确定的当前语义向量,并将当前语义向量和候选语义向量进行匹配,以根据匹配结果选择目标模型。这种方式可以较好地保护客户端的数据隐私,并且产生较少的通信量。特别地,服务端选择的目标模型有多个,将多个目标模型进行融合后,将融合结果提供给客户端,可以有效保护服务端的模型数据隐私。总之,本说明书描述的提供业务模型的方法,可以提升业务模型应用的有效性。

Description

提供业务模型的方法及装置
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及基于隐私保护,通过服务端向客户端提供业务模型的方法和装置。
背景技术
随着计算机技术的发展,机器学习的应用越来越广泛。人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能充分基于机器学习,为人类生活带来极大便利。然而,在一些科技发展相对落后的地区,在人工智能应用中,可能存在以下情况:(1)数据量稀少,建立一个深层次的模型的可行性较差;(2)缺乏训练机器学习模型必需的计算资源;(3)人工专业技能不够,例如仅仅有些初学者,或只有很少的专业知识的从业者;等等。
为了解决这些问题,帮助这样的地区推广人工智能,可以由服务端向其提供机器学习模型。例如可以通过以下的方式向其提供机器学习模型:服务端从相应客户端接收相关训练数据,训练出合适的机器学习模型,反馈给客户端;客户端上传待处理的业务数据,服务端向客户端反馈处理结果。然而,这样的操作方式客户端和服务端的通信数据量较大,并且不利于保护双方的数据隐私。
发明内容
本说明书一个或多个实施例描述了一种提供业务模型的方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供了一种提供业务模型的方法,适用于服务端,所述方法包括:接收客户端发送的用于描述待处理业务数据的当前语义向量,所述当前语义向量基于第一编码方式对所述待处理业务数据的处理确定;将所述当前语义向量与各个候选语义向量进行匹配,单个候选语义向量基于第二编码方式对相应的单个训练数据集的处理确定,所述单个训练数据集用于训练至少一个候选模型;基于匹配结果从各个候选模型中选择出若干目标模型,并根据对所述若干目标模型的融合生成第一业务模型;将所述第一业务模型提供给客户端,以供客户端根据所述第一业务模型对所述待处理业务数据进行相关业务处理。
在一个实施例中,所述当前语义向量与单个候选语义向量具有相同的维数。
在一个实施例中,所述将所述当前语义向量与各个候选语义向量进行匹配包括:针对单个候选语义向量,确定所述当前语义向量与所述单个候选语义向量的向量相似度;根据所述向量相似度确定所述当前语义向量与所述单个候选语义向量的匹配结果。
在一个实施例中,单个候选语义向量通过以下方式确定:针对所述单个候选语义向量对应的单个训练数据集中的各条训练数据,分别基于所述第二编码方式确定相应的各个单数据语义向量;根据各个单数据语义向量的平均向量,确定所述单个候选语义向量。
在一个实施例中,各个候选模型包括第一候选模型,所述第一候选模型对应的第一候选语义向量与所述当前语义向量的匹配结果包括,所述第一候选语义向量与所述当前语义向量的第一匹配度,所述第一候选模型还对应第一模型指标;所述基于匹配结果从各个候选模型中选择出若干目标模型包括:根据所述第一匹配度与所述第一模型指标,确定所述第一候选模型的第一目标分数;根据所述第一目标分数,确定所述第一候选模型是否为目标模型。
在一个进一步的实施例中,所述第一模型指标包括以下中的至少一项:准确度、召回率、F1分数;所述第一目标分数与所述第一匹配度、所述第一模型指标均为正相关。
在一个实施例中,所述根据对所述若干目标模型的融合生成第一业务模型包括:在所述若干目标模型仅最后一个隐层或者输出层的节点对应一致的情况下,基于所述若干目标模型组合后,添加对各自最后一个隐层或者输出层按照给定的权重进行加权平均的融合层,生成第一业务模型;在所述若干目标模型的模型结构完全一致的情况下,根据对各个模型参数在所述若干目标模型中的平均,生成第一业务模型。
根据第二方面,还提供一种提供业务模型的装置,设于服务端,所述装置包括:获取单元,配置为接收客户端发送的用于描述待处理业务数据的当前语义向量,所述当前语义向量基于第一编码方式对所述待处理业务数据的处理确定;
匹配单元,配置为将所述当前语义向量与各个候选语义向量进行匹配,单个候选语义向量基于第二编码方式对相应的单个训练数据集的处理确定,所述单个训练数据集用于训练至少一个候选模型;
确定单元,配置为基于匹配结果从各个候选模型中选择出若干目标模型,并根据对所述若干目标模型的融合生成第一业务模型;
提供单元,配置为将所述第一业务模型提供给客户端,以供客户端根据所述第一业务模型对所述待处理业务数据进行相关业务处理。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,在服务端预先存储大量候选模型,并存储对各候选模型的训练数据进行编码得到的候选语义向量,在客户端需要业务模型时,可以上传由自有业务数据确定的当前语义向量,并将当前语义向量和候选语义向量进行匹配,以根据匹配结果选择目标模型。这种方式可以较好地保护客户端的数据隐私,并且产生较少的通信量。特别地,服务端选择的目标模型有多个,将多个目标模型进行融合后,将融合结果提供给客户端,可以有效保护服务端的模型数据隐私。总之,本说明书描述的提供业务模型的方法,可以基于数据隐私,以及利用较少的通信量,可以节约通信及计算资源,提升业务模型应用的有效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书的提供业务模型的实施架构示意图;
图2示出本说明书提供业务模型的一个具体应用场景示意;
图3示出根据一个实施例的提供业务模型的方法流程图;
图4a、图4b、图4c分别示出本说明书实施例中根据各个目标模型生成第一业务模型的各种具体情形示意图;
图5示出根据一个实施例的提供业务模型的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
首先,结合图1示出一个具体实施场景进行说明。如图1所示,在该实施场景中,包括设于服务端的计算平台和多个客户端。其中,计算平台可以预先存储有多个候选模型。候选模型可以通过图1中的计算平台训练,也可以由其他计算平台训练好后,存储于图1示出的本说明书实施架构中的计算平台,本说明书对此不作限定。可以理解的是,图1示出的客户端是相对于本说明书的服务端而言的,具体实践中,客户端的用户可以是应用服务商、业务平台商户等等。客户端可以通过具有一定通信能力的各种计算机、智能手机、平板电脑等实现。
其中,服务端可以预先收集大量训练数据,并根据各种业务场景对训练数据进行划分。可以理解的是,一个业务场景可以对应多批训练数据,例如某种商品的订单转化率模型,可以针对不同的地区(如一线城市、二线城市、三四线及以下城市等)分别选择一批训练数据。一批训练数据可以训练出至少一个候选模型,例如通过逻辑回归、决策树、深层神经网络各自训练一个候选模型。不同业务场景下,训练数据可以相互独立,也可以交叉使用,例如一条商品转化率数据,可以用于商品转化率的业务场景,也可以应用于用户购买行为分析的业务场景,本说明书对此不做限定。
在本说明书实施架构下,对于单批训练数据,可以确定一个语义向量来描述这些训练数据。这里的语义向量可以通过各种编码方式来实现,例如DNN、GBDT等。编码的作用是将原始数据进行处理,得到一定维数的语义向量,来描述原始数据。通过对原数据经过编码处理,可以具有一定的隐私数据保护作用。可选地,可以通过现有的编码器对训练数据进行编码。图1中的计算平台可以预先存储这些各批训练数据分别对应的各个语义向量,作为候选语义向量。
如图2所示,假设服务端的计算平台设于为云端,在客户端需要业务模型时,可以通过通信链路对自身数据(例如少量训练数据)经过编码处理,并将处理得到的当前语义向量发送至云端,由云端的计算平台根据预先存储的各个候选语义向量与当前语义向量之间的匹配关系,选择相应的若干候选模型作为目标模型。之后,计算平台为了保护服务端的数据隐私,可以将选择到的若干候选模型进行融合得到一个业务模型,提供给客户端。
本说明书的技术构思下,可以由服务端构建一个专家模型中枢,以提供大量预先训练好的候选模型,远程客户端可以从服务端获取所需要的业务模型进行使用,如此,可以大大提升他们的模型训练效率,将通过丰富训练数据训练的业务模型用于其本地各种应用程序中。同时,客户端和服务端的训练数据隐私得到保护,从而解决背景技术中提到的问题。
值得说明的是,本说明书所涉及的训练数据或业务数据,可以是字符、图片、音频、视频、动画等至少一个类型的数据。图1中示出的客户端和计算平台的数量仅为示例性的,实践中,客户端可以是合理的任意数量。
下面详细描述本说明书技术构思下的提供业务模型的方法。
图3示出了根据本说明书一个实施例的提供业务模型的流程示意图。该流程的执行主体可以是任一具有一定计算能力的计算机、设备或服务器等,例如图1使出的计算平台。如图3所示,提供业务模型的流程包括:步骤301,接收客户端发送的用于描述待处理业务数据的当前语义向量,当前语义向量基于第一编码方式对待处理业务数据的处理确定;步骤302,将当前语义向量与各个候选语义向量进行匹配,单个候选语义向量基于第二编码方式对单个训练数据集的处理确定,单个训练数据集用于训练至少一个候选模型;步骤303,基于匹配结果从各个候选模型中选择出若干目标模型,并基于对若干目标模型的融合生成第一业务模型;步骤304,将第一业务模型提供给客户端,以供客户端根据第一业务模型对待处理业务数据进行相关业务处理。
首先,通过步骤301,接收客户端发送的用于描述待处理业务数据的当前语义向量。其中,这里的待处理业务数据可以是少量的样本数据,也可以是待处理的业务数据,在此不做限定。待处理业务数据可以根据具体业务场景确定。例如转化率场景下,可以包括用户浏览轨迹、点击偏好、近期浏览记录等等,用户金融违约风险场景下,可以包括年龄、性别、收入、历史违约记录等等。值得说明的是,在待处理业务数据是样本数据的情况下,其可以不包括标签数据。这是因为,服务端在判断客户端所需的业务模型的情况下,可以仅根据待处理业务数据本身与候选模型处理的训练数据的接近程度而确定。
所谓编码,可以理解为将输入序列转化成一个固定长度的向量,编码的过程可以用来解析输入的字符序列中的语言含义。对于客户端来说,输入序列例如可以是从待处理业务数据中提取的特征向量。其中,客户端的特征向量可以根据服务端给定的业务特征顺序进行提取。例如,针对某个商品的10维特征向量的第一维表示商品类别,第二维表示适用年龄,等等。
在可选的实施例中,编码过程可以改变向量的维度,例如,将10维特征向量处理得到20维向量,将100维向量处理成30维向量。客户端可以根据服务端的指示确定当前语义向量的维度。
用于获取语义向量的编码方式有多种,例如DNN编码器、GBDT编码器等。在待处理业务数据有多条的情况下,可以对各条待处理业务数据分别进行编码得到相应的各条语义向量,之后对各条语义向量进行融合(求平均),从而得到当前语义向量。经过大量实验发现,对多条业务数据的语义向量融合过程中,现有的不同编码方式得到的编码结果之间的差异可以忽略不计。因此,在本说明书中,服务端和客户端分别可以采用这些编码方式任意之一来对业务数据进行编码。为了保护数据隐私,客户端可以选择任一种编码方式(在本说明书中称为第一编码方式),根据服务端指示的向量维度、隐层数量等参数,对待处理业务数据进行编码处理,从而得到当前语义向量。
接着,在步骤302,将当前语义向量与各个候选语义向量进行匹配。可以理解,服务端预先存储有候选语义向量。对于服务端来说,用于训练至少一个候选模型的一批训练数据,可以构成一个训练数据集,一个训练数据集可以用于训练至少一个候选模型,并确定一个候选语义向量。
其中,单个候选语义向量可以基于第二编码方式对单个训练数据集的处理确定。这里,与第一编码方式类似地,第二编码方式也可以是各种可行的编码方式,在此不做限定。第一编码方式和第二编码方式可以是同一种编码方式,也可以是不同的编码方式。单个训练数据集对应的候选语义向量,可以是通过第一编码方式多各条训练数据进行编码分别得到的各个语义向量的平均向量。
各个候选语义向量可以为预定维数,例如30维。通常,服务端根据候选语义向量的编码网络层数、编码前的特征提取方式、以及编码后得到的语义向量维数等,指示客户端进行相似的语义编码。因此,客户端发送的当前语义向量与候选语义向量具有相同维数。可选地,服务端和客户端都可以利用现有的编码方式进行语义编码,利用不同编码方式得到的编码结果之间的差异可以忽略。
当前语义向量和各个候选语义向量的匹配可以通过诸如余弦相似度、欧氏距离之类的方式进行。以余弦相似度为例,假设当前语义向量a和第一候选语义向量b都是n维的向量,向量a与向量b的余弦相似度可以为,向量a和向量b中相应元素的乘积之和,与向量a的模和向量b的模的乘积的比值,如:
Figure 804348DEST_PATH_IMAGE001
其中,
Figure 659172DEST_PATH_IMAGE002
分别为向量a和向量b的第i维度的元素值。在余弦相似度的匹配方式 下,匹配结果在0-1之间取值。余弦相似度越靠近1,当前语义向量和候选语义向量越相似, 反之,余弦相似度越靠近0,当前语义向量和候选语义向量越接近垂直(相似性越低)。
按照选定的匹配方式,可以确定当前语义向量与各个候选语义向量分别对应的匹配结果。
接着,在步骤303,基于匹配结果从各个候选模型中选择出若干目标模型,并基于对所述若干目标模型的融合生成第一业务模型。可以理解,当前语义向量与候选语义向量的匹配结果,可以描述出客户端的待处理业务数据与相应训练数据之间的相似程度。
在模型指标相同的情况下,待处理业务数据与某批训练数据越相似,通过与该批训练数据训练得到的候选模型处理待处理业务数据,可以得到越好的处理效果。模型指标可以理解为针对具体业务的用于评价模型性能的指标。例如:对于考虑准确性能的候选模型,可以将准确度作为模型指标,相应地准确度越高模型效果被认为越好;对于考虑召回性能的候选模型,可以将召回率作为模型指标,相应地召回率越高模型效果被认为越好。在一些业务场景中,例如目标识别的二分类业务场景,高准确度意味着降低召回率,高召回率意味着降低准确度,此时,还可以将F1分数即准确度与召回率的加权平均值作为模型指标,相应地F1分数越高模型效果被认为越好。
在本步骤303中,可以基于待处理业务数据与各个候选语义向量的匹配结果来选择候选模型。其中这里的匹配结果例如可以通过步骤302中的向量相似度来描述,相应语义向量之间的相似度越大,匹配度越高。
根据一个实施方式,可以从与当前语义向量的匹配度最高的候选语义向量对应的候选模型中选择目标模型。在一个实施例中,可以从与当前语义向量的匹配度最高的候选语义向量对应的候选模型中随机选择若干目标模型。在另一个实施例中,可以从与当前语义向量的匹配度最高的候选语义向量对应的候选模型中选择模型指标满足预定条件(如大于预定阈值),或模型指标最好(按照由大到小的顺序选择)等的若干目标模型。
根据另一个实施方式,可以按照与当前语义向量的匹配度(例如与前述的相似度正相关),以及模型指标得到目标分数来选择目标模型。这里的目标分数可以与匹配度及模型指标分别正相关。例如,将匹配度和模型指标的加权平均值,或者匹配度和模型指标的乘积等作为目标分数,从候选模型中选择目标模型。此时,可以按照预定的分数阈值或者目标分数由大到小的顺序选择若干目标模型。
在其他实施方式中,还可以通过其他合理的方式选择目标模型,在此不再一一列举。
对于选择出的目标模型,如果数量为一个,则可以将这一个目标模型作为第一业务模型,如果数量为多个,则可以将这些目标模型融合,从而生成第一业务模型。通常,为了保护服务端模型训练数据及候选模型的隐私,可以选择多个目标模型,进行融合生成第一业务模型。
可以理解,用于处理相似训练数据的候选模型,通常具有相似或相同的模型结构。两两模型具有相似的模型结构,可以表示两两模型至少在最后一个隐层或输出层的结构一致。例如在分类模型中,得到具体分类类别之前的、表示在若干分类类别上的各个分类概率(不必按顺序对应)的层结构一致。通常,得到具体分类类别之前的层通常是最后一个隐层或输出层。再例如,在打分模型中,打分结果与分类到某一个类别的概率结果类似。相同的模型结构,例如是具有相同的隐层数量,以及各个隐层上相同数量的模型参数。
在一个实施例中,各个目标模型具有前述的相似的模型结构,此时,可以对各个目标模型组合后,对它们最后一个隐层或输出层进行加权融合,得到第一业务模型。各个目标模型加权的权重可以与模型指标正相关,也可以随机生成。可选地,为了控制目标模型的模型参数数值范围,各个权重可以是归一化的权重(即权重和为1)。如图4a和4b所示,这种情况下,相当于将各个目标模型组合在一起,并在最后一个隐层(或输出层)以加权权重为模型参数增加一个融合层。当单个目标模型的输出层是分类到具体某个类别的概率,或打分结果时,可以将各个目标模型的输出层的概率或者打分分值进行加权平均,如图4a所示,各个目标模型组合后增加虚线示出的融合层。当单个目标模型最后一个隐层或输出层得到分类到各个类别的概率,或者在多个类别上的打分时,可以将各个类别上的概率值或打分相应进行加权平均,如图4b所示,各个目标模型组合后增加虚线示出的融合层。
在另一个实施例中,各个目标模型具有相同结构,此时,可以将各个目标模型的对应参数加权平均或加和平均,得到第一业务模型。在加权平均的情况下,加权权重例如可以与模型指标正相关。这种情况下,各个目标模型被合并,也就是说,第一业务模型的模型参数总量相对于各个目标模型的模型参数总量而言,是一致的。如图4c所示,与图4a和图4b不同的是,图4c是对各个目标模型的对应模型参数的完全融合,而不是图4a和图4b示出的在各个目标模型的最后一个隐层或输出层之后添加融合层。
在其他实施例中,还可以有其他合理的对目标模型的融合方式,在此不再赘述。
然后,通过步骤304,将第一业务模型提供给客户端。根据步骤301至303可知,通过与客户端基于待处理业务数据上传的当前语义向量较匹配的候选语义向量选择目标模型,并基于目标模型的融合生成第一业务模型,因此,第一业务模型是服务端确定的较适合客户端的业务模型。服务端可以将该第一业务模型作为任务处理结果反馈给相应客户端。
客户端可以根据第一业务模型对进行相关业务处理。例如,将待处理业务数据输入第一业务模型,根据第一业务模型的输出结果确定相关业务结果,例如分类类别、打分结果、目标识别结果等等。可以理解,在待处理业务数据是样本数据的情况下,客户端还可以根据待处理业务数据对第一业务模型进行微调,从而使得第一业务模型更加适应其业务需求。
在可能的设计中,服务端还可以对本地存储的候选模型进行更新,以更好地适应客户端需求。例如,根据一个实施例,对于在预定时间段内(如2年),被选择为目标模型的频次小于预定阈值(如1次)的候选模型,则可以删除该候选模型,或者根据更多训练数据对其更新后重新作为候选模型。
在以上过程中,本说明书实施例提供的提供业务模型的方法,通过在服务端预先存储大量候选模型,并存储对各候选模型的训练数据进行编码得到的候选语义向量,在客户端需要业务模型时,可以上传由自身样本数据或待处理业务数据确定的当前语义向量,并将当前语义向量和候选语义向量进行匹配,以根据匹配结果选择目标模型。这种方式可以较好地保护客户端的数据隐私,并且产生较少的通信量。特别地,服务端选择的目标模型有多个,将多个目标模型进行融合后,将融合结果提供给客户端,可以有效保护服务端的模型数据隐私。总之,本说明书描述的提供业务模型的方法,可以基于数据隐私,以及利用较少的通信量,可以节约通信及计算资源,提升业务模型应用的有效性。
根据另一方面的实施例,还提供一种提供业务模型的装置。其中,这里的业务数据可以是文字、图像、语音、视频、动画等各种类型的数据。该装置可以设于服务端。图5示出根据一个实施例的提供业务模型的装置的示意性框图。如图5所示,装置500包括:获取单元51,配置为接收客户端发送的用于描述待处理业务数据的当前语义向量,当前语义向量基于第一编码方式对待处理业务数据的处理确定;匹配单元52,配置为将当前语义向量与各个候选语义向量进行匹配,单个候选语义向量基于第二编码方式对相应的单个训练数据集的处理确定,单个训练数据集用于训练至少一个候选模型;确定单元53,配置为基于匹配结果从各个候选模型中选择出若干目标模型,并根据对若干目标模型的融合生成第一业务模型;提供单元54,配置为将第一业务模型提供给客户端,以供客户端根据第一业务模型对待处理业务数据进行相关业务处理。
其中,可以理解的是,在一些实施例中,装置500还可以包括存储单元,用于存储各个候选语义向量及各个候选模型,在此不再赘述。
根据一个实施方式,匹配单元52进一步可以配置为:
针对单个候选语义向量,确定当前语义向量与单个候选语义向量的向量相似度;
根据向量相似度确定当前语义向量与单个候选语义向量的匹配结果。
在一个可选的实现方式中,各个候选模型包括第一候选模型,第一候选模型对应的第一候选语义向量与当前语义向量的匹配结果包括,第一候选语义向量与当前语义向量的第一匹配度,第一候选模型还对应第一模型指标;确定单元53进一步可以配置为:
根据第一匹配度与第一模型指标,确定第一候选模型的第一目标分数;
根据第一目标分数,确定第一候选模型是否为目标模型。
其中,第一模型指标可以包括以下中的至少一项:准确度、召回率、F1分数;第一目标分数与第一匹配度、第一模型指标均为正相关。
根据一个可能的设计,确定单元53进一步配置为:
在若干目标模型仅最后一个隐层或者输出层的节点对应一致的情况下,基于若干目标模型组合后,添加对各自最后一个隐层或者输出层按照给定的权重进行加权平均的融合层,生成第一业务模型;
在若干目标模型的模型结构完全一致的情况下,根据对各个模型参数在若干目标模型中的平均,生成第一业务模型。
值得说明的是,图5所示的装置500是与图3示出的方法实施例相对应的装置实施例,图3示出的方法实施例中的相应描述同样适用于装置500,在此不再赘述。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行结合图3所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,存储器中存储有可执行代码,处理器执行可执行代码时,实现结合图3的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上的具体实施方式,对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本说明书的技术构思的具体实施方式而已,并不用于限定本说明书的技术构思的保护范围,凡在本说明书实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的技术构思的保护范围之内。

Claims (14)

1.一种提供业务模型的方法,适用于服务端,所述业务模型为机器学习模型,所述方法包括:
接收客户端发送的用于描述待处理业务数据的当前语义向量,所述当前语义向量基于第一编码方式对所述待处理业务数据的处理确定;
将所述当前语义向量与各个候选语义向量进行匹配,单个候选语义向量基于第二编码方式对相应的单个训练数据集的处理确定,所述单个训练数据集用于训练至少一个候选模型;
基于匹配结果从各个候选模型中选择出若干目标模型,并根据对所述若干目标模型的融合生成第一业务模型;
将所述第一业务模型提供给客户端,以供客户端根据所述第一业务模型对所述待处理业务数据进行相关业务处理。
2.根据权利要求1所述的方法,其中,所述当前语义向量与单个候选语义向量具有相同的维数。
3.根据权利要求1所述的方法,其中,所述将所述当前语义向量与各个候选语义向量进行匹配包括:
针对单个候选语义向量,确定所述当前语义向量与所述单个候选语义向量的向量相似度;
根据所述向量相似度确定所述当前语义向量与所述单个候选语义向量的匹配结果。
4.根据权利要求1所述的方法,其中,单个候选语义向量通过以下方式确定:
针对所述单个候选语义向量对应的单个训练数据集中的各条训练数据,分别基于所述第二编码方式确定相应的各个单数据语义向量;
根据各个单数据语义向量的平均向量,确定所述单个候选语义向量。
5.根据权利要求1所述的方法,其中,各个候选模型包括第一候选模型,所述第一候选模型对应的第一候选语义向量与所述当前语义向量的匹配结果包括,所述第一候选语义向量与所述当前语义向量的第一匹配度,所述第一候选模型还对应第一模型指标;所述基于匹配结果从各个候选模型中选择出若干目标模型包括:
根据所述第一匹配度与所述第一模型指标,确定所述第一候选模型的第一目标分数;
根据所述第一目标分数,确定所述第一候选模型是否为目标模型。
6.根据权利要求5所述的方法,其中,所述第一模型指标包括以下中的至少一项:准确度、召回率、F1分数;所述第一目标分数与所述第一匹配度、所述第一模型指标均为正相关。
7.根据权利要求1所述的方法,其中,所述根据对所述若干目标模型的融合生成第一业务模型包括:
在所述若干目标模型仅最后一个隐层或者输出层的节点对应一致的情况下,基于所述若干目标模型组合后,添加对各自最后一个隐层或者输出层按照给定的权重进行加权平均的融合层,生成第一业务模型;
在所述若干目标模型的模型结构完全一致的情况下,根据对各个模型参数在所述若干目标模型中的平均,生成第一业务模型。
8.一种提供业务模型的装置,设于服务端,所述业务模型为机器学习模型,所述装置包括:
获取单元,配置为接收客户端发送的用于描述待处理业务数据的当前语义向量,所述当前语义向量基于第一编码方式对所述待处理业务数据的处理确定;
匹配单元,配置为将所述当前语义向量与各个候选语义向量进行匹配,单个候选语义向量基于第二编码方式对相应的单个训练数据集的处理确定,所述单个训练数据集用于训练至少一个候选模型;
确定单元,配置为基于匹配结果从各个候选模型中选择出若干目标模型,并根据对所述若干目标模型的融合生成第一业务模型;
提供单元,配置为将所述第一业务模型提供给客户端,以供客户端根据所述第一业务模型对所述待处理业务数据进行相关业务处理。
9.根据权利要求8所述的装置,其中,所述匹配单元进一步配置为:
针对单个候选语义向量,确定所述当前语义向量与所述单个候选语义向量的向量相似度;
根据所述向量相似度确定所述当前语义向量与所述单个候选语义向量的匹配结果。
10.根据权利要求8所述的装置,其中,各个候选模型包括第一候选模型,所述第一候选模型对应的第一候选语义向量与所述当前语义向量的匹配结果包括,所述第一候选语义向量与所述当前语义向量的第一匹配度,所述第一候选模型还对应第一模型指标;所述确定单元进一步配置为:
根据所述第一匹配度与所述第一模型指标,确定所述第一候选模型的第一目标分数;
根据所述第一目标分数,确定所述第一候选模型是否为目标模型。
11.根据权利要求10所述的装置,其中,所述第一模型指标包括以下中的至少一项:准确度、召回率、F1分数;所述第一目标分数与所述第一匹配度、所述第一模型指标均为正相关。
12.根据权利要求8所述的装置,其中,所述确定单元进一步配置为:
在所述若干目标模型仅最后一个隐层或者输出层的节点对应一致的情况下,基于所述若干目标模型组合后,添加对各自最后一个隐层或者输出层按照给定的权重进行加权平均的融合层,生成第一业务模型;
在所述若干目标模型的模型结构完全一致的情况下,根据对各个模型参数在所述若干目标模型中的平均,生成第一业务模型。
13.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项的所述的方法。
14.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。
CN202010329629.6A 2020-04-24 2020-04-24 提供业务模型的方法及装置 Active CN111241850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010329629.6A CN111241850B (zh) 2020-04-24 2020-04-24 提供业务模型的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010329629.6A CN111241850B (zh) 2020-04-24 2020-04-24 提供业务模型的方法及装置

Publications (2)

Publication Number Publication Date
CN111241850A CN111241850A (zh) 2020-06-05
CN111241850B true CN111241850B (zh) 2020-07-17

Family

ID=70866270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010329629.6A Active CN111241850B (zh) 2020-04-24 2020-04-24 提供业务模型的方法及装置

Country Status (1)

Country Link
CN (1) CN111241850B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112700008B (zh) * 2021-01-06 2022-06-28 青岛弯弓信息技术有限公司 一种云组态平台的模型匹配处理方法及***
CN113190587A (zh) * 2021-04-20 2021-07-30 北京异乡旅行网络科技有限公司 实现业务数据处理的数据处理方法和装置
CN113268499A (zh) * 2021-06-03 2021-08-17 京东方科技集团股份有限公司 数据采集方法、装置、数据采集***及服务器
CN116862012A (zh) * 2022-03-28 2023-10-10 华为技术有限公司 机器学习模型训练方法、业务数据处理方法、装置及***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10664662B2 (en) * 2018-04-18 2020-05-26 Microsoft Technology Licensing, Llc Multi-scale model for semantic matching
CN109598285A (zh) * 2018-10-24 2019-04-09 阿里巴巴集团控股有限公司 一种模型的处理方法、装置及设备
CN110287332B (zh) * 2019-06-06 2021-10-08 中国人民解放军国防科技大学 云环境下仿真模型选择方法与装置
CN110287421A (zh) * 2019-06-28 2019-09-27 北京金山安全软件有限公司 一种信息内容推荐方法、装置及电子设备

Also Published As

Publication number Publication date
CN111241850A (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN111241850B (zh) 提供业务模型的方法及装置
CN110598206B (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN109344884B (zh) 媒体信息分类方法、训练图片分类模型的方法及装置
KR102234850B1 (ko) 릴레이션 네트워크에 기반한 지식 보완 방법 및 장치
EP3885966B1 (en) Method and device for generating natural language description information
CN109471978B (zh) 一种电子资源推荐方法及装置
CN113011884B (zh) 账户特征的提取方法、装置、设备及可读存储介质
CN109710842B (zh) 业务信息的推送方法、装置及可读存储介质
US20230237093A1 (en) Video recommender system by knowledge based multi-modal graph neural networks
CN116978011B (zh) 一种用于智能目标识别的图像语义通信方法及***
CN115587535A (zh) 模型构建优化方法、设备、存储介质及程序产品
CN112258250A (zh) 基于网络热点的目标用户识别方法、装置和计算机设备
CN117725220A (zh) 文档表征和文档检索的方法、服务器及存储介质
CN114119123A (zh) 信息推送的方法和装置
CN111460113A (zh) 一种数据交互方法及相关设备
CN111382232A (zh) 问答信息处理方法、装置及计算机设备
CN116401522A (zh) 一种金融服务动态化推荐方法和装置
US11734573B2 (en) Image element matching via graph processing
CN115129930A (zh) 一种视频的信息处理方法、装置、计算机设备和存储介质
CN110866195B (zh) 文本描述的生成方法、装置、电子设备及存储介质
CN114996435A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
CN111552827A (zh) 标注方法和装置、行为意愿预测模型训练方法和装置
CN117688247B (zh) 推荐方法、终端设备及存储介质
CN116913278B (zh) 语音处理方法、装置、设备和存储介质
CN114093447A (zh) 数据资产推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030603

Country of ref document: HK