CN117056721A - 模型参数的调整方法、装置、模型预测方法、设备及介质 - Google Patents

模型参数的调整方法、装置、模型预测方法、设备及介质 Download PDF

Info

Publication number
CN117056721A
CN117056721A CN202310947000.1A CN202310947000A CN117056721A CN 117056721 A CN117056721 A CN 117056721A CN 202310947000 A CN202310947000 A CN 202310947000A CN 117056721 A CN117056721 A CN 117056721A
Authority
CN
China
Prior art keywords
model
prediction
preset
vector
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310947000.1A
Other languages
English (en)
Inventor
温晓康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202310947000.1A priority Critical patent/CN117056721A/zh
Publication of CN117056721A publication Critical patent/CN117056721A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能和金融科技技术领域,提供了一种模型参数的调整方法、装置、模型预测方法、计算机设备及存储介质,所述方法包括:获取待分类数据;将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。本发明能够提高模型的性能,节省调整模型参数的时间和工作。

Description

模型参数的调整方法、装置、模型预测方法、设备及介质
技术领域
本发明涉及人工智能和金融科技技术领域,尤其揭露了一种模型参数的调整方法、装置、模型预测方法、计算机设备及存储介质。
背景技术
在人工智能下的预测场景中,是需要同时考虑多个预测模型的预测结果,以达到更准确的分类目的,如在金融科技技术领域中,需要基于用户的信息或者数据在显示页面中推荐符合用户的金融产品,金融产品可包括理财产品和保险产品;然而,不同的预测模型可能具有不同的表现,传统的模型融合方法往往采用固定的权重参数或者人工设置的权重参数来对多个预测模型进行融合,难以准确捕捉每个预测模型的重要性和优势,进而降低了预测模型融合的效果;另外,传统的模型融合方法往往需要经过多次的手动调整和实验才能得到最佳的权重参数组合,该过程较为繁琐和耗时,且由于不同的预测模型在不同的数据集上表现不同,人工设置的权重参数组合往往难以适应不同的任务和数据,也影响了预测模型的性能;
因此,本领域技术人员亟需寻找一种新的技术方案来解决上述的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种模型参数的调整方法、装置、模型预测方法、计算机设备及存储介质,能够提高模型性能,节省调整模型参数的时间和工作。
一种模型参数的调整方法,所述方法包括:
获取待分类数据;
将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;
提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;
对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。
一种模型参数的调整装置,所述装置包括:
第一获取模块,用于获取待分类数据;
第二获取模块,用于将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;
第三获取模块,用于提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;
第四获取模块,用于对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。
一种模型预测方法,所述方法包括:
获取待预测数据;
将所述待预测数据输入至调整完模型参数的预设预测模型中,得到待预测数据属于至少一个类别的目标概率。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种模型参数的调整方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种模型参数的调整方法。
上述模型参数的调整方法、装置、模型预测方法、计算机设备及存储介质,在人工智能模型下的预测模型,自适应调整权重可使得各个分类器的预测能力更好地结合起来,从而提高了整个分类器的性能;权重向量可根据数据集和任务进行自适应地学习,因此具有更强的自适应性和泛化能力,且对于不同的数据集和任务,可以得到不同的权重向量,从而更好地适应不同的应用场景,提高了模型的自适应性,节省人工调整参数的时间;使用了特征提取和分类器技术,可更好地理解每个分类器的预测结果和其对应的权重向量,从而提高了模型的可解释性,有助于更好地调试和优化模型中的模型参数。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中一种模型参数的调整方法的一应用环境示意图;
图2是本发明一实施例中一种模型参数的调整方法的一流程示意图;
图3是本发明一实施例中一种模型预测方法的一流程示意图;
图4是本发明一实施例中一种模型参数的调整装置的结构示意图;
图5是本发明一实施例中一种模型预测装置的结构示意图;
图6是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种模型参数的调整方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一实施例中,如图2所示,提供一种模型参数的调整方法,以该方法应用在图1服务器为例进行说明,包括如下步骤S10-S40:
S10,获取待分类数据;
可理解地,待分类数据是指需要确定类别的数据,其在金融科技技术领域中,其可以为待确定出用户是否会偏好某种理财产品或保险产品的数据。
S20,将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;
可理解地,预设预测模型中的结构包括基础分类器,其可以包括但不限于随机森林RandomForest、XGBoost和LightGBM决策树算法模型;具体地,使用多个基础分类器对待分类数据进行预测,得到多个基础分类器的预测结果,其中,若设C_1,C_2,...,C_k表示k个不同的基础分类器,x表示待分类数据,则y_i=C_i(x)表示第i个基础分类器对x的预测结果。
S30,提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;
可理解地,预设预测模型中的结构包括学习器(元学习器),其可以包括但不限于神经网络和其他机器学习模型;特征向量可以包括但不限于模型预测结果的置信度和预测类别的概率分布等,其中,设f_i(y_i)表示对y_i进行特征提取后得到的特征向量;权重向量是通过模型自适应学习后的参数,w=(w_1,w_2,...,w_k),其中w_i表示第i个分类器对应的权重向量;
具体地,以决策树算法模型作为基础分类器为例,在训练完成后的算法模型中,获取到预测结果中每个特征的重要性程度(即每个特征的***次数),将每个特征对应的重要性程度向量作为该基础分类器的特征向量;通过预先学习每个分类器的预测结果和对应的权重向量,再将特征向量输入至所述预设预测模型中的学习器,即可得到自适应调整后的权重向量。
S40,对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。
可理解地,加权处理就是乘于权重系数的意思,其处理的目的是对权重向量进一步地优化,提高预测模型的性能;调整结果是加权处理后的结果,也即处理后的结果是基于待分类数据进行调整后的模型参数,设Y=w_1*y_1+w_2*y_2+...+w_k*y_k,表示模型融合的最终的调整结果。
更进一步地,以金融科技场景中的线上推荐金融产品具体举例说明,***平台获取当前的用户信息,将用户信息输入至预设预测模型中,识别出当前用户的偏好数据所属的类别(如更偏好A类别的产品),生成金融产品的推荐列表,其中,所述预设预测模型可基于用户的历史游览记录、用户的点击记录和用户的设置记录等偏好数据训练得到。
在步骤S10至步骤S40的实施例中,在人工智能模型下的预测模型,自适应调整权重可使得各个分类器的预测能力更好地结合起来,从而提高了整个分类器的性能;权重向量可根据数据集和任务进行自适应地学习,因此具有更强的自适应性和泛化能力,且对于不同的数据集和任务,可以得到不同的权重向量,从而更好地适应不同的应用场景,提高了模型的自适应性,节省人工调整参数的时间;使用了特征提取和分类器技术,可更好地理解每个分类器的预测结果和其对应的权重向量,从而提高了模型的可解释性,有助于更好地调试和优化模型中的模型参数。
进一步地,所述将所述待分类数据输入至预设预测模型中的至少一个分类器之前,还包括:
通过对多个样本特征数据采样第一数值的特征,并基于所述特征进行训练,得到所述第一数值的分类器;
或,通过预设初始模型对同一批的样本特征数据进行训练,调整所述预设初始模型中第二数值的变量,得到所述第二数值的分类器。
具体地,分类器可通过三种方式训练得到,包括:1、对M个样本特征数据中的特征随机采样第一数值N(N<M)个特征,假设执行x次上述操作,可以基于采样后的特征训练x个不同的分类器;2、对全量训练数据(样本特征数据)条数采样n条特征,假设执行y次该操作,可以基于采样后的特征训练y个不同基分类器;3、对于同一批的样本特征数据,调整分类器对应的模型参数,模型参数可包括但不限于学习率、正则化参数和损失函数,假设调整了z个(第二数值)变量(模型参数),可以基于变量得到z个基分类器;其中,每个分类器都可以对待分类数据进行预测后得到预测结果,假设累计有x+y+z个基分类器,则相当于有x+y+z个预测结果。
进一步地,所述提取所述预测结果中的特征向量,包括:
获取所述预测结果中每个特征的重要性程度;
按照每个特征的所述重要性程度形成重要性程度向量,并以所述重要性程度向量作为所述特征向量。
可理解地,重要性程度是基于预测结果中的每个特征的***次数,其中,在训练完成后的模型识别出每个特征的***次数越多,代表重要性程度越高,此时形成的重要性程度向量的重要性程度越高(也即向量数值越高)。
进一步地,所述将所述特征向量输入至预设预测模型,获取所述预设预测模型输出的权重向量,包括:
将多个所述特征向量输入至预设预测模型后,将所述特征向量拼接成一个目标向量;
通过所述预设预测模型中的预设损失函数和所述目标向量确定所述权重向量,得到所述预设预测模型输出的权重向量;其中,所述权重向量为w=gθ(f),gθ表示所述预设预测模型对应的函数,θ表示所述预设预测模型的模型参数,f表示所述目标向量,所述预设损失函数为 y表示最终预测的类别,P表示预测为属于该类的概率,公式中的N表示总共有N个特征向量,i表示第i个特征向量。
可理解地,拼接成的一个目标向量可表示为f=(f_1,f_2,...,f_k),用一个函数gθ表示学习器,其中,θ是元学习器的参数;权重向量可表示为w=(w_1,w_2,...,w_k),其中w_i表示第i个分类器的权重向量;
具体地,将多个特征向量拼接成一个目标向量;在预设预测模型中(如二分类模型),存在预设预测模型对应的函数以及对应的参数,即可通过预设预测模型中的预设损失函数和目标向量之间的乘积得到一个权重向量,其中,在拟合上述的损失函数后,在所述预设损失函数的输出值为最小化时(通过损失函数输出值与预设最小值之间对比来确定最小化,最小化为logloss),基于所述预设损失函数反推函数输出值最小化时与目标向量所对应的权重向量。
进一步地,所述方法,还包括:
将多个所述预测结果对应的第一初始权重向量划分成验证集和训练集;一个所述预测结果对应一个所述第一初始权重向量;
使用所述验证集依次验证所述训练集中的第一初始权重向量,得到验证成功的多个第二初始权重向量;
按照预设均值公式计算多个所述第二初始权重向量的均值,得到所述权重向量;所述预设均值公式为n表示第二初始权重向量的数量,I表示第I个第二初始权重向量,YI表示真实类别对应的概率,yI表示模型预测的对应的概率。
具体地,采用k折交叉进行验证,将第一初始权重向量组成的数据集分成k个子集,每个子集轮流作为验证集,其余子集作为训练集,最终计算k次交叉验证后的平均误差来评估模型性能,如假设子集K=10,也即把第一初始权重向量分成10份,其中,9份数据用于模型训练,剩下1份数据用于验证,每次验证一组前面训练得到的第二初始权重向量,即可得到10组第二初始权重向量,最后对这10组第二初始权重向量取平均均值,即可得到最终的权重向量;
本实施例是对每个分类器的预测结果和对应的权重向量进行交叉验证方法,以确定最佳的权重参数组合(各个权重参数组合成的数据集)和模型性能。
进一步地,所述对所述预测结果和权重向量进行加权处理,包括:
使用线性加权的方式对所述预测结果和权重向量进行加权处理;
或,使用非线性加权的方式对所述预测结果和权重向量进行加权处理;
或,使用预设融合模型对所述预测结果和权重向量进行加权处理。
可理解地,线性加权的方式和非线性加权的方式可以对预测结果和权重向量进行加权处理,具体是使用对每两个预测结果和权重向量之间的乘积进行相加后得到一个新的权重向量;预设融合模型是一种预先训练过的数据结构,基于分类(针对概率)的任务,对多个学***均处理,平均法可包括算术平均法、几何平均法和加权平均法,其中,平均法的好处在于平滑结果,从而减少过拟合。
综上所述,上述提供了一种模型参数的调整方法,在人工智能模型下的预测模型,自适应调整权重可使得各个分类器的预测能力更好地结合起来,从而提高了整个分类器的性能;权重向量可根据数据集和任务进行自适应地学习,因此具有更强的自适应性和泛化能力,且对于不同的数据集和任务,可以得到不同的权重向量,从而更好地适应不同的应用场景,提高了模型的自适应性,节省人工调整参数的时间;使用了特征提取和分类器技术,可更好地理解每个分类器的预测结果和其对应的权重向量,从而提高了模型的可解释性,有助于更好地调试和优化模型中的模型参数;相比于单一分类器或简单的模型融合方法,通过本方法训练出的预设预测模型可更有效地解决分类问题。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,如图3所示,提供一种模型预测方法,以该方法应用在图1服务器为例进行说明,包括如下步骤S50-S60:
S50,获取待预测数据;
S60,将所述待预测数据输入至调整完模型参数的预设预测模型中,得到待预测数据属于至少一个类别的目标概率。
可理解地,本实施例是对调整完模型参数的预设预测模型的运用方式,通过此模型可以适应调整模型参数,进而提高模型的分类能力,对不同数据都具有高适应性。
在一实施例中,本发明还提供一种模型参数的调整装置,该一种模型参数的调整装置与上述实施例中一种模型参数的调整方法一一对应。如图4所示,该一种模型参数的调整装置包括第一获取模块11、第二获取模块12、第三获取模块13和第四获取模块14。各功能模块详细说明如下:
第一获取模块11,用于获取待分类数据;
第二获取模块12,用于将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;
第三获取模块13,用于提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;
第四获取模块14,用于对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。
进一步地,所述模型参数的调整装置,还包括:
第一训练模块,用于通过对多个样本特征数据采样第一数值的特征,并基于所述特征进行训练,得到所述第一数值的分类器;
或,第二训练模块,用于通过预设初始模型对同一批的样本特征数据进行训练,调整所述预设初始模型中第二数值的变量,得到所述第二数值的分类器。
进一步地,所述第三获取模块,包括:
获取子模块,用于获取所述预测结果中每个特征的重要性程度;
形成子模块,用于按照每个特征的所述重要性程度形成重要性程度向量,并以所述重要性程度向量作为所述特征向量。
进一步地,所述第三获取模块,包括:
拼接子模块,用于将多个所述特征向量输入至预设预测模型后,将所述特征向量拼接成一个目标向量;
确定子模块,用于通过所述预设预测模型中的预设损失函数和所述目标向量确定所述权重向量,得到所述预设预测模型输出的权重向量;其中,所述权重向量为w=gθ(f),gθ表示所述预设预测模型对应的函数,θ表示所述预设预测模型的模型参数,f表示所述目标向量,所述预设损失函数为y表示最终预测的类别,P表示预测为属于该类的概率,公式中的N表示总共有N个特征向量,i表示第i个特征向量。
进一步地,所述模型参数的调整装置,还包括:
划分模块,用于将多个所述预测结果对应的第一初始权重向量划分成验证集和训练集;一个所述预测结果对应一个所述第一初始权重向量;
验证模块,用于使用所述验证集依次验证所述训练集中的第一初始权重向量,得到验证成功的多个第二初始权重向量;
计算模块,用于按照预设均值公式计算多个所述第二初始权重向量的均值,得到所述权重向量;所述预设均值公式为n表示第二初始权重向量的数量,I表示第I个第二初始权重向量,YI表示真实类别对应的概率,yI表示模型预测的对应的概率。
进一步地,所述第四获取模块,包括:
第一加权处理模块,用于使用线性加权的方式对所述预测结果和权重向量进行加权处理;
或,第二加权处理模块,用于使用非线性加权的方式对所述预测结果和权重向量进行加权处理;
或,第三加权处理模块,用于使用预设融合模型对所述预测结果和权重向量进行加权处理。
关于一种模型参数的调整装置的具体限定可以参见上文中对于一种模型参数的调整方法的限定,在此不再赘述。
上述一种模型参数的调整装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,本发明还提供一种模型预测装置,该一种模型预测装置与上述实施例中一种模型预测方法一一对应。如图5所示,该一种模型预测装置包括第四获取模块15和输入模块16。各功能模块详细说明如下:
第四获取模块15,用于获取待预测数据;
输入模块16,用于将所述待预测数据输入至调整完模型参数的预设预测模型中,得到待预测数据属于至少一个类别的目标概率。
上述一种模型参数的调整装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储一种模型参数的调整方法或一种模型预测方法中涉及到的数据。该计算机设备的接口用于与外部的终端进行连接通信。该计算机程序被处理器执行时以实现一种模型参数的调整方法,或一种模型预测方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中一种模型参数的调整方法的步骤,例如图2所示的步骤S10至步骤S40,或处理器执行计算机程序时实现上述实施例中一种模型预测方法的步骤,例如图3所示的步骤S50至步骤S60。或者,处理器执行计算机程序时实现上述实施例中一种模型参数的调整装置的各模块/单元的功能,例如图4所示模块11至模块14的功能,或者,处理器执行计算机程序时实现上述实施例中一种模型预测装置的各模块/单元的功能,例如图5所示模块15至模块16的功能。为避免重复,这里不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中一种模型参数的调整方法的步骤,例如图2所示的步骤S10至步骤S40,或处理器执行计算机程序时实现上述实施例中一种模型预测方法的步骤,例如图3所示的步骤S50至步骤S60。或者,计算机程序被处理器执行时实现上述实施例中一种模型参数的调整装置的各模块/单元的功能,例如图4所示模块11至模块14的功能,或者,计算机程序被处理器执行时实现上述实施例中一种模型预测装置的各模块/单元的功能,例如图5所示模块15至模块16的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种模型参数的调整方法,其特征在于,所述方法包括:
获取待分类数据;
将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;
提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;
对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。
2.根据权利要求1所述的模型参数的调整方法,其特征在于,所述将所述待分类数据输入至预设预测模型中的至少一个分类器之前,还包括:
通过对多个样本特征数据采样第一数值的特征,并基于所述特征进行训练,得到所述第一数值的分类器;
或,通过预设初始模型对同一批的样本特征数据进行训练,调整所述预设初始模型中第二数值的变量,得到所述第二数值的分类器。
3.根据权利要求1所述的模型参数的调整方法,其特征在于,所述提取所述预测结果中的特征向量,包括:
获取所述预测结果中每个特征的重要性程度;
按照每个特征的所述重要性程度形成重要性程度向量,并以所述重要性程度向量作为所述特征向量。
4.根据权利要求1所述的模型参数的调整方法,其特征在于,所述将所述特征向量输入至预设预测模型,获取所述预设预测模型输出的权重向量,包括:
将多个所述特征向量输入至预设预测模型后,将所述特征向量拼接成一个目标向量;
通过所述预设预测模型中的预设损失函数和所述目标向量确定所述权重向量,得到所述预设预测模型输出的权重向量;其中,所述权重向量为w=gθ(f),gθ表示所述预设预测模型对应的函数,θ表示所述预设预测模型的模型参数,f表示所述目标向量,所述预设损失函数为 y表示最终预测的类别,P表示预测为属于该类的概率,公式中的N表示总共有N个特征向量,i表示第i个特征向量。
5.根据权利要求1所述的模型参数的调整方法,其特征在于,所述方法,还包括:
将多个所述预测结果对应的第一初始权重向量划分成验证集和训练集;一个所述预测结果对应一个所述第一初始权重向量;
使用所述验证集依次验证所述训练集中的第一初始权重向量,得到验证成功的多个第二初始权重向量;
按照预设均值公式计算多个所述第二初始权重向量的均值,得到所述权重向量;所述预设均值公式为n表示第二初始权重向量的数量,I表示第I个第二初始权重向量,YI表示真实类别对应的概率,yI表示模型预测的对应的概率。
6.根据权利要求1所述的模型参数的调整方法,其特征在于,所述对所述预测结果和权重向量进行加权处理,包括:
使用线性加权的方式对所述预测结果和权重向量进行加权处理;
或,使用非线性加权的方式对所述预测结果和权重向量进行加权处理;
或,使用预设融合模型对所述预测结果和权重向量进行加权处理。
7.一种模型预测方法,其特征在于,所述方法包括:
获取待预测数据;
将所述待预测数据输入至调整完模型参数的预设预测模型中,得到待预测数据属于至少一个类别的目标概率;所述预设预测模型通过如权利要求1至6中任一项所述一种模型参数的调整方法调整所述模型参数。
8.一种模型参数的调整装置,其特征在于,包括:
第一获取模块,用于获取待分类数据;
第二获取模块,用于将所述待分类数据输入至预设预测模型中的至少一个分类器,获取所述分类器输出的预测结果;
第三获取模块,用于提取所述预测结果中的特征向量,并将所述特征向量输入至所述预设预测模型中的学习器,获取所述预设预测模型输出的权重向量;
第四获取模块,用于对所述预测结果和权重向量进行加权处理,获取所述预设预测模型中基于所述待分类数据的模型参数的调整结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述一种模型参数的调整方法,或如权利要求7的一种模型预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述一种模型参数的调整方法,或如权利要求7的一种模型预测方法。
CN202310947000.1A 2023-07-28 2023-07-28 模型参数的调整方法、装置、模型预测方法、设备及介质 Pending CN117056721A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310947000.1A CN117056721A (zh) 2023-07-28 2023-07-28 模型参数的调整方法、装置、模型预测方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310947000.1A CN117056721A (zh) 2023-07-28 2023-07-28 模型参数的调整方法、装置、模型预测方法、设备及介质

Publications (1)

Publication Number Publication Date
CN117056721A true CN117056721A (zh) 2023-11-14

Family

ID=88663669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310947000.1A Pending CN117056721A (zh) 2023-07-28 2023-07-28 模型参数的调整方法、装置、模型预测方法、设备及介质

Country Status (1)

Country Link
CN (1) CN117056721A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118070133A (zh) * 2024-04-24 2024-05-24 深圳市布宜诺实业有限公司 一种移动电源性能自动化测试方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118070133A (zh) * 2024-04-24 2024-05-24 深圳市布宜诺实业有限公司 一种移动电源性能自动化测试方法及***

Similar Documents

Publication Publication Date Title
US11335124B2 (en) Face recognition method and apparatus, classification model training method and apparatus, storage medium and computer device
US11585918B2 (en) Generative adversarial network-based target identification
WO2022042123A1 (zh) 图像识别模型生成方法、装置、计算机设备和存储介质
CN109523014B (zh) 基于生成式对抗网络模型的新闻评论自动生成方法及***
CN112926654B (zh) 预标注模型训练、证件预标注方法、装置、设备及介质
CN113610232A (zh) 网络模型量化方法、装置、计算机设备以及存储介质
CN117056721A (zh) 模型参数的调整方法、装置、模型预测方法、设备及介质
CN112132278A (zh) 模型压缩方法、装置、计算机设备及存储介质
CN111783935B (zh) 卷积神经网络构建方法、装置、设备及介质
CN114332500A (zh) 图像处理模型训练方法、装置、计算机设备和存储介质
CN114861671A (zh) 模型训练方法、装置、计算机设备及存储介质
CN113240090B (zh) 图像处理模型生成方法、图像处理方法、装置及电子设备
CN113283388A (zh) 活体人脸检测模型的训练方法、装置、设备及存储介质
CN116758379A (zh) 一种图像处理方法、装置、设备及存储介质
CN110889316B (zh) 一种目标对象识别方法、装置及存储介质
CN115374278A (zh) 文本处理模型蒸馏方法、装置、计算机设备及介质
CN113360744B (zh) 媒体内容的推荐方法、装置、计算机设备和存储介质
CN114238798A (zh) 基于神经网络的搜索排序方法、***、设备及存储介质
CN113918696A (zh) 基于k均值聚类算法的问答匹配方法、装置、设备及介质
CN117056802A (zh) 模型参数的调整方法、模型分类方法、装置、设备及介质
CN113011555B (zh) 一种数据处理方法、装置、设备及存储介质
CN113963423B (zh) 基于神经网络的微表情识别方法、***、设备及存储介质
CN112396069B (zh) 基于联合学习的语义边缘检测方法、装置、***及介质
CN110457700B (zh) 短文本描述方法和装置
CN112347893B (zh) 用于视频行为识别的模型训练方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination