CN111311000B - 用户消费行为预测模型训练方法、装置、设备及存储介质 - Google Patents

用户消费行为预测模型训练方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111311000B
CN111311000B CN202010093642.6A CN202010093642A CN111311000B CN 111311000 B CN111311000 B CN 111311000B CN 202010093642 A CN202010093642 A CN 202010093642A CN 111311000 B CN111311000 B CN 111311000B
Authority
CN
China
Prior art keywords
weight vector
quantum
training
training data
inner product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010093642.6A
Other languages
English (en)
Other versions
CN111311000A (zh
Inventor
王鑫
雅斯尼侯穆迪
马哈市雷
帕特里克罗本特斯特
米珂拉市三塔
杨思逸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010093642.6A priority Critical patent/CN111311000B/zh
Publication of CN111311000A publication Critical patent/CN111311000A/zh
Application granted granted Critical
Publication of CN111311000B publication Critical patent/CN111311000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Mathematics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了用户消费行为预测模型训练方法、装置、设备及存储介质,涉及机器学习模型训练技术领域。通过从数据库获取训练数据和测试数据并映射为量子态;对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;对每一训练数据得到的权重向量的量子态,根据测试数据采用量子计算处理器进行测试得到训练后用户消费行为的预测模型。通过将量子计算应用到广义线性模型的训练过程中,提高模型训练效率,保证模型精确度,使得广义线性模型能够有效的预测用户消费行为。

Description

用户消费行为预测模型训练方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及机器学习模型训练技术领域。
背景技术
广义线性模型(Generalized linear model,GLM)是一种应用灵活的线性回归模型,它是机器学习中非常基础且应用广泛的一种方法。广义线性模型通过连接函数(linkfunction)来将实验者所量测的随机变量的数学期望值与线性组合的预测变量之间建立关系。其模型假设输出y与各个输入向量x在作用联结函数后是线性关系,即y=g(w·x),其中g为逆连接函数(inverse link function,即连接函数的逆),w·x是权重向量w与输入向量x的内积。广义线性模型学习的技术问题核心就是在已知逆连接函数g的情况下,设计一个高效的方案通过训练集中的数据去学习权重向量w,使得误差尽可能的小。
广义线性模型在数据分析和金融建模方面都有着广泛的应用,例如可应用于预测用户消费行为的场景中,可在获取用户属性特征和/或目标物品属性特征后,输入到训练后的广义线性模型,从而得到用户消费行为的预测结果。而对于上述的广义线性模型的训练,通常采用稀疏子法(Sparsitron)或GLMtron方法,其中稀疏子法是基于乘法加权算法(multiplicative weights algorithm)的一个机器学习算法,而GLMtron方法是一个利用了加法更新规则(additive update rules)的高效学习方法。
现有的稀疏子法运行速度较慢,严重影响广义线性模型的训练效率,尤其是采用广义线性模型预测用户消费行为时由于输入数据维度较高,训练速度较慢,训练过程耗时较长;而GLMtron方法采样复杂度(sample complexity)不是最优的,达到同样精确度,比稀疏子法需要更多的采样数量,即更大的训练集。
发明内容
本申请提供一种用户消费行为预测模型训练方法、装置、设备及存储介质,以提高广义线性模型的训练效率,且保证模型精确度,从而使得广义线性模型能够应用于预测用户消费行为的场景中有效的进行用户消费行为预测。
本申请第一个方面提供一种用户消费行为的预测模型的训练方法,所述预测模型为广义线性模型,所述方法包括:
从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将所述训练数据和所述测试数据映射为量子态,其中任一所述训练数据和所述测试数据包括多维度输入特征向量以及对应的用户消费行为的标注信息,所述多维度输入特征包括用户属性特征和/或目标物品属性特征;
对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;
对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。
在一种可能的设计中,所述对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态,包括:
获取预测模型的初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数;
对于任一训练数据,根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态。
在一种可能的设计中,所述根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态,包括:
根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积;
根据所述第一内积、所述逆连接函数、所述学习速率参数以及所述训练数据的标注信息更新损失函数值,并将损失函数值输入所述损失量子门,更新权重向量的量子态。
在一种可能的设计中,所述根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积,包括:
根据历史的损失函数值获取最大权重向量;
根据所述训练数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第一内积相关的中间变量;
根据所述与第一内积相关的中间变量获取所述第一内积。
在一种可能的设计中,所述对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,包括:
每一训练数据得到的权重向量的量子态,根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积;
根据所述第二内积、所述逆连接函数以及所述测试数据的标注信息得到的权重向量的量子态对应的风险值。
在一种可能的设计中,所述根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积,包括:
根据所述测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第二内积相关的中间变量;
根据所述与第二内积相关的中间变量获取所述权重向量与训练数据中多维度输入特征向量之间的内积。
在一种可能的设计中,所述根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型,包括:
将所有风险值中的最小值对应的权重向量的量子态映射为权重向量,并根据该权重向量得到训练后用户消费行为的预测模型。
本申请第二个方面提供一种用户消费行为的预测模型的训练装置,所述预测模型为广义线性模型,所述装置包括:
获取模块,用于从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将所述训练数据和所述测试数据映射为量子态,其中任一所述训练数据和所述测试数据包括多维度输入特征向量以及对应的用户消费行为的标注信息,所述多维度输入特征包括用户属性特征和/或目标物品属性特征;
训练模块,用于对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;
测试模块,用于对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。
在一种可能的设计中,所述训练模块在对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态时,用于:
获取预测模型的初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数;
对于任一训练数据,根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态。
在一种可能的设计中,所述训练模块在根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态时,用于:
根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积;
根据所述第一内积、所述逆连接函数、所述学习速率参数以及所述训练数据的标注信息更新损失函数值,并将损失函数值输入所述损失量子门,更新权重向量的量子态。
在一种可能的设计中,所述训练模块在根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积时,用于:
根据历史的损失函数值获取最大权重向量;
根据所述训练数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第一内积相关的中间变量;
根据所述与第一内积相关的中间变量获取所述第一内积。
在一种可能的设计中,所述测试模块在对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值时,用于:
每一训练数据得到的权重向量的量子态,根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积;
根据所述第二内积、所述逆连接函数以及所述测试数据的标注信息得到的权重向量的量子态对应的风险值。
在一种可能的设计中,所述测试模块在根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积时,用于:
根据所述测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第二内积相关的中间变量;
根据所述与第二内积相关的中间变量获取所述权重向量与训练数据中多维度输入特征向量之间的内积。
在一种可能的设计中,所述测试模块在根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型时,用于:
将所有风险值中的最小值对应的权重向量的量子态映射为权重向量,并根据该权重向量得到训练后用户消费行为的预测模型。
本申请第三个方面提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
本申请第四个方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面所述的方法。
本申请第五个方面提供一种计算机程序,包括程序代码,当计算机运行所述计算机程序时,所述程序代码执行如第一方面所述的方法。
上述申请中的一个实施例具有如下优点或有益效果:通过从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将训练数据和测试数据映射为量子态;对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;对于每一训练数据得到的权重向量的量子态,根据测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。
本实施例中通过将量子计算应用到广义线性模型的训练过程中,通过量子加速可有效的提高模型训练效率,并且输入向量维数越大量子加速效果越好,且能够保证模型精确度,学习误差在允许范围内,从而使得广义线性模型能够应用于预测用户消费行为的场景中有效的进行用户消费行为预测。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请一实施例提供的用户消费行为的预测模型的训练方法的通信***的示意图;
图2是本申请一实施例提供的用户消费行为的预测模型的训练方法的流程图;
图3是本申请一实施例提供的用户消费行为的预测模型的训练方法的流程图;
图4是本申请一实施例提供的用户消费行为的预测模型的训练方法的流程图;
图5是本申请一实施例提供的用户消费行为的预测模型的训练方法的流程图;
图6是本申请一实施例提供的用户消费行为的预测模型的训练装置的框图;
图7是用来实现本申请实施例的用户消费行为的预测模型的训练方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
广义线性模型的训练,通常采用稀疏子法(Sparsitron)或GLMtron方法,其中稀疏子法是基于乘法加权算法(multiplicative weights algorithm)的一个机器学习算法,而GLMtron方法是一个利用了加法更新规则(additive update rules)的高效学习方法。
其中,稀疏子法是基于乘法加权算法的一个机器学习方案。具体来说,考虑一个大小为T的训练集和一个大小为M的测试集,都是从如下真实分布进行采样得到:训练集和测试集由N维的元素在-1到1之间的特征向量以及0到1之间的标签组成。并且设置关于学习速率的参数。这个稀疏子法主要包含了两个循环,第一个循环遍历了所有训练集中训练数据,然后对每一个训练数据都生成一个预测向量。再根据这个预测向量,通过计算内积和连接函数来计算预测标签,在这个循环中会进行预测标签与真实标签偏离程度的最小化优化;第二个循环会经验主义地计算测试集的误差,用于确认每一个预测向量的质量。最后会输出在测试集上运行最好的预测向量,并根据该预测向量得到最优的广义线性模型。
而GLMtron方法是一个利用了加法更新规则的高效学习方法。但是这个方法的缺点是由于采样复杂度(sample complexity)不是最优的,训练过程中达到一定精确度所需的采样数量存在提升空间,其需要的采样数量比稀疏子法更多,也即需要更大的训练集。
对于稀疏子法,由于其运行时间依赖于参数数据维度,且精确度还有提升的空间,比如对于高维数据集运行速度会减速,会消耗比较长的时间。这个方法核心的步骤涉及了内积计算和乘积更新(multiplicative update),运行时间都是线性的。然而对于这两个步骤,是可以对其进行潜在提升的,从而可以得到更高效的方案。因此,本申请中采用一种新的广义线性模型学习方案,称为QuantumSparsitron(量子稀疏子法),通过量子随机存取存储器(Quantum Random Access Memory,QRAM)来进行训练集和测试集的录入,将经典向量
Figure BDA0002384541230000081
映射成一个量子态|v>,进而利用量子计算处理器进行广义线性模型的训练,本实施例中利用振幅放大估计方法(amplitude amplification and estimation algorithms)来高效地寻找稀疏子法中设计的权重向量中的最优值。通过量子加速可有效的提高模型训练效率,并且输入向量维数越大量子加速效果越好,且能够保证模型精确度,学习误差在允许范围内,从而使得广义线性模型能够应用于预测用户消费行为的场景中有效的进行用户消费行为预测。
本申请实施例提供的用户消费行为的预测模型的训练方法应用如图1所示的通信***,所述通信***包括服务端10和数据库11,其中数据库11可用于存储训练数据和测试数据,其中训练数据和测试数据可包括多维度输入特征以及对应的用户消费行为的标注信息,多维度输入特征包括用户属性特征和/或目标物品属性特征。而服务端10可从数据库11中获取训练数据和测试数据,并进行用户消费行为的预测模型的训练过程。
下面将结合具体实施例对本申请的用户消费行为的预测模型的训练过程进行详细说明。
本申请一实施例提供一种用户消费行为的预测模型的训练方法,图2为本发明实施例提供的用户消费行为的预测模型的训练方法流程图。所述执行主体可以为服务端,所述预测模型为广义线性模型,如图2所示,所述用户消费行为的预测模型的训练方法具体步骤如下:
S101、从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将所述训练数据和所述测试数据映射为量子态;
其中任一所述训练数据和所述测试数据包括多维度输入特征向量以及对应的用户消费行为的标注信息,所述多维度输入特征包括用户属性特征和/或目标物品属性特征。
在本实施例中,数据库中预存有用户历史消费行为数据,具体可包括用户性别、年龄、地区等属性,还可包括用户浏览目标物品的时间、次数等行为属性,还可包括目标物品的价值、销量等目标物品属性特征,以及用户最终是否购买该目标物品的消费行为(作为用户消费行为的标注信息)。本实施例中可从数据库中获取用户历史消费行为数据,并提取多维度输入特征形成多维度输入特征向量,同时提取对应的用户消费行为标注信息,其中多维度输入特征包括用户属性特征和/或目标物品属性特征,将获取到的数据一部分作为训练数据构成训练集,另一部分作为测试数据构成测试集。
进一步的,利用量子随机存取存储器(Quantum Random Access Memory,QRAM)来进行训练集和测试集的录入,其中量子随机存取存储器的作用是把一个经典的向量
Figure BDA0002384541230000091
映射成一个量子态|v>。这里,量子态(quantum state)指的是量子***的状态,态矢量可以用来抽象地表示量子态,我们用狄拉克符号来表示态矢量。在本实施例中,量子随机存取存储器允许通过量子操作将量子状态|j>|0...0>映射成
Figure BDA0002384541230000092
对于每个训练向量x(t)和任意j,这样的映射可以在每一个相位|j>上编入训练向量x(t)的第j个元素。
更具体的,在本实施例中,训练集A中各训练数据可表示为(x(t),y(t))∈[-1,1]N×{0,1},t从1到T,T为训练集A中训练数据的个数,x(t)表示第t个训练数据的多维度输入特征向量,y(t)表示第t个训练数据的用户消费行为的标注信息,N为多维度输入特征的维数;
测试集B中各测试数据表示为(a(m),b(m))∈[-1,1]N×{0,1},m从1到M,M为测试集B中测试数据的个数,a(m)表示第m个测试数据的多维度输入特征向量,b(m)表示第m个测试数据的用户消费行为的标注信息。
S102、对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态。
在本实施例中,将量子计算应用到广义线性模型的训练过程中,借助量子计算处理器来获取权重向量的量子态,通过量子加速可有效的提高模型训练效率。
具体的,如图3所示,所述对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态,包括:
S201、获取预测模型的初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数。
在本实施例中,用户消费行为的预测模型采用广义线性模型,对该预测模型进行训练前,首先获取初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数。
具体的,初始化的权重向量为
Figure BDA0002384541230000101
其中
Figure BDA0002384541230000102
为N维单位向量;
初始化损失函数值,对j=1,...,N,令初始化第j个元素的损失函数值
Figure BDA0002384541230000103
损失量子门为
Figure BDA0002384541230000104
其具有如下性质:
Figure BDA0002384541230000105
初始化损失量子门
Figure BDA0002384541230000106
预设的逆连接函数为g,学习速率参数包括β,λ。
S202、对于任一训练数据,根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态。
在本实施例中,训练过程为不断迭代过程,每次迭代训练采用训练集中的一个训练数据进行训练,最终更新损失函数值以及权重向量的量子态,例如可以按t从1至N的顺序进行迭代。
进一步的,如图4所示,S202所述的根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态,具体包括:
S2021、根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积。
在本实施例中,可首先借助量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积,使得内积获取过程得到加速。
更具体的,在第t次迭代训练中,从训练集中选择第t个训练数据。
首先,根据历史的损失函数值获取最大权重向量;
具体的,根据历史的损失函数值(从第0至t-1次迭代训练元素j的损失函数值)求解
Figure BDA0002384541230000111
其解记为L,同时令权重向量中各元素
Figure BDA0002384541230000112
从而得到最大权重向量
Figure BDA0002384541230000113
然后,根据所述训练数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第一内积相关的中间变量;
具体的,采用量子计算处理器计算与第一内积相关的中间变量如下:
利用量子计算处理器估计范数
Figure BDA0002384541230000114
利用量子计算处理器估计第一中间变量
Figure BDA0002384541230000115
利用量子计算处理器计算第二中间变量
Figure BDA0002384541230000116
最后,根据所述与第一内积相关的中间变量获取所述第一内积h(t)
Figure BDA0002384541230000117
S2022、根据所述第一内积、所述逆连接函数、所述学习速率参数以及所述训练数据的标注信息更新损失函数值,并将损失函数值输入所述损失量子门,更新权重向量的量子态。
具体的,根据上述步骤中获取到的第一内积h(t)以及逆连接函数g、学习速率参数λ、训练数据的标注信息y(t),更新当前的损失函数
Figure BDA0002384541230000118
进一步的,将更新后的损失函数值输入损失量子门
Figure BDA0002384541230000119
更新权重向量的量子态
Figure BDA00023845412300001110
S103、对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模该型。
在本实施例中,对于每次迭代训练得到的权重向量的量子态,采用测试集中的测试数据进行测试,获取对应的预测模型风险值,从所有的风险值中找到最小值,其对应的权重向量的量子态则为最优的权重向量的量子态,进而可根据权重向量的量子态得到训练后用户消费行为的预测模该型。
更具体的,本实施例中可将所有风险值中的最小值对应的权重向量的量子态映射为权重向量,并根据该权重向量得到训练后用户消费行为的预测模型。也即将最优的权重向量的量子态再映射到经典向量的形式,从而可得到训练后用户消费行为的预测模型为y=g(w·x),可用于对用户消费行为进行预测。具体的,对用户消费行为进行预测可以为,首先获取目标用户的多维度输入特征,所述多维度输入特征包括用户属性特征和/或目标物品属性特征,并将该多维度输入特征输入到训练后用户消费行为的预测模型,从而得到用户消费行为的预测结果,其预测结果的精度较高。
需要说明的是,本实施例中在获取预测模型风险值时,可以在每次迭代训练结束后针对该次迭代训练得到的权重向量的量子态进行一次风险值的计算,也可在所有迭代训练结束后再统一针对每一次迭代训练得到的权重向量的量子态分别进行模型风险值的计算。
进一步的,如图5所示,所述对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,具体包括:
S301、每一训练数据得到的权重向量的量子态,根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积。
在本实施例中,对于第t次迭代训练得到的权重向量的量子态,从测试集中依次取测试数据,例如m从1到M,逐个做如下操作:
首先,根据所述测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第二内积相关的中间变量;
具体的,利用量子处理器估计第三中间变量
Figure BDA0002384541230000121
利用量子处理器计算第四中间变量
Figure BDA0002384541230000122
然后,根据所述与第二内积相关的中间变量获取所述权重向量与训练数据中多维度输入特征向量之间的内积z(t,m)
具体的,计算
Figure BDA0002384541230000131
S302、根据所述第二内积、所述逆连接函数以及所述测试数据的标注信息得到的权重向量的量子态对应的风险值。
具体的,根据上述步骤中获取到的第二内积z(t,m)以及逆连接函数g、学习速率参数λ、测试数据的标注信息b(m),可计算风险值
Figure BDA0002384541230000132
Figure BDA0002384541230000133
在获取到每一次迭代训练得到的权重向量的量子态对应风险值η(t)后,找出所有η(t)中的最小值,相应t记为tmin,并记下相关参数
Figure BDA0002384541230000134
利用以上参数制备η(t)中的最小值对应的权重向量的量子态
Figure BDA0002384541230000135
其中
Figure BDA0002384541230000136
qmax=maxj qj
进一步的,将最小风险值对应的权重向量的量子态映射为权重向量,即可根据该权重向量得到训练后用户消费行为的预测模型。
上述实施例提供的用户消费行为的预测模型的训练方法,通过从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将训练数据和测试数据映射为量子态;对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;对于每一训练数据得到的权重向量的量子态,根据测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。本实施例中通过将量子计算应用到广义线性模型的训练过程中,通过量子加速可有效的提高模型训练效率,并且输入向量维数越大量子加速效果越好,且能够保证模型精确度,学习误差在允许范围内,从而使得广义线性模型能够应用于预测用户消费行为的场景中有效的进行用户消费行为预测。
需要说明的是,本实施例中的对于广义线性模型的训练方法可并不限于应用于用户消费行为预测的场景中,还可应用于大数据拟合检验、推断、诊断等方面,还可完成无向图的学习,而无向图模型在计算机视觉和自然语言处理等方向中都有着重要的应用场景,比如计算机视觉中的图像压缩和自然语言处理中的词性标注,因为上述实施例的广义线性模型的训练方法可以提升无向图模型的学习效率,故对于基于无向图学习的相关技术在上述领域里的应用场景都能带来效率的提升。
本申请一实施例提供一种用户消费行为的预测模型的训练装置,图6为本发明实施例提供的用户消费行为的预测模型的训练装置的结构图。其中所述预测模型为广义线性模型。如图6所示,所述用户消费行为的预测模型的训练装置400具体包括:获取模块401、训练模块402及测试模块403。
获取模块401,用于从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将所述训练数据和所述测试数据映射为量子态,其中任一所述训练数据和所述测试数据包括多维度输入特征向量以及对应的用户消费行为的标注信息,所述多维度输入特征包括用户属性特征和/或目标物品属性特征;
训练模块402,用于对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;
测试模块403,用于对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。
在一种可能的设计中,所述训练模块402在对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态时,用于:
获取预测模型的初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数;
对于任一训练数据,根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态。
在一种可能的设计中,所述训练模块402在根据所述权重向量、所述损失函数值、所述逆连接函数、所述学习速率参数以及所述损失量子门,采用量子计算处理器更新损失函数值以及权重向量的量子态时,用于:
根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积;
根据所述第一内积、所述逆连接函数、所述学习速率参数以及所述训练数据的标注信息更新损失函数值,并将损失函数值输入所述损失量子门,更新权重向量的量子态。
在一种可能的设计中,所述训练模块402在根据所述权重向量、所述损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积时,用于:
根据历史的损失函数值获取最大权重向量;
根据所述训练数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第一内积相关的中间变量;
根据所述与第一内积相关的中间变量获取所述第一内积。
在一种可能的设计中,所述测试模块403在对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值时,用于:
每一训练数据得到的权重向量的量子态,根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积;
根据所述第二内积、所述逆连接函数以及所述测试数据的标注信息得到的权重向量的量子态对应的风险值。
在一种可能的设计中,所述测试模块403在根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积时,用于:
根据所述测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第二内积相关的中间变量;
根据所述与第二内积相关的中间变量获取所述权重向量与训练数据中多维度输入特征向量之间的内积。
在一种可能的设计中,所述测试模块403在根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型时,用于:
将所有风险值中的最小值对应的权重向量的量子态映射为权重向量,并根据该权重向量得到训练后用户消费行为的预测模型。
本实施例提供的用户消费行为的预测模型的训练装置可以具体用于执行上述图所提供的用户消费行为的预测模型的训练方法实施例,具体功能此处不再提供的赘述。
本实施例提供的用户消费行为的预测模型的训练装置,通过从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将训练数据和测试数据映射为量子态;对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;对于每一训练数据得到的权重向量的量子态,根据测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。本实施例中通过将量子计算应用到广义线性模型的训练过程中,通过量子加速可有效的提高模型训练效率,并且输入向量维数越大量子加速效果越好,且能够保证模型精确度,学习误差在允许范围内,从而使得广义线性模型能够应用于预测用户消费行为的场景中有效的进行用户消费行为预测。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的用户消费行为的预测模型的训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图7中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的用户消费行为的预测模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用户消费行为的预测模型的训练方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用户消费行为的预测模型的训练方法对应的程序指令/模块(例如,附图6所示的获取模块401、训练模块402及测试模块403)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用户消费行为的预测模型的训练方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据用户消费行为的预测模型的训练方法的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至用户消费行为的预测模型的训练方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用户消费行为的预测模型的训练方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与用户消费行为的预测模型的训练方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将训练数据和测试数据映射为量子态;对于任一训练数据,采用量子计算处理器对所述预测模型进行训练,获取所述预测模型的权重向量的量子态;对于每一训练数据得到的权重向量的量子态,根据测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。本实施例中通过将量子计算应用到广义线性模型的训练过程中,通过量子加速可有效的提高模型训练效率,并且输入向量维数越大量子加速效果越好,且能够保证模型精确度,学习误差在允许范围内,从而使得广义线性模型能够应用于预测用户消费行为的场景中有效的进行用户消费行为预测。
本申请还提供了一种计算机程序,包括程序代码,当计算机运行所述计算机程序时,所述程序代码执行如上述实施例所述的用户消费行为的预测模型的训练方法。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种用户消费行为的预测模型的训练方法,其特征在于,所述预测模型为广义线性模型,所述方法包括:
从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将所述训练数据和所述测试数据映射为量子态,其中任一所述训练数据和所述测试数据包括多维度输入特征向量以及对应的用户消费行为的标注信息,所述多维度输入特征包括用户属性特征和/或目标物品属性特征;
对于任一训练数据,根据预设的逆连接函数和学习速率参数以及当前训练次数所对应的损失量子门,采用量子计算处理器更新损失函数值和权重向量的量子态,以获取所述预测模型的权重向量的量子态;
对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。
2.根据权利要求1所述的方法,其特征在于,所述在根据预设的逆连接函数和学习速率参数以及当前训练次数所对应的损失量子门,采用量子计算处理器更新损失函数值和权重向量的量子态,以获取所述预测模型的权重向量的量子态之前,还包括:
获取预测模型的初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数。
3.根据权利要求2所述的方法,其特征在于,所述根据预设的逆连接函数和学习速率参数以及当前训练次数所对应的损失量子门,采用量子计算处理器更新当前的损失函数值和权重向量的量子态,包括:
根据当前权重向量、历史的损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积;
根据所述第一内积、所述逆连接函数、所述学习速率参数以及所述训练数据的标注信息更新损失函数值,并将损失函数值输入所述当前训练次数所对应的损失量子门,更新权重向量的量子态。
4.根据权利要求3所述的方法,其特征在于,所述根据当前权重向量、历史的损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积,包括:
根据历史的损失函数值获取最大权重向量;
根据所述训练数据、所述当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第一内积相关的中间变量;
根据所述与第一内积相关的中间变量获取所述第一内积。
5.根据权利要求4所述的方法,其特征在于,所述对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,包括:
每一训练数据得到的权重向量的量子态,根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积;
根据所述第二内积、所述逆连接函数以及所述测试数据的标注信息得到的权重向量的量子态对应的风险值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积,包括:
根据所述测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第二内积相关的中间变量;
根据所述与第二内积相关的中间变量获取所述权重向量与训练数据中多维度输入特征向量之间的内积。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型,包括:
将所有风险值中的最小值对应的权重向量的量子态映射为权重向量,并根据该权重向量得到训练后用户消费行为的预测模型。
8.一种用户消费行为的预测模型的训练装置,其特征在于,所述预测模型为广义线性模型,所述装置包括:
获取模块,用于从数据库获取训练数据和测试数据,构成训练集和测试集,并通过量子随机存取存储器将所述训练数据和所述测试数据映射为量子态,其中任一所述训练数据和所述测试数据包括多维度输入特征向量以及对应的用户消费行为的标注信息,所述多维度输入特征包括用户属性特征和/或目标物品属性特征;
训练模块,用于对于任一训练数据,根据预设的逆连接函数和学习速率参数以及当前训练次数所对应的损失量子门,采用量子计算处理器更新损失函数值和权重向量的量子态,以获取所述预测模型的权重向量的量子态;
测试模块,用于对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值,根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型。
9.根据权利要求8所述的装置,其特征在于,所述训练模块在根据预设的逆连接函数和学习速率参数以及当前训练次数所对应的损失量子门,采用量子计算处理器更新当前的损失函数值和权重向量的量子态,以获取所述预测模型的权重向量的量子态之前时,还用于:
获取预测模型的初始化的权重向量、初始化的损失函数值、初始化的损失量子门、预设的逆连接函数和学习速率参数。
10.根据权利要求9所述的装置,其特征在于,所述训练模块在根据预设的逆连接函数和学习速率参数以及当前训练次数所对应的损失量子门,采用量子计算处理器更新损失函数值和权重向量的量子态时,用于:
根据当前权重向量、历史的损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积;
根据所述第一内积、所述逆连接函数、所述学习速率参数以及所述训练数据的标注信息更新损失函数值,并将损失函数值输入所述当前训练次数所对应的损失量子门,更新权重向量的量子态。
11.根据权利要求10所述的装置,其特征在于,所述训练模块在根据当前权重向量、历史的损失函数值以及所述学习速率参数,采用量子计算处理器获取权重向量与训练数据的多维度输入特征向量之间的第一内积时,用于:
根据历史的损失函数值获取最大权重向量;
根据所述训练数据、所述当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第一内积相关的中间变量;
根据所述与第一内积相关的中间变量获取所述第一内积。
12.根据权利要求11所述的装置,其特征在于,所述测试模块在对于每一训练数据得到的权重向量的量子态,根据所述测试数据采用量子计算处理器进行测试,获取每一训练数据得到的权重向量的量子态对应的风险值时,用于:
每一训练数据得到的权重向量的量子态,根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积;
根据所述第二内积、所述逆连接函数以及所述测试数据的标注信息得到的权重向量的量子态对应的风险值。
13.根据权利要求12所述的装置,其特征在于,所述测试模块在根据所述测试集中每一测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算权重向量与测试数据中多维度输入特征向量之间的第二内积时,用于:
根据所述测试数据、当前权重向量、所述最大权重向量、以及所述学习速率参数,采用量子计算处理器计算与第二内积相关的中间变量;
根据所述与第二内积相关的中间变量获取所述权重向量与训练数据中多维度输入特征向量之间的内积。
14.根据权利要求8-13任一项所述的装置,其特征在于,所述测试模块在根据所有风险值中的最小值对应的权重向量的量子态得到训练后用户消费行为的预测模型时,用于:
将所有风险值中的最小值对应的权重向量的量子态映射为权重向量,并根据该权重向量得到训练后用户消费行为的预测模型。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
CN202010093642.6A 2020-02-14 2020-02-14 用户消费行为预测模型训练方法、装置、设备及存储介质 Active CN111311000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010093642.6A CN111311000B (zh) 2020-02-14 2020-02-14 用户消费行为预测模型训练方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010093642.6A CN111311000B (zh) 2020-02-14 2020-02-14 用户消费行为预测模型训练方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111311000A CN111311000A (zh) 2020-06-19
CN111311000B true CN111311000B (zh) 2021-09-28

Family

ID=71159305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010093642.6A Active CN111311000B (zh) 2020-02-14 2020-02-14 用户消费行为预测模型训练方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111311000B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052317B (zh) * 2021-03-09 2023-10-13 本源量子计算科技(合肥)股份有限公司 量子态信息的获取方法和装置、量子测控***和计算机
CN113592095B (zh) * 2021-08-04 2024-01-16 北京量子信息科学研究院 一种基于量子计算的模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292528A (zh) * 2017-06-30 2017-10-24 阿里巴巴集团控股有限公司 车险风险预测方法、装置及服务器
CN109242223A (zh) * 2018-11-26 2019-01-18 武汉理工光科股份有限公司 城市公共建筑火灾风险的量子支持向量机评估与预测方法
CN109586909A (zh) * 2019-01-21 2019-04-05 成都信息工程大学 基于Bell态量子数据库访问控制与双向身份认证方法
CN110414555A (zh) * 2019-06-20 2019-11-05 阿里巴巴集团控股有限公司 检测异常样本的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548210B (zh) * 2016-10-31 2021-02-05 腾讯科技(深圳)有限公司 基于机器学习模型训练的信贷用户分类方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292528A (zh) * 2017-06-30 2017-10-24 阿里巴巴集团控股有限公司 车险风险预测方法、装置及服务器
CN109242223A (zh) * 2018-11-26 2019-01-18 武汉理工光科股份有限公司 城市公共建筑火灾风险的量子支持向量机评估与预测方法
CN109586909A (zh) * 2019-01-21 2019-04-05 成都信息工程大学 基于Bell态量子数据库访问控制与双向身份认证方法
CN110414555A (zh) * 2019-06-20 2019-11-05 阿里巴巴集团控股有限公司 检测异常样本的方法及装置

Also Published As

Publication number Publication date
CN111311000A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN111311321B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
CN111428008B (zh) 用于训练模型的方法、装置、设备以及存储介质
CN111639710B (zh) 图像识别模型训练方法、装置、设备以及存储介质
CN111539223B (zh) 语言模型的训练方法、装置、电子设备及可读存储介质
CN111737995B (zh) 基于多种词向量训练语言模型的方法、装置、设备及介质
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
CN111737994B (zh) 基于语言模型获取词向量的方法、装置、设备及存储介质
CN111783451B (zh) 用于增强文本样本的方法和装置
CN111079442B (zh) 文档的向量化表示方法、装置和计算机设备
US20210224879A1 (en) Method, electronic device and storage medium for item recommendation
CN111737996B (zh) 基于语言模型获取词向量的方法、装置、设备及存储介质
JP7113097B2 (ja) テキストエンティティの語義記述処理方法、装置及び機器
JP7262539B2 (ja) 会話推薦方法、装置及び機器
CN111783981A (zh) 模型训练方法、装置、电子设备及可读存储介质
CN111582479B (zh) 神经网络模型的蒸馏方法和装置
CN111709252B (zh) 基于预训练的语义模型的模型改进方法及装置
CN111311000B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
CN111611808B (zh) 用于生成自然语言模型的方法和装置
CN111241838A (zh) 文本实体的语义关系处理方法、装置及设备
CN114386503A (zh) 用于训练模型的方法和装置
US20240104403A1 (en) Method for training click rate prediction model
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
US11830207B2 (en) Method, apparatus, electronic device and readable storage medium for point cloud data processing
CN114707070A (zh) 一种用户行为预测方法及其相关设备
CN112508599B (zh) 信息反馈方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant