CN111292106A - 一种业务需求影响因素确定方法以及装置 - Google Patents
一种业务需求影响因素确定方法以及装置 Download PDFInfo
- Publication number
- CN111292106A CN111292106A CN201811489839.0A CN201811489839A CN111292106A CN 111292106 A CN111292106 A CN 111292106A CN 201811489839 A CN201811489839 A CN 201811489839A CN 111292106 A CN111292106 A CN 111292106A
- Authority
- CN
- China
- Prior art keywords
- user
- order
- sample
- feature vector
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 239000013598 vector Substances 0.000 claims abstract description 730
- 238000012549 training Methods 0.000 claims description 142
- 238000013528 artificial neural network Methods 0.000 claims description 66
- 238000012360 testing method Methods 0.000 claims description 38
- 230000004927 fusion Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 16
- 238000007906 compression Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000003749 cleanliness Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013468 resource allocation Methods 0.000 description 3
- 230000005587 bubbling Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种业务需求影响因素确定方法以及装置,其中,该方法包括:获取待预测用户在预设历史时间段内的多个订单的订单信息;根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。本申请实施例能够以更高的准确率来确定待预测用户在未来预设时间段内的业务需求影响因素。
Description
技术领域
本申请涉及机器学习技术领域,具体而言,涉及一种业务需求影响因素确定方法以及装置。
背景技术
沉默用户是指在某一时间段内产生过针对某一服务的历史行为数据,但在该时间段之后的另一时间段内未产生过针对该服务的历史行为数据的用户,例如曾经在某网约车平台约过车,但在最近的一个月内未在该网约车平台约车的用户,即为该网约车平台的沉默用户。
当前存在着获取用户的沉默原因,以便更好地进行资源配置,为用户更好地提供服务的需求。在获取用户的沉默原因的时候,通常是基于统计量来获取的,如用户登录次数、用户在预设时间段内的发单数量、用户在预设时间段内的冒泡数量等。这些统计量能够在总体上表征用户在一定时间段内历史行为的累积特征,但基于这些统计量确定的用户的沉默原因还是存在预测准确率较低的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种业务需求影响因素确定方法以及装置,能够以更高的准确率来确定待预测用户在未来预设时间段内的业务需求影响因素。
第一方面,提供一种业务需求影响因素确定方法,该方法包括:
获取待预测用户在预设历史时间段内的多个订单的订单信息;
根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
一种可选实施方式中,根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值;
根据该订单在多个订单特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
一种可选实施方式中,所述基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
将所述订单特征向量序列输入所述预测模型中,获取所述订单特征向量序列对应的预测结果;
基于所述订单特征向量序列对应的预测结果,各个所述特征向量序列中的元素以及所述特征向量序列中的各个元素对应的参考值,确定与每个所述订单特征对应的第二贡献值;
基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息。
一种可选实施方式中,所述基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息,包括:
根据所述第二贡献值的大小,从所述订单特征中确定至少一个目标订单特征;
基于所述目标订单特征对应的影响因素分类,确定所述待预测用户在订单特征维度的影响因素信息。
一种可选实施方式中,影响因素分类包括:价格敏感、少车敏感、等候时间敏感、司机服务敏感、安全隐患敏感、车型车况敏感中一种或者多种。
一种可选实施方式中,所述第二贡献值IntegratedGradsi(x)满足下述公式:
其中,xi表示订单特征向量中的第i个元素;xi′表示订单特征向量中的第i个元素对应的参考值;F表示所述预测模型对应的预测函数;x′表示由各个订单特征的参考值构成的特征向量;x表示订单特征向量序列中的订单特征向量。
一种可选实施方式中,获取待预测用户在预设历史时间段内的多个订单的订单信息之后,还包括:
根据所述待预测用户的用户信息,构建所述待预测用户的用户特征向量;
所述基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
一种可选实施方式中,所述基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
将所述订单特征向量序列以及所述用户特征向量输入至所述预先训练的预测模型中,从所述预测模型的目标网络层获取与各个所述订单特征向量对应的注意力分配权重,将各个所述注意力分配权重作为各个所述订单特征向量对应的订单对所述待预测用户沉默的第一贡献值;
基于所述第一贡献值,确定所述待预测用户在订单维度的影响因素信息。
一种可选实施方式中,所述根据所述用户信息,构建所述待预测用户的用户特征向量,包括:
根据所述用户信息,确定所述待预测用户在多种用户特征下的特征值;
根据所述待预测用户在多种所述用户特征下的特征值,构建该待预测用户的用户特征向量。
一种可选实施方式中,所述用户特征包括以下特征中的多种:
服务请求方的年龄、性别、职业、投诉因素。
一种可选实施方式中,所述订单特征包括以下特征中的多种:
订单起始点距离、排队等待时间、订单价格、订单时长、接驾距离、预估价、服务提供方信息。
一种可选实施方式中,所述服务提供方信息包括以下信息中的至少一种:
年龄、性别、评价等级、服务得分、服务设备等级、服务设备清洁度、完单率、被投诉因素。
一种可选实施方式中,采用下述方式训练所述预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的业务需求预测结果;
根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述预测模型。
一种可选实施方式中,获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息之后,还包括:
针对每个样本用户,根据该样本用户的用户信息,生成该样本用户的用户特征向量;
所述基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户的业务需求预测结果,包括:
将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果。
一种可选实施方式中,所述将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果,包括:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量输入至第三神经网络中,为所述融合特征向量提取目标特征向量,并将所述目标特征向量输入至分类器中,获取所述样本用户的业务需求预测结果。
一种可选实施方式中,所述针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量,包括:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
一种可选实施方式中,所述将所述样本用户的各个中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,包括:
针对每个中间特征向量,将该中间特征向量与所述用户特征向量进行拼接,生成与该中间特征向量对应的拼接向量;
将所述拼接向量输入至所述第二神经网络,获取与该拼接向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
一种可选实施方式中,所述基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量,包括:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
一种可选实施方式中,所述根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,包括:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的业务需求预测结果,以及对应的实际业务需求结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
一种可选实施方式中,所述完成对所述基础预测模型的本轮训练后,还包括:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述预测模型。
一种可选实施方式中,采用下述方式生成样本订单特征向量:
针对每个所述样本订单,根据该样本订单的订单信息,确定该样本订单在多个订单特征下的特征值;
检测各个所述订单特征对应的特征值的维度是否大于预设维度;
若任一订单特征对应的特征值的维度大于所述预设维度,则对该任一订单特征的特征值进行维度压缩,获取该任一订单特征的压缩特征值;
以及,基于该任一订单特征对应的压缩特征值,以及其他订单特征对应的特征值,构建所述样本订单特征向量。
一种可选实施方式中,采用下述方式生成用户订单特征向量:
针对每个所述样本用户,根据该样本用户的用户信息,确定该样本用户在多个用户特征下的特征值;
检测各个所述用户特征对应的特征值的维度是否大于预设维度;
若任一用户特征对应的特征值的维度大于所述预设维度,则对该任一用户特征的特征值进行维度压缩,获取该任一用户特征的压缩特征值;
以及,基于该任一用户特征对应的压缩特征值,以及其他用户特征对应的特征值,构建所述用户特征向量。
一种可选实施方式中,采用下述方式对特征值进行维度压缩:
获取特征嵌入矩阵;
将所述特征值与所述特征嵌入矩阵的乘积确定为所述压缩特征值。
第二方面,本申请实施例提供一种业务需求影响因素确定装置,该装置包括:
获取模块11,用于获取待预测用户在预设历史时间段内的多个订单的订单信息;
构建模块12,用于根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
确定模块13,用于基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
一种可选实施方式中,所述构建模块12,用于采用下述步骤根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值;
根据该订单在多个订单特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
一种可选实施方式中,所述确定模块13,用于采用下述步骤基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
将所述订单特征向量序列输入所述预测模型中,获取所述订单特征向量序列对应的预测结果;
基于所述订单特征向量序列对应的预测结果,各个所述特征向量序列中的元素以及所述特征向量序列中的各个元素对应的参考值,确定与每个所述订单特征对应的第二贡献值;
基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息。
一种可选实施方式中,所述确定模块13,用于采用下述步骤基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息,包括:
根据所述第二贡献值的大小,从所述订单特征中确定至少一个目标订单特征;
基于所述目标订单特征对应的影响因素分类,确定所述待预测用户在订单特征维度的影响因素信息。
一种可选实施方式中,影响因素分类包括:价格敏感、少车敏感、等候时间敏感、司机服务敏感、安全隐患敏感、车型车况敏感中一种或者多种。
一种可选实施方式中,所述第二贡献值IntegratedGradsi(x)满足下述公式:
其中,xi表示订单特征向量中的第i个元素;x′i表示订单特征向量中的第i个元素对应的参考值;F表示所述预测模型对应的预测函数;x′表示由各个订单特征的参考值构成的特征向量;x表示订单特征向量序列中的订单特征向量。
一种可选实施方式中,所述构建模块12,还用于:
根据所述待预测用户的用户信息,构建所述待预测用户的用户特征向量;
所述确定模块13,用于采用下述步骤基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
一种可选实施方式中,所述确定模块13,用于采用下述步骤基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
将所述订单特征向量序列以及所述用户特征向量输入至所述预先训练的预测模型中,从所述预测模型的目标网络层获取与各个所述订单特征向量对应的注意力分配权重,将各个所述注意力分配权重作为各个所述订单特征向量对应的订单对所述待预测用户沉默的第一贡献值;
基于所述第一贡献值,确定所述待预测用户在订单维度的影响因素信息。
一种可选实施方式中,所述构建模块12,用于采用下述步骤根据所述用户信息,构建所述待预测用户的用户特征向量:
根据所述用户信息,确定所述待预测用户在多种用户特征下的特征值;
根据所述待预测用户在多种所述用户特征下的特征值,构建该待预测用户的用户特征向量。
一种可选实施方式中,所述用户特征包括以下特征中的多种:
服务请求方的年龄、性别、职业、投诉因素。
一种可选实施方式中,所述订单特征包括以下特征中的多种:
订单起始点距离、排队等待时间、订单价格、订单时长、接驾距离、预估价、服务提供方信息。
一种可选实施方式中,所述服务提供方信息包括以下信息中的至少一种:
年龄、性别、评价等级、服务得分、服务设备等级、服务设备清洁度、完单率、被投诉因素。
一种可选实施方式中,还包括:训练模块14,用于采用下述方式训练所述预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的业务需求预测结果;
根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述预测模型。
一种可选实施方式中,所述训练模块14,还用于在获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息之后,针对每个样本用户,根据该样本用户的用户信息,生成该样本用户的用户特征向量;
所述训练模块14,用于采用下述步骤基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户的业务需求预测结果:
将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果。
一种可选实施方式中,所述训练模块14,用于采用下述步骤将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量输入至第三神经网络中,为所述融合特征向量提取目标特征向量,并将所述目标特征向量输入至分类器中,获取所述样本用户的业务需求预测结果。
一种可选实施方式中,所述训练模块14,用于采用下述步骤针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
一种可选实施方式中,所述训练模块14,用于采用下述步骤将所述样本用户的各个中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重:
针对每个中间特征向量,将该中间特征向量与所述用户特征向量进行拼接,生成与该中间特征向量对应的拼接向量;
将所述拼接向量输入至所述第二神经网络,获取与该拼接向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
一种可选实施方式中,所述训练模块14,用于采用下述步骤基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
一种可选实施方式中,所述训练模块14,用于采用下述步骤根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的业务需求预测结果,以及对应的实际业务需求结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
一种可选实施方式中,所述训练模块14,还用于完成对所述基础预测模型的本轮训练后,检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述预测模型。
一种可选实施方式中,所述训练模块14,用于采用下述步骤生成样本订单特征向量:
针对每个所述样本订单,根据该样本订单的订单信息,确定该样本订单在多个订单特征下的特征值;
检测各个所述订单特征对应的特征值的维度是否大于预设维度;
若任一订单特征对应的特征值的维度大于所述预设维度,则对该任一订单特征的特征值进行维度压缩,获取该任一订单特征的压缩特征值;
以及,基于该任一订单特征对应的压缩特征值,以及其他订单特征对应的特征值,构建所述样本订单特征向量。
一种可选实施方式中,所述训练模块14,用于采用下述步骤生成用户订单特征向量:
针对每个所述样本用户,根据该样本用户的用户信息,确定该样本用户在多个用户特征下的特征值;
检测各个所述用户特征对应的特征值的维度是否大于预设维度;
若任一用户特征对应的特征值的维度大于所述预设维度,则对该任一用户特征的特征值进行维度压缩,获取该任一用户特征的压缩特征值;
以及,基于该任一用户特征对应的压缩特征值,以及其他用户特征对应的特征值,构建所述用户特征向量。
一种可选实施方式中,所述训练模块14,用于采用下述步骤对特征值进行维度压缩:
获取特征嵌入矩阵;
将所述特征值与所述特征嵌入矩阵的乘积确定为所述压缩特征值。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如第一方面任一所述的业务需求影响因素方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面任一所述的业务需求影响因素方法的步骤。
本申请实施例通过获取待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据订单特征向量序列和预先训练的业务需求预测模型,以更高的准确率来确定待预测用户在未来预设时间段内的业务需求影响因素,从而基于这些影响因素更好地进行资源配置,提升服务质量。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请一些实施例的业务需求影响因素确定方法应用的一种场景下的***100框图;
图2示出根据本申请的一些实施例的可以实现本申请思想的服务器 110、服务请求方终端130、服务提供方终端140的电子设备200的示例性硬件和软件组件的示意图;
图3示出了本申请实施例所提供的一种业务需求影响因素确定方法的流程图;
图4示出了本申请各实施例所提供的业务需求影响因素确定中,根据多个订单的订单信息构建待预测用户的订单特征向量序列的具体方法的流程图;
图5示出了本申请各实施例所提供的业务需求影响因素确定中,构建待预测用户的用户特征向量的具体方法的流程图;
图6示出了本申请各实施例所提供的业务需求影响因素确定中,基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息的具体方法的流程图;
图7示出了本申请各实施例所提供的业务需求影响因素确定中,基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息的具体方法的流程图;
图8示出了本申请各实施例所提供的业务需求影响因素确定中,获得预先训练的业务需求预测模型的具体方法的流程图;
图9示出了本申请各实施例所提供的业务需求影响因素确定中,基于所述订单特征向量序列、用户特征向量和预先训练的预测模型,确定待预测用户在未来预设时间段内的业务需求的影响因素信息的具体方法的流程图;
图10示出了本申请各实施例所提供的业务需求影响因素确定中,另一种获得预先训练的业务需求预测模型的具体方法的流程图;
图11示出了本申请实各施例所提供的业务需求影响因素确定中,将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果具体方法的示意图;
图12示出了本申请实各施例所提供的业务需求影响因素确定中,基础预测网络的结构示意图;
图13示出了本申请实施例所提供的一种业务需求影响因素确定装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车出行场景”做相关介绍。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕预测网约车乘客的业务需求进行描述,但是应该理解,这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如,本申请可以应用于不同的运输***环境,包括陆地,海洋,或航空等,或其任意组合。运输***的交通工具可以包括出租车、私家车、顺风车、公共汽车、火车、子弹头列车、高速铁路、地铁、船只、飞机、宇宙飞船、热气球、或无人驾驶车辆等,或其任意组合。本申请还可以包括用于基于互联网为用户提供服务的任何服务***,例如,用于发送和/或接收快递的***、用于买卖双方交易的服务***。本申请的***或方法的应用可以包括网页、浏览器的插件、客户端终端、定制***、内部分析***、或人工智能机器人等,或其任意组合。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请的一个方面涉及一种业务需求影响因素确定方法。该方法可以通过获取的待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据订单特征向量序列和预先训练的预测模型,以更高的准确率来确定待预测用户在未来预设时间段内的业务需求的影响因素信息,从而可以基于这些影响因素更好地进行资源配置,提升服务质量。
值得注意的是,在本申请提出申请之前,用户业务需求的影响因素的确定一般是基于待预测用户的统计量来进行,导致存在预测准确率较低的问题。然而,本申请提供的业务需求影响因素确定***可以以更高的准确率来对待预测用户的业务需求进行预测。
图1是本申请一些实施例的业务需求影响因素确定方法应用的一种场景下的***100框图。例如,***100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。***100可以包括服务器110、网络 120、服务请求方终端130、服务提供方终端140和数据库150中的一种或多种,服务器110中可以包括执行指令操作的处理器112。本申请实施例提供的业务需求确定方法可以应用于上述***100中的服务器110,具体可以由处理器112执行相关操作指令。
图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110 的电子设备200的示例性硬件和软件组件的示意图。例如,处理器112可以用于电子设备200上,并且用于执行本申请中的功能。
电子设备200可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的业务需求确定方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的存储介质240,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备200 还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出 (Input/Output,I/O)接口250。
为了便于说明,在电子设备200中仅描述了一个处理器。然而,应当注意,本申请中的电子设备200还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备200的处理器执行步骤A和步骤B,则应该理解,步骤A 和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,处理器执行步骤A,第二处理器执行步骤B,或者处理器和第二处理器共同执行步骤A和B。
图3示出本申请实施例提供的业务需求影响因素确定方法的示意图,包括S301~S303。
S301:获取待预测用户在预设历史时间段内的多个订单的订单信息。
在具体实施中,待预测用户可以是网约车平台的全部用户;另外,由于网约车的用户数量非常庞大,一般是以千万甚至亿计的,要针对每个用户都确定其业务需求,计算量是非常庞大的,因此为了更有针对性,也可以是基于一定的条件从网约车平台的全部用户中筛选出来的用户。
示例性的,可以周期性计算各个用户在网约车平台上的发单频率,针对任何一个用户,如果本周期所计算的发单频率较之上周期计算的发单频率降低,且降低的数量达到上周期发单频率的预设百分比,则将当前用户确定为待预测用户。此处,发单频率,是指用户通过其使用的客户端想网约车平台发起约车订单的行为。
示例性的,还可以针对每个用户计算其最后一次发单与当前时间之间的时间间隔;当该时间间隔大于预设的时间间隔阈值后,将该用户确定为待预测用户。
另外,还可以采用其它的方式,从网约车平台的全部用户中筛选业务需求可能会降低的用户作为待预测用户。
预设历史时间段可以根据实际的需求进行具体的设定,例如可以将预设历史时间段设置为3个月、4个月、5个月、半年等,还可以设置为1周、 2周、3周等。该预设历史时间段例如是以当前时间为最晚时间的时间段。预设历史时间段内的多个订单,是指订单时间在该预设历史时间段内的订单。
在一种实施方式中,构建待预测用户特征向量序列的订单信息,是订单信息中除通用的用户信息外的订单信息;在另一种实施方式中,用户特征也可以在订单特征向量中,作为订单特征向量的通用特征。
S302:根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量。
此处,每个订单都对应有订单信息,根据每个订单的订单信息,能够构建与该订单对应的订单特征向量。多个订单的订单特征向量按照订单时间的先后顺序排布后,形成该订单特征向量序列。
例如针对某待预测用户甲某,其在预设历史时间段内的多个订单有n 个,则为该待预测用户生成的订单特征向量序列为:X1、X2、X3、……Xn。
假设每个订单特征向量中有m个元素,则待该与测用户的订单特征向量X1~Xn分别表示为:
X1=(x11,x12,x13,x14,…,x1m);
X2=(x21,x22,x23,x24,…,x2m);
……
Xn=(xn1,xn2,xn3,xn4,…,xnm)。
具体地,参见图4所示,本申请实施例还提供一种根据多个订单的订单信息构建待预测用户的订单特征向量序列的具体方法,包括:
S401:针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值。
示例性的,以构建待预测用户特征向量序列的订单信息,是订单信息中除通用的用户信息外的订单信息为例,订单特征包括但不限于下述(1) ~(7)中一种或者多种:
(1)订单起始点距离;此处,用户在通过网约车平台发单之前,会从用户使用的客户端输入订单的起始地以及目的地;该订单起始点距离,即为该起始地与目的地之间的距离。
此处,客户端将用户输入的起始地和目的地发送给服务器后,服务器认为客户端发生了冒泡行为。
(2)排队等待时间;此处,该排队等待时间为用户在发生冒泡行为后,可以是服务器根据客户端发生冒泡行为时的路况信息、运力信息、其他用户的约车信息等为待预测用户确定的预估排队等待时间,也可以是用户从发单到真正约到车之间的实际排队等待时间。
(3)订单价格;此处,该订单价格,是指网约车将用户从其出发地运载到目的地所的价格。
(4)订单时长;此处,订单时长,可以是指网约车将用户从其出发地运载到目的地所耗费的时间长度、用户从发单开始到网约车将其从其出发地运载到目的地所耗费的总时长、用户约到网约车到网约车将其从其出发地运载到目的地所耗费的总时长中一项或者多项。
(5)接驾距离;此处,接驾距离是指用户约到网约车时,网约车的当前位置与用户出发点之间的距离。
(6)预估价;预估价是服务器检测到客户端发生冒泡行为后,根据客户端发送的出发地和目的地,为用户确定的预估订单价格。
(7)服务提供方信息;此处,服务提供方信息,可以包括如下一种或者多种:年龄、性别、评价等级、服务得分、服务设备等级、服务设备型号、服务设备清洁度、完单率、被投诉因素。
其中,评价等级是指用户对该服务提供方进行评价后,得到的该服务提供方的评价等级。服务得分为用户对该服务提供方进行服务打分后,得到的该服务提供方的服务得分。服务设备等级是根据一定的划分规则,对用户的服务设备进行划分而得到的,例如对网约车进行按照品牌的划分,进行按照购买价格区间的划分、进行按照车型的划分、按照投入使用时间的划分等。服务设备清洁度一般是用户度该服务提供方进行服务设备的清洁度评分后得到的。完单率是指服务提供方完成服务的订单与接收的订单之间的比值;被投诉因素是指用户对该服务提供方进行投诉后得到的。
在上述订单特征中,既包括了数值特征,又包括了类别特征。对于数值特征,则是直接使用其对应的数值来表示。对应类别特征则使用独热 (one-hot)的编码方式,即每一个类别特征对应一个0、1组成的向量,类别数对应向量的维数,即一个类别对应向量的一维,当该预设操作行为特征为某一类别时,该类别对应的向量位置取1,其他部分则全部置0。
S402:根据该订单在多个订单特征下的特征值,构建与该订单对应的订单特征向量;
S403:根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
在本申请另一实施例中,在获取待预测用户在预设历史时间段内的多个订单的订单信息之后,还包括:
根据所述待预测用户的用户信息,构建所述待预测用户的用户特征向量;
此时,所述基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
具体地,参见图5所示,本申请实施例还提供一种构建待预测用户的用户特征向量的具体方法,包括:
S501:根据所述用户信息,确定所述待预测用户在多种用户特征下的特征值;
S502:根据所述待预测用户在多种所述用户特征下的特征值,构建该待预测用户的用户特征向量。
在具体实施中,用户特征包括:服务请求方的年龄、性别、职业、投诉因素中一种或者多种。
其中,投诉因素可以是服务请求方常投诉的因素的统计信息,例如预设有多种投诉因素,投诉因素可以表示为该用户针对每种投诉因素进行投诉的次数构成的向量。
示例性的,预设的投诉因素有A1~A10共10种,某用户针对这10种投诉因素进行投诉的数量依次为:1、0、0、5、0、1、15、0、0、0,则其投诉因素可以表示为:(1,0,0,5,0,1,15,0,0,0)。
另外,在本申请另一实施例中,由于部分订单特征或者用户特征为高维度稀疏特征,例如当订单特征包括服务设备型号的时候,根据不同的车型,作为服务设备的车辆的型号有成百上千种,而由于该订单特征为类别特征,因此采用独热方法得到的订单特征的维度也能够达到成百,甚至上千,且对应的特征值中,只有一个元素为1,其他元素均为0。针对这种高维度的稀疏特征,需要对其进行维度压缩,以方便后续模型的计算。
具体地,针对订单特征,可以采用下述方式生成订单特征向量:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值;
检测各个订单特征对应的特征值的维度是否大于第一预设维度;
若任一订单特征对应的特征值的维度大于该第一预设维度,则对该任一订单特征的特征值进行维度压缩,获取该任一订单特征的压缩特征值;
以及,基于该任一订单特征对应的压缩特征值,以及其他订单特征对应的特征值,构建该订单对应的订单特征向量。
针对用户特征,可以采用下述方式生成用户特征向量:
根据待预测用户的用户信息,确定待预测用户在多种用户特征下的特征值;
检测各个用户特征对应的特征值的维度是否大于第二预设维度;
若任一用户特征对应的特征值的维度大于该第二预设维度,则度该任一用户特征的特征值进行维度压缩,获取该任一用户特征的压缩特征值;
以及,基于该任一用户特征对应的压缩特征值,以及其他用户特征对应的特征值,构建所述待预测用户对应的用户特征向量。
此处,可以采用下述方式对特征值进行维度压缩:
获取特征嵌入矩阵,将特征值与特征嵌入矩阵的乘积,确定为所述压缩特征值。
这里,需要注意的是,针对同一订单特征,不同订单对应的该订单特征的特征嵌入矩阵均相同;针对同一用户特征,不同待预测用户对应的该用户特征的特征嵌入矩阵均相同。
特征嵌入矩阵通常初始化为随机数值,而后在预测模型训练过程中与模型参数共同训练。
承接上述S302,在构建待预测用户的订单特征向量序列之后,本申请实施例提供的业务需求影响因素确定方案还包括:
S303:基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
其一:在一些实施例中,若仅通过构建的订单特征向量序列,以及预先训练的预测模型,来确定待预测用户在未来预设时间段内的业务需求的影响因素信息,则将构建的特征向量序列输入到预先训练的预测模型中,确定待预测用户在未来预设时间段内的业务需求的影响因素信息。
具体地,参见图6所示,可以采用下述方式基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
S601:将所述订单特征向量序列输入所述预测模型中,获取所述订单特征向量序列对应的预测结果;
S602:基于所述订单特征向量序列对应的预测结果,各个所述特征向量序列中的元素以及所述特征向量序列中的各个元素对应的参考值,确定与每个所述订单特征对应的第二贡献值;
S603:基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息。
示例性的,最终确定的任意一个订单特征xi对应的第二贡献值 IntegratedGradsi(x)满足下述公式:
其中,xi表示订单特征向量中的第i个元素;x′i表示订单特征向量中的第i个元素对应的参考值;F表示所述预测模型对应的预测函数;x′表示由各个订单特征的参考值构成的特征向量;x表示订单特征向量序列中的订单特征向量。
在确定了各个订单特征对应的第二贡献值后,就能够基于各个特征对应的第二贡献值,确定待预测用户在订单特征维度的影响因素信息。
参见图7所示,本申请实施例还提供一种基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息的具体方法,包括:
S701:根据所述第二贡献值的大小,从所述订单特征中确定至少一个目标订单特征;
S702:基于所述目标订单特征对应的影响因素分类,确定所述待预测用户在订单特征维度的影响因素信息。
本申请实施例中,订单特征维度的影响因素分类包括:价格敏感、少车敏感、等候时间敏感、司机服务敏感、安全隐患敏感、车型车况敏感。
此处,可以按照第二贡献值从大到小的顺序,从各个订单特征中选择预设数量个订单特征作为目标订单特征,并根据各个目标订单特征归属的影响因素分类,确定影响待预测用户业务需求的影响因素信息。
例如,目标订单特征有一个,归属的影响因素分类包括:价格敏感,则确定待预测用户业务需求的影响因素信息包括:价格敏感。
又例如,目标订单特征有两个,归属的影响因素分类分别为:司机服务敏感和车型车况敏感,则确定待预测用户业务需求的影响因素信息包括:司机服务敏感和车型车况敏感。
需要注意的是,本申请实施例提供的预测模型,并非是直接对用户业务需求的影响因素信息进行预测,而是对用户的业务需求进行预测。在确定预测模型后,根据上述图6对应的方法,来实现对用户业务需求的影响因素信息的确定。
在此种情况下,参见图8所示,可以采用下述方式获得预先训练的预测模型:
S801:获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果。
此处,样本用户在目标历史时间段内的多个样本订单的样本订单信息,与待预测用户在预设历史时间段内的多个订单的订单信息类似,在此不在赘述。
S802:针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量。
此处,针对生成每个样本用户的样本订单特征向量序列的方式,与生成待预测用户的订单特征向量序列的方式类似,在此不再赘述。
S803:基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的业务需求预测结果。
此处,示例性的,基础预测模型包括:循环神经网络(Recurrent Neural Network,RNN)。
S804:根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述业务需求预测模型。
此处,根据样本用户的业务需求预测结果以及对应的实际业务需求结果,训练基础模型的过程,实际上就是将各个样本用户的特征向量序列输入至基础预测模型中,使得基础模型对特征向量序列进行特征学习,并输出业务需求预测结果,并根据业务需求预测结果以及对应的实际业务需求结果调整基础预测模型的参数,使得基础预测模型输出的业务需求预测结果与实际业务需求结果不断趋于一致的过程。
具体地,可以采用下述方式根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型:
针对每个所述样本订单特征向量序列,按照其中的样本订单特征向量对应订单生成时间的先后顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量。
获取将前一样本订单特征向量输入所述基础预测模型后,所述基础预测模型的目标特征提取层为前一样本订单特征向量输出的中间特征向量。
将所述当前样本订单特征向量以及所述中间特征向量输入至基础预测模型,得到与该样本订单特征向量对应的业务需求预测结果。
基于得到的业务需求预测结果和对应的实际业务需求结果,对所述基础预测模型的参数进行调整,并基于调整后的基础预测模型,返回所述从该样本订单特征向量序列中选择一个样本订单特征向量输入至基础预测模型中的步骤,直到满足训练截止条件。
此处,训练截至条件可以根据实际的需要进行设定,例如可以是:使用多个样本订单特征向量序列对基础预测模型进行预设轮数的训练,并将最后一轮训练得到的基础预测模型作为业务需求预测模型。在每一轮训练中,依次使用多个样本订单特征向量序列中的各个样本订单特征向量对模型进行一次训练。
或者,该训练截至条件还可以是:使用测试集对本轮得到的基础预测模型进行验证;若测试集中,交叉熵损失不大于预设交叉熵损失的测试数据的条数,占据测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对基础预测模型的训练,并将最后一轮训练得到的基础预测模型作为业务需求预测模型。
或者,该训练截至条件还可以是:依次将本轮各个样本用户的交叉熵损失,与前一轮对应样本用户的交叉熵损失进行比对;若本轮样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将上一轮训练得到的所述基础预测模型作为业务需求预测模型。
示例性的,可以采用下述方式对基础预测模型进行训练:构建初始的基础预测模型,并对初始的基础预测模型的各个参数进行初始赋值。
确定样本用户包括A1~As共s个样本用户。
针对其中的第i个样本用户Ai,i∈[1,s]:
针对第i个样本用户Ai,该样本用户Ai在目标历史时间段内的样本订单有n个,对应的订单特征有m个,则为该样本用户Ai生成的样本订单特征向量序列为:Xi1、Xi2、Xi3、……、Xin。
使用样本用户Ai的特征向量序列对基础预测模型进行本轮训练:
在使用该样本用户A的样本订单特征向量序列对基础预测模型进行本轮训练时:首先将样本订单特征向量Xi1输入至基础预测模型中:
此时,若在使用样本订单特征向量Xi1输入至基础预测模型中之前,并未有其他的样本订单特征向量对其进行过训练,则仅基于基础预测模型的初始赋值,以及样本订单特征向量Xi1,得到与该样本订单特征向量Xi1对应的业务需求预测结果。基于该业务需求预测结果以及样本订单特征向量 Xi1对应的实际业务需求结果,对基础预测模型的参数进行调整。
若在使用样本订单特征向量Xi1输入至基础预测模型中之前,已经使用了其他的样本订单特征向量对其进行过训练,则获取将前一样本订单特征向量输入基础预测模型后,基础预测模型的目标特征提取层为前一样本订单特征向量提取的中间特征向量Z0,并将该中间特征向量Z0,作为本次使用样本订单特征向量Xi1对基础预测模型进行训练时的参数,输入至基础预测模型中,基于该中间特征向量Z0,以及样本订单特征向量Xi1,得到与该样本订单特征向量Xi1对应的业务需求预测结果。基于该业务需求预测结果以及样本订单特征向量Xi1对应的实际业务需求结果,对基础预测模型的参数进行调整。
并且从基础预测模型的目标提取层,获取为该样本订单特征向量Xi1提取的中间特征向量Z1。
此处,在基于该业务需求预测结果以及样本订单特征向量Xi1对应的实际业务需求结果,对基础预测模型的参数进行调整时,可以将样本订单特征向量Xi1对应的业务需求预测结果和实际业务需求结果进行比对;在两者之间的差值小于预设的差值阈值的情况下,调整基础预测模型的参数。
在基于该业务需求预测结果以及样本订单特征向量Xi1对应的实际业务需求结果,对基础预测模型的参数进行调整时,还可以根据样本订单特征向量Xi1对应的业务需求预测结果和实际业务需求结果计算交叉熵损失;并根据交叉熵损失调整基础预测模型的参数。
在一些实施例中,若交叉熵损失较大时,对基础预测模型的参数的调整步长,要大于交叉熵损失较小时对基础预测模型的参数的调整步长。
然后样本订单特征向量Xi2和上述中间特征向量Z1输入至经样本订单特征向量Xi1训练得到的基础预测模型中,得到样本订单特征向量Xi2的业务需求预测结果。
基于样本订单特征向量Xi2的业务需求预测结果和实际业务需求结果,对基础预测模型的参数继续调整。
并且从基础预测模型的目标提取层,获取为该样本订单特征向量Xi2 提取的中间特征向量Z2。
分别将样本特征向Xi3、……、Xin对基础预测模型进行训练,完成基于当前样本订单特征向量序列为:Xi1、Xi2、Xi3、……、Xin对基础预测模型的训练。
依次基于各个样本用户对应的样本订单特征向量序列,对基础预测模型进行训练后,完成对基础预测模型的本轮训练。
在一些实施例中,基础预测模型为循环神经网络,包括输入层、目标特征提取层以及输出层。将所述当前样本订单特征向量以及所述中间特征向量输入至基础预测模型,得到与该样本订单特征向量对应的业务需求预测结果,可以采用下述方式:将当前样本订单特征向量输入至输入层,使用输入层为样本订单特征向量提取中间特征向量;将中间特征向量输入和基础预测模型的目标特征提取层为样本订单特征向量提取中间特征向量输入至目标特征提取层,对中间特征向量以及基础预测模型的目标特征提取层为样本订单特征向量提取中间特征向量进行加权求和,得到基础预测模型的目标特征提取层为当前样本订单特征向量提取的中间特征向量,并将基础预测模型的目标特征提取层为当前样本订单特征向量提取的中间特征向量输入至输出层,得到业务需求预测结果。
其二:
若通过构建订单特征向量序列以及用户特征向量,并将所述订单特征向量序列和所述用户特征向量输入至预先训练的预测模型中,得到所述待预测用户在未来预设时间段内的业务需求的影响因素信息,在此种情况下,可以采用如上述图6和图7对应的实施例提供的基于所述订单特征向量序列和预先训练的预测模型,确定待预测用户在未来预设时间段内的业务需求的影响因素信息的方法。
在另一实施例中,还可以采用下述图9对应的实施例提供的基于所述订单特征向量序列、用户特征向量和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息的方法,包括:
S901:将所述订单特征向量序列以及所述用户特征向量输入至所述预先训练的预测模型中,从所述预测模型的目标网络层获取与各个所述订单特征向量对应的注意力分配权重,将各个所述注意力分配权重作为各个所述订单特征向量对应的订单对所述待预测用户沉默的第一贡献值;
S902:基于所述第一贡献值,确定所述待预测用户在订单维度的影响因素信息。
此处,需要注意的是,订单维度的影响因素信息,即为对待预测用户的业务需求具有影响的目标订单。
具体地,可以根据订单特征向量对应的注意力分配权重的大小,从各个订单特征向量中确定至少一个目标订单特征向量,并将确定的目标订单特征向量对应的订单,确定为对待预测用户的业务需求具有较大影响的目标订单。
在此种情况下,参见图10所示,可以采用下述方式获得预先训练的预测模型:
S1001:获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果;以及获取各个所述样本用户的用户信息。
此处,多个样本订单的样本订单信息,与待预测用户的订单信息类似,且样本用户的用户信息,与待预测用户的用户信息类似,在此不再赘述。
S1002:针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;以及根据该样本用户的用户信息,生成该样本用户的用户特征向量。
此处,样本订单特征向量序列以及样本用户的用户特征向量的生成方式,与待预测用户的订单特征向量序列和用户特征向量的获取方式类似,在此不再赘述。
S1003:将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果。
S1004:根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述预测模型。
在具体实施中,图11示出本申请实施例提供将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果具体方式示意图,图12示出本申请实施例提供的基础预测网络的结构示意图。其中,参见图11和图12所示,将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果,包括:
S1101:针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述样本订单特征向量对应的中间特征向量。
此处,在样本订单特征向量序列中包括了多个样本订单特征向量,为了建立各个样本订单特征向量之间的关系,可以采用下述方式获取每个样本订单特征向量输入至第一神经网络中,获取每个所述样本订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
S1102:将所述样本用户的各个所述中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重。
此处,可以采用下述方式获取与各个中间特征向量对应的注意力分配权重:
针对每个中间特征向量,将该中间特征向量与用户特征向量进行拼接,生成与该中间特征向量对应的拼接向量。将所述拼接向量输入至所述第二神经网络,获取与该拼接向量对应的匹配度;基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
此处,需要注意的是,基于预设的激活函数对匹配度进行激活运算的网络层,即为本申请实施例中的目标提取层。
具体地,第二神经网络是一个至少一层的全连接网络,通过该第二神经网络能够建立拼接向量中各个元素之间的关系,所确定与拼接向量对应的匹配度,是构成该拼接向量的中间特征向量与用户特征向量之间的匹配度,又由于中间特征向量是基于样本订单特征向量得到,因此,该匹配度又可以视作样本订单与用户之间的匹配度。然后使用相同的激活函数,对各个拼接向量对应的匹配度进行激活运算,的到与各个中间特征向量对应的注意力分配权重。
S1103:基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量。
此处,可以对各个中间特征向量进行加权求和的方式,生成融合特征向量。其中,在对各个中间特征向量进行加权求和的权重,即为每个中间特征向量分别对应的注意力分配权重。
S1104:将所述样本用户的融合特征向量输入至第三神经网络中,为所述融合特征向量提取目标特征向量,并将所述目标特征向量输入至分类器中,获取所述样本用户的业务需求预测结果。
示例性的,参见图12所示,样本用户的样本订单特征向量序列包括 X1~X10共10个样本订单特征向量,依次输入至第一神经网络,样本用户的用户特征向量为T。其中:
将X1输入至第一神经网络后,得到中间特征向量h1;
将h1和X2输入至第一神经网络后,得到中间特征向量h2;
……
将h9和X10输入至第一神经网络后,得到中间特征向量h10;
然后讲h1~h10以及T输入至第二神经网络,得到各个中间特征向量分别对应的注意力分配权重w1~w10;
根据注意力分配权重w1~w10,对h1~h10进行加权求和,形成融合特征向量H。
将融合特征向量H输入至第三神经网络,得到样本用户的业务需求预测结果P。
示例性的,第三神经网络是一个包括了多层全连接层的神经网络,通过该第三神经网络,能够建立融合特征向量中各个元素之间的联系,并提取能够表征用户业务需求的目标特征向量。然后将目标特征向量输入至分类器,得到样本用户的业务需求预测结果。
在本申请实施例中,通过用户的沉默概率来表征用户的业务需求,因此该业务需求预测结果,又可以表示为用户的沉默概率预测结果。
在根据基础预测模型得到样本用户的业务需求预测结果后,可以采用下述方式根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的业务需求预测结果,以及对应的实际业务需求结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
此处,根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型的过程,与上述S804的过程类似,在此不再赘述。
与上述S804类似的,本申请实施例在完成对基础预测模型的本轮训练之后,还可以通过下述三种方式中任意一种检测是否停止训练:
(1)检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型。
具体实现的时候,在模型训练时,会预先设置一个训练的预设轮数,如果检测到本轮达到预设轮数,则停止对基础预测模型的训练,将最后一轮训练得到的基础预测模型作为预测模型。
(2)使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
在模型训练的过程中,需要使得交叉熵损失的值逐渐减小,因此,使用测试集对本轮得到的基础预测模型进行验证时,如果测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,达到一定预设比例,例如,90%、95%等,则停止对基础预测模型的训练,将最后一轮训练得到的基础预测模型作为预测模型。
(3)依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述预测模型。
在模型训练的过程中,需要使得交叉熵损失的值逐渐减小,并将交叉熵损失的值最小时得到的基础预测模型作为预测模型。
在得到预测模型后,就能够基于该预测模型对待预测用户在未来预设时间段内的业务需求预测结果进行预测。
其中,预测模型对订单特征向量序列的处理方式与模型训练过程中,基础预测模型对样本订单特征向量的处理方式类似,在此不再赘述。
本申请实施例通过获取待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据订单特征向量序列和预先训练的业务需求预测模型,以更高的准确率来确定待预测用户在未来预设时间段内的业务需求影响因素。
图13是示出本申请的一些实施例的业务需求影响因素确定装置的框图,该业务需求影响因素确定装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图 13所示,业务需求影响因素确定装置包括:
获取模块,用于获取待预测用户在预设历史时间段内的多个订单的订单信息;
构建模块,用于根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
确定模块,用于基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
一种可选实施方式中,所述构建模块,用于采用下述步骤根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值;
根据该订单在多个订单特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
一种可选实施方式中,所述确定模块,用于采用下述步骤基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
将所述订单特征向量序列输入所述预测模型中,获取所述订单特征向量序列对应的预测结果;
基于所述订单特征向量序列对应的预测结果,各个所述特征向量序列中的元素以及所述特征向量序列中的各个元素对应的参考值,确定与每个所述订单特征对应的第二贡献值;
基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息。
一种可选实施方式中,所述确定模块,用于采用下述步骤基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息,包括:
根据所述第二贡献值的大小,从所述订单特征中确定至少一个目标订单特征;
基于所述目标订单特征对应的影响因素分类,确定所述待预测用户在订单特征维度的影响因素信息。
一种可选实施方式中,影响因素分类包括:价格敏感、少车敏感、等候时间敏感、司机服务敏感、安全隐患敏感、车型车况敏感中一种或者多种。
一种可选实施方式中,所述第二贡献值IntegratedGradsi(x)满足下述公式:
其中,xi表示订单特征向量中的第i个元素;xi′表示订单特征向量中的第i个元素对应的参考值;F表示所述预测模型对应的预测函数;x′表示由各个订单特征的参考值构成的特征向量;x表示订单特征向量序列中的订单特征向量。
一种可选实施方式中,所述构建模块,还用于:
根据所述待预测用户的用户信息,构建所述待预测用户的用户特征向量;
所述确定模块,用于采用下述步骤基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
一种可选实施方式中,所述确定模块,用于采用下述步骤基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
将所述订单特征向量序列以及所述用户特征向量输入至所述预先训练的预测模型中,从所述预测模型的目标网络层获取与各个所述订单特征向量对应的注意力分配权重,将各个所述注意力分配权重作为各个所述订单特征向量对应的订单对所述待预测用户沉默的第一贡献值;
基于所述第一贡献值,确定所述待预测用户在订单维度的影响因素信息。
一种可选实施方式中,所述构建模块,用于采用下述步骤根据所述用户信息,构建所述待预测用户的用户特征向量:
根据所述用户信息,确定所述待预测用户在多种用户特征下的特征值;
根据所述待预测用户在多种所述用户特征下的特征值,构建该待预测用户的用户特征向量。
一种可选实施方式中,所述用户特征包括以下特征中的多种:
服务请求方的年龄、性别、职业、投诉因素。
一种可选实施方式中,所述订单特征包括以下特征中的多种:
订单起始点距离、排队等待时间、订单价格、订单时长、接驾距离、预估价、服务提供方信息。
一种可选实施方式中,所述服务提供方信息包括以下信息中的至少一种:
年龄、性别、评价等级、服务得分、服务设备等级、服务设备清洁度、完单率、被投诉因素。
一种可选实施方式中,还包括:训练模块,用于采用下述方式训练所述预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的业务需求预测结果;
根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述预测模型。
一种可选实施方式中,所述训练模块,还用于在获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息之后,针对每个样本用户,根据该样本用户的用户信息,生成该样本用户的用户特征向量;
所述训练模块,用于采用下述步骤基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户的业务需求预测结果:
将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果。
一种可选实施方式中,所述训练模块,用于采用下述步骤将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量输入至第三神经网络中,为所述融合特征向量提取目标特征向量,并将所述目标特征向量输入至分类器中,获取所述样本用户的业务需求预测结果。
一种可选实施方式中,所述训练模块,用于采用下述步骤针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
一种可选实施方式中,所述训练模块,用于采用下述步骤将所述样本用户的各个中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重:
针对每个中间特征向量,将该中间特征向量与所述用户特征向量进行拼接,生成与该中间特征向量对应的拼接向量;
将所述拼接向量输入至所述第二神经网络,获取与该拼接向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
一种可选实施方式中,所述训练模块,用于采用下述步骤基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
一种可选实施方式中,所述训练模块,用于采用下述步骤根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的业务需求预测结果,以及对应的实际业务需求结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
一种可选实施方式中,所述训练模块,还用于完成对所述基础预测模型的本轮训练后,检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述预测模型。
一种可选实施方式中,所述训练模块,用于采用下述步骤生成样本订单特征向量:
针对每个所述样本订单,根据该样本订单的订单信息,确定该样本订单在多个订单特征下的特征值;
检测各个所述订单特征对应的特征值的维度是否大于预设维度;
若任一订单特征对应的特征值的维度大于所述预设维度,则对该任一订单特征的特征值进行维度压缩,获取该任一订单特征的压缩特征值;
以及,基于该任一订单特征对应的压缩特征值,以及其他订单特征对应的特征值,构建所述样本订单特征向量。
一种可选实施方式中,所述训练模块,用于采用下述步骤生成用户订单特征向量:
针对每个所述样本用户,根据该样本用户的用户信息,确定该样本用户在多个用户特征下的特征值;
检测各个所述用户特征对应的特征值的维度是否大于预设维度;
若任一用户特征对应的特征值的维度大于所述预设维度,则对该任一用户特征的特征值进行维度压缩,获取该任一用户特征的压缩特征值;
以及,基于该任一用户特征对应的压缩特征值,以及其他用户特征对应的特征值,构建所述用户特征向量。
一种可选实施方式中,所述训练模块,用于采用下述步骤对特征值进行维度压缩:
获取特征嵌入矩阵;
将所述特征值与所述特征嵌入矩阵的乘积确定为所述压缩特征值。
本申请实施例通过获取待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据订单特征向量序列和预先训练的业务需求预测模型,以更高的准确率来确定待预测用户在未来预设时间段内的业务需求影响因素,从而基于这些影响因素更好地进行资源配置,提升服务质量。
上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
如图2所示,本申请实施例还提供一种电子设备,包括:处理器220、存储介质和总线230,所述存储介质存储有所述处理器220可执行的机器可读指令,当电子设备运行时,所述处理器220与所述存储介质之间通过总线通信230,所述处理器220执行所述机器可读指令,以执行时执行如本申请实施例提供的业务需求影响因素确定方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如如本申请实施例提供的业务需求影响因素确定方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、 RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (48)
1.一种业务需求影响因素确定方法,其特征在于,该方法包括:
获取待预测用户在预设历史时间段内的多个订单的订单信息;
根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
2.根据权利要求1所述的方法,其特征在于,根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值;
根据该订单在多个订单特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
3.根据权利要求2所述的方法,其特征在于,所述基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
将所述订单特征向量序列输入所述预测模型中,获取所述订单特征向量序列对应的预测结果;
基于所述订单特征向量序列对应的预测结果,各个所述特征向量序列中的元素以及所述特征向量序列中的各个元素对应的参考值,确定与每个所述订单特征对应的第二贡献值;
基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息,包括:
根据所述第二贡献值的大小,从所述订单特征中确定至少一个目标订单特征;
基于所述目标订单特征对应的影响因素分类,确定所述待预测用户在订单特征维度的影响因素信息。
5.根据权利要求4所述的方法,其特征在于,影响因素分类包括:价格敏感、少车敏感、等候时间敏感、司机服务敏感、安全隐患敏感、车型车况敏感中一种或者多种。
7.根据权利要求1所述的方法,其特征在于,获取待预测用户在预设历史时间段内的多个订单的订单信息之后,还包括:
根据所述待预测用户的用户信息,构建所述待预测用户的用户特征向量;
所述基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
8.根据权利要求7所述的方法,其特征在于,所述基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息,包括:
将所述订单特征向量序列以及所述用户特征向量输入至所述预先训练的预测模型中,从所述预测模型的目标网络层获取与各个所述订单特征向量对应的注意力分配权重,将各个所述注意力分配权重作为各个所述订单特征向量对应的订单对所述待预测用户沉默的第一贡献值;
基于所述第一贡献值,确定所述待预测用户在订单维度的影响因素信息。
9.根据权利要求7所述的方法,其特征在于,所述根据所述用户信息,构建所述待预测用户的用户特征向量,包括:
根据所述用户信息,确定所述待预测用户在多种用户特征下的特征值;
根据所述待预测用户在多种所述用户特征下的特征值,构建该待预测用户的用户特征向量。
10.根据权利要求7所述的方法,其特征在于,所述用户特征包括以下特征中的多种:
服务请求方的年龄、性别、职业、投诉因素。
11.根据权利要求2所述的方法,其特征在于,所述订单特征包括以下特征中的多种:
订单起始点距离、排队等待时间、订单价格、订单时长、接驾距离、预估价、服务提供方信息。
12.根据权利要求11所述的方法,其特征在于,所述服务提供方信息包括以下信息中的至少一种:
年龄、性别、评价等级、服务得分、服务设备等级、服务设备清洁度、完单率、被投诉因素。
13.根据权利要求1所述的方法,其特征在于,采用下述方式训练所述预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的业务需求预测结果;
根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述预测模型。
14.根据权利要求13所述的方法,其特征在于,获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息之后,还包括:
针对每个样本用户,根据该样本用户的用户信息,生成该样本用户的用户特征向量;
所述基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户的业务需求预测结果,包括:
将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果。
15.根据权利要求14所述的方法,其特征在于,所述将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果,包括:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量输入至第三神经网络中,为所述融合特征向量提取目标特征向量,并将所述目标特征向量输入至分类器中,获取所述样本用户的业务需求预测结果。
16.根据权利要求15所述的方法,其特征在于,所述针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量,包括:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
17.根据权利要求15所述的方法,其特征在于,所述将所述样本用户的各个中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,包括:
针对每个中间特征向量,将该中间特征向量与所述用户特征向量进行拼接,生成与该中间特征向量对应的拼接向量;
将所述拼接向量输入至所述第二神经网络,获取与该拼接向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
18.根据权利要求15所述的方法,其特征在于,所述基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量,包括:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
19.根据权利要求13所述的方法,其特征在于,所述根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,包括:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的业务需求预测结果,以及对应的实际业务需求结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
20.根据权利要求19所述的方法,其特征在于,所述完成对所述基础预测模型的本轮训练后,还包括:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述预测模型。
21.根据权利要求13所述的方法,其特征在于,采用下述方式生成样本订单特征向量:
针对每个所述样本订单,根据该样本订单的订单信息,确定该样本订单在多个订单特征下的特征值;
检测各个所述订单特征对应的特征值的维度是否大于预设维度;
若任一订单特征对应的特征值的维度大于所述预设维度,则对该任一订单特征的特征值进行维度压缩,获取该任一订单特征的压缩特征值;
以及,基于该任一订单特征对应的压缩特征值,以及其他订单特征对应的特征值,构建所述样本订单特征向量。
22.根据权利要求13所述的方法,其特征在于,采用下述方式生成用户订单特征向量:
针对每个所述样本用户,根据该样本用户的用户信息,确定该样本用户在多个用户特征下的特征值;
检测各个所述用户特征对应的特征值的维度是否大于预设维度;
若任一用户特征对应的特征值的维度大于所述预设维度,则对该任一用户特征的特征值进行维度压缩,获取该任一用户特征的压缩特征值;
以及,基于该任一用户特征对应的压缩特征值,以及其他用户特征对应的特征值,构建所述用户特征向量。
23.根据权利要求21或22所述的方法,其特征在于,采用下述方式对特征值进行维度压缩:
获取特征嵌入矩阵;
将所述特征值与所述特征嵌入矩阵的乘积确定为所述压缩特征值。
24.一种业务需求影响因素确定装置,其特征在于,该装置包括:
获取模块,用于获取待预测用户在预设历史时间段内的多个订单的订单信息;
构建模块,用于根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
确定模块,用于基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
25.根据权利要求24所述的装置,其特征在于,所述构建模块,用于采用下述步骤根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个订单特征下的特征值;
根据该订单在多个订单特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
26.根据权利要求25所述的装置,其特征在于,所述确定模块,用于采用下述步骤基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
将所述订单特征向量序列输入所述预测模型中,获取所述订单特征向量序列对应的预测结果;
基于所述订单特征向量序列对应的预测结果,各个所述特征向量序列中的元素以及所述特征向量序列中的各个元素对应的参考值,确定与每个所述订单特征对应的第二贡献值;
基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息。
27.根据权利要求26所述的装置,其特征在于,所述确定模块,用于采用下述步骤基于所述第二贡献值,确定所述待预测用户在订单特征维度的影响因素信息,包括:
根据所述第二贡献值的大小,从所述订单特征中确定至少一个目标订单特征;
基于所述目标订单特征对应的影响因素分类,确定所述待预测用户在订单特征维度的影响因素信息。
28.根据权利要求27所述的装置,其特征在于,影响因素分类包括:价格敏感、少车敏感、等候时间敏感、司机服务敏感、安全隐患敏感、车型车况敏感中一种或者多种。
30.根据权利要求24所述的装置,其特征在于,所述构建模块,还用于:
根据所述待预测用户的用户信息,构建所述待预测用户的用户特征向量;
所述确定模块,用于采用下述步骤基于所述订单特征向量序列和预先训练的预测模型,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息。
31.根据权利要求30所述的装置,其特征在于,所述确定模块,用于采用下述步骤基于所述订单特征向量序列、所述用户特征向量输入以及所述预先训练的预测模型中,确定所述待预测用户在未来预设时间段内的业务需求的影响因素信息:
将所述订单特征向量序列以及所述用户特征向量输入至所述预先训练的预测模型中,从所述预测模型的目标网络层获取与各个所述订单特征向量对应的注意力分配权重,将各个所述注意力分配权重作为各个所述订单特征向量对应的订单对所述待预测用户沉默的第一贡献值;
基于所述第一贡献值,确定所述待预测用户在订单维度的影响因素信息。
32.根据权利要求30所述的装置,其特征在于,所述构建模块,用于采用下述步骤根据所述用户信息,构建所述待预测用户的用户特征向量:
根据所述用户信息,确定所述待预测用户在多种用户特征下的特征值;
根据所述待预测用户在多种所述用户特征下的特征值,构建该待预测用户的用户特征向量。
33.根据权利要求30所述的装置,其特征在于,所述用户特征包括以下特征中的多种:
服务请求方的年龄、性别、职业、投诉因素。
34.根据权利要求25所述的装置,其特征在于,所述订单特征包括以下特征中的多种:
订单起始点距离、排队等待时间、订单价格、订单时长、接驾距离、预估价、服务提供方信息。
35.根据权利要求34所述的装置,其特征在于,所述服务提供方信息包括以下信息中的至少一种:
年龄、性别、评价等级、服务得分、服务设备等级、服务设备清洁度、完单率、被投诉因素。
36.根据权利要求24所述的装置,其特征在于,还包括:训练模块,用于采用下述方式训练所述预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际业务需求结果;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的业务需求预测结果;
根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型,得到所述预测模型。
37.根据权利要求36所述的装置,其特征在于,所述训练模块,还用于在获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息之后,针对每个样本用户,根据该样本用户的用户信息,生成该样本用户的用户特征向量;
所述训练模块,用于采用下述步骤基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户的业务需求预测结果:
将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果。
38.根据权利要求37所述的装置,其特征在于,所述训练模块,用于采用下述步骤将每个所述样本用户的样本订单特征向量序列和用户特征向量输入至基础预测模型中,得到每个所述样本用户的业务需求预测结果:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量输入至第三神经网络中,为所述融合特征向量提取目标特征向量,并将所述目标特征向量输入至分类器中,获取所述样本用户的业务需求预测结果。
39.根据权利要求38所述的装置,其特征在于,所述训练模块,用于采用下述步骤针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
40.根据权利要求38所述的装置,其特征在于,所述训练模块,用于采用下述步骤将所述样本用户的各个中间特征向量以及所述用户特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重:
针对每个中间特征向量,将该中间特征向量与所述用户特征向量进行拼接,生成与该中间特征向量对应的拼接向量;
将所述拼接向量输入至所述第二神经网络,获取与该拼接向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
41.根据权利要求38所述的装置,其特征在于,所述训练模块,用于采用下述步骤基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
42.根据权利要求36所述的装置,其特征在于,所述训练模块,用于采用下述步骤根据各个所述样本用户的业务需求预测结果以及对应的实际业务需求结果,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的业务需求预测结果,以及对应的实际业务需求结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
43.根据权利要求42所述的装置,其特征在于,所述训练模块,还用于完成对所述基础预测模型的本轮训练后,检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述预测模型。
44.根据权利要求36所述的装置,其特征在于,所述训练模块,用于采用下述步骤生成样本订单特征向量:
针对每个所述样本订单,根据该样本订单的订单信息,确定该样本订单在多个订单特征下的特征值;
检测各个所述订单特征对应的特征值的维度是否大于预设维度;
若任一订单特征对应的特征值的维度大于所述预设维度,则对该任一订单特征的特征值进行维度压缩,获取该任一订单特征的压缩特征值;
以及,基于该任一订单特征对应的压缩特征值,以及其他订单特征对应的特征值,构建所述样本订单特征向量。
45.根据权利要求36所述的装置,其特征在于,所述训练模块,用于采用下述步骤生成用户订单特征向量:
针对每个所述样本用户,根据该样本用户的用户信息,确定该样本用户在多个用户特征下的特征值;
检测各个所述用户特征对应的特征值的维度是否大于预设维度;
若任一用户特征对应的特征值的维度大于所述预设维度,则对该任一用户特征的特征值进行维度压缩,获取该任一用户特征的压缩特征值;
以及,基于该任一用户特征对应的压缩特征值,以及其他用户特征对应的特征值,构建所述用户特征向量。
46.根据权利要求44或45所述的装置,其特征在于,所述训练模块,用于采用下述步骤对特征值进行维度压缩:
获取特征嵌入矩阵;
将所述特征值与所述特征嵌入矩阵的乘积确定为所述压缩特征值。
47.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至23任一所述的业务需求影响因素方法的步骤。
48.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至23任一所述的业务需求影响因素方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811489839.0A CN111292106A (zh) | 2018-12-06 | 2018-12-06 | 一种业务需求影响因素确定方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811489839.0A CN111292106A (zh) | 2018-12-06 | 2018-12-06 | 一种业务需求影响因素确定方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111292106A true CN111292106A (zh) | 2020-06-16 |
Family
ID=71025214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811489839.0A Pending CN111292106A (zh) | 2018-12-06 | 2018-12-06 | 一种业务需求影响因素确定方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111292106A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801690A (zh) * | 2020-12-31 | 2021-05-14 | 北京嘀嘀无限科技发展有限公司 | 一种干预特征的确定方法和装置 |
CN113393279A (zh) * | 2021-07-08 | 2021-09-14 | 北京沃东天骏信息技术有限公司 | 一种订单数量的预估方法及*** |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134643A (ja) * | 1999-11-02 | 2001-05-18 | Hitachi Ltd | 需要予測装置及び需要予測方法 |
US20020169657A1 (en) * | 2000-10-27 | 2002-11-14 | Manugistics, Inc. | Supply chain demand forecasting and planning |
JP2004234470A (ja) * | 2003-01-31 | 2004-08-19 | Ricoh Co Ltd | 需要予測方法及び需要予測プログラム |
CN102938742A (zh) * | 2012-11-08 | 2013-02-20 | 广东电网公司电力调度控制中心 | 基于电力业务需求的通信带宽预测方法及装置 |
US20150058078A1 (en) * | 2013-08-26 | 2015-02-26 | Microsoft Corporation | Rule to constraint translator for business application systems |
US20160055494A1 (en) * | 2014-08-19 | 2016-02-25 | Boyi Ni | Booking based demand forecast |
CN106203682A (zh) * | 2016-06-29 | 2016-12-07 | 东南大学 | 酒店一次性用品需求预测方法及订单*** |
WO2017063356A1 (zh) * | 2015-10-14 | 2017-04-20 | 深圳市天行家科技有限公司 | 代驾订单预测方法和代驾运力调度方法 |
CN106651213A (zh) * | 2017-01-03 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 服务订单的处理方法及装置 |
CN107038492A (zh) * | 2016-02-04 | 2017-08-11 | 滴滴(中国)科技有限公司 | 基于Arma模型的每日订单成交量预测方法及装置 |
CN107220845A (zh) * | 2017-05-09 | 2017-09-29 | 北京小度信息科技有限公司 | 用户复购概率预测/用户质量确定方法、装置及电子设备 |
CN107292420A (zh) * | 2017-05-24 | 2017-10-24 | 国网北京市电力公司 | 数据处理方法和装置 |
US20170364933A1 (en) * | 2014-12-09 | 2017-12-21 | Beijing Didi Infinity Technology And Development Co., Ltd. | User maintenance system and method |
CN108230049A (zh) * | 2018-02-09 | 2018-06-29 | 新智数字科技有限公司 | 订单的预测方法及*** |
US20180232676A1 (en) * | 2017-02-10 | 2018-08-16 | Cimpress Schweiz Gmbh | Fulfillment Success Prediction for Product Procurement |
CN108681857A (zh) * | 2018-05-18 | 2018-10-19 | 北京顺丰同城科技有限公司 | 一种配送订单分配方法及装置、计算机可读存储介质 |
CN108681751A (zh) * | 2018-05-22 | 2018-10-19 | 平安科技(深圳)有限公司 | 确定事件影响因素的方法及终端设备 |
CN108876056A (zh) * | 2018-07-20 | 2018-11-23 | 广东工业大学 | 一种共享自行车需求量预测方法、装置、设备及存储介质 |
-
2018
- 2018-12-06 CN CN201811489839.0A patent/CN111292106A/zh active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134643A (ja) * | 1999-11-02 | 2001-05-18 | Hitachi Ltd | 需要予測装置及び需要予測方法 |
US20020169657A1 (en) * | 2000-10-27 | 2002-11-14 | Manugistics, Inc. | Supply chain demand forecasting and planning |
JP2004234470A (ja) * | 2003-01-31 | 2004-08-19 | Ricoh Co Ltd | 需要予測方法及び需要予測プログラム |
CN102938742A (zh) * | 2012-11-08 | 2013-02-20 | 广东电网公司电力调度控制中心 | 基于电力业务需求的通信带宽预测方法及装置 |
US20150058078A1 (en) * | 2013-08-26 | 2015-02-26 | Microsoft Corporation | Rule to constraint translator for business application systems |
US20160055494A1 (en) * | 2014-08-19 | 2016-02-25 | Boyi Ni | Booking based demand forecast |
US20170364933A1 (en) * | 2014-12-09 | 2017-12-21 | Beijing Didi Infinity Technology And Development Co., Ltd. | User maintenance system and method |
WO2017063356A1 (zh) * | 2015-10-14 | 2017-04-20 | 深圳市天行家科技有限公司 | 代驾订单预测方法和代驾运力调度方法 |
CN107038492A (zh) * | 2016-02-04 | 2017-08-11 | 滴滴(中国)科技有限公司 | 基于Arma模型的每日订单成交量预测方法及装置 |
CN106203682A (zh) * | 2016-06-29 | 2016-12-07 | 东南大学 | 酒店一次性用品需求预测方法及订单*** |
CN106651213A (zh) * | 2017-01-03 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 服务订单的处理方法及装置 |
US20180232676A1 (en) * | 2017-02-10 | 2018-08-16 | Cimpress Schweiz Gmbh | Fulfillment Success Prediction for Product Procurement |
CN107220845A (zh) * | 2017-05-09 | 2017-09-29 | 北京小度信息科技有限公司 | 用户复购概率预测/用户质量确定方法、装置及电子设备 |
CN107292420A (zh) * | 2017-05-24 | 2017-10-24 | 国网北京市电力公司 | 数据处理方法和装置 |
CN108230049A (zh) * | 2018-02-09 | 2018-06-29 | 新智数字科技有限公司 | 订单的预测方法及*** |
CN108681857A (zh) * | 2018-05-18 | 2018-10-19 | 北京顺丰同城科技有限公司 | 一种配送订单分配方法及装置、计算机可读存储介质 |
CN108681751A (zh) * | 2018-05-22 | 2018-10-19 | 平安科技(深圳)有限公司 | 确定事件影响因素的方法及终端设备 |
CN108876056A (zh) * | 2018-07-20 | 2018-11-23 | 广东工业大学 | 一种共享自行车需求量预测方法、装置、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801690A (zh) * | 2020-12-31 | 2021-05-14 | 北京嘀嘀无限科技发展有限公司 | 一种干预特征的确定方法和装置 |
CN113393279A (zh) * | 2021-07-08 | 2021-09-14 | 北京沃东天骏信息技术有限公司 | 一种订单数量的预估方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111292105B (zh) | 一种业务需求确定方法以及装置 | |
Chen et al. | Understanding ridesplitting behavior of on-demand ride services: An ensemble learning approach | |
KR102272942B1 (ko) | 자동차 보험 답사 임무의 발표 시스템, 기기, 방법 및 판독 가능 저장매체 | |
CN105849998B (zh) | 电力需求预测装置及预测方法、供电***及记录介质 | |
US20200302322A1 (en) | Machine learning system | |
CN111325374B (zh) | 一种订单取消概率的预测方法、装置和电子设备 | |
Hancock et al. | Decision field theory: Improvements to current methodology and comparisons with standard choice modelling techniques | |
US20240194071A1 (en) | Parking area recommendation method and apparatus, and medium | |
CN110910180A (zh) | 信息推送方法、装置、电子设备和存储介质 | |
CN111724184A (zh) | 一种转化概率预测方法及装置 | |
US20200311553A1 (en) | Method, apparatus, and computer program product for identifying and compensating content contributors | |
CN112925892B (zh) | 一种对话推荐方法、装置、电子设备及存储介质 | |
CN111104585B (zh) | 一种问题推荐方法及装置 | |
Jabbari et al. | How do perceptions of safety and car ownership importance affect autonomous vehicle adoption? | |
CN111353094A (zh) | 一种信息推送方法及装置 | |
CN111680382A (zh) | 等级预测模型训练方法、等级预测方法、装置及电子设备 | |
CN111292106A (zh) | 一种业务需求影响因素确定方法以及装置 | |
CN111461379A (zh) | 一种位置预测方法以及装置 | |
CN111861538A (zh) | 信息推送方法、装置、电子设备和存储介质 | |
CN111291253B (zh) | 模型训练方法、咨询推荐方法、装置及电子设备 | |
CN111369029A (zh) | 服务选择预测方法、装置、电子设备及存储介质 | |
KR102474974B1 (ko) | 인공지능 기반 브랜드 분석 방법, 장치 및 시스템 | |
US20200311757A1 (en) | Method, apparatus, and computer program product for identifying and compensating content contributors | |
CN111611353A (zh) | 筛选方法、装置、电子设备及计算机可读存储介质 | |
CN111259229A (zh) | 一种问题推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |