CN112819523A - 结合内/外积特征交互和贝叶斯神经网络的营销预测方法 - Google Patents
结合内/外积特征交互和贝叶斯神经网络的营销预测方法 Download PDFInfo
- Publication number
- CN112819523A CN112819523A CN202110125002.3A CN202110125002A CN112819523A CN 112819523 A CN112819523 A CN 112819523A CN 202110125002 A CN202110125002 A CN 202110125002A CN 112819523 A CN112819523 A CN 112819523A
- Authority
- CN
- China
- Prior art keywords
- user
- neural network
- model
- bayesian neural
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013531 bayesian neural network Methods 0.000 title claims abstract description 58
- 230000003993 interaction Effects 0.000 title claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 27
- 238000009826 distribution Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 7
- 238000000513 principal component analysis Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 3
- 229910003460 diamond Inorganic materials 0.000 claims description 3
- 239000010432 diamond Substances 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 9
- 230000000694 effects Effects 0.000 abstract description 5
- 230000006399 behavior Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000013136 deep learning model Methods 0.000 description 8
- 230000004913 activation Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 206010068829 Overconfidence Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0244—Optimization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种结合内/外积特征交互和贝叶斯神经网络的营销预测方法,包括数据预处理步骤、数据集划分步骤、模型建立步骤和对营销活动点击的预测步骤;其在预测模型的建立过程中,通过有效利用贝叶斯推断,在贝叶斯神经神经网络中引入预测的不确定性,使贝叶斯神经网络模型具有更强的鲁棒性。并且采用内/外积结合的方法,对特征进行了交叉来提取高维隐性特征。因此,本发明可以有效扩展深度学习对于计算广告和推荐***算法问题的应用,并显著提升对用户点击行为预测的准确性。
Description
技术领域
本发明涉及人工智能在互联网营销的技术领域,更具体地,涉及一种结合内/外积特征交互和贝叶斯神经网络的营销预测方法。
背景技术
网络广告营销是借助网络营销能最大化的传播给受众人群,其借助网络平台投入广告给目标性客户。在计算广告和推荐***算法中,常用的算法包括了线性模型如逻辑回归(logistic regression,LR)、因式分解机(factorization machine,FM)等。
上述这些算法具有可解释性好和算法实施简单的特点,然而,由于算法自身较为简单,表达能力有限。因此,这些算法往往对于特征之间的高阶交互信息的抽提较为困难,从而影响算法的整体性能。
此外,随着深度学习算法在诸多领域,如自然语言处理(Natural LanguageProcessing,NLP),计算机视觉(Computer Vision,CV)等的成功应用,深度学习模型也正逐步应用于主流广告和推荐***领域。
尽管深度学习模型具有自动提取特征,以及端到端学习等诸多传统算法不具备的优点,然而,其在针对计算广告和推荐***的应用中,也存在明显如下几种弊端:
①、在绝大多数推荐***数据集中,会形成大维度的稀疏矩阵,即由0和1构成的矩阵,对基于梯度下降的深度学习模型来说,存在一定的困难;同时,大型稀疏矩阵也会造成较大的算力消耗和过大的计算时间。因此,如何在降低特征维度,同时有效提取特征的交互信息,对特征工程及算法的设计提出更高要求。
②、防止过拟合现象是深度学习算法中一个非常重要的问题。一般来说,可以采用早停机制、权值衰减、L1-L2正则化、Dropout等方法降低模型的过拟合风险。但是,对于广告营销中的精准定位和投放问题,往往还需要考虑模型中对于不确定性的度量,一个过度自信的算法决策往往无法在实际广告投放中收获很好的效益。因此,如何在网络架构中加入不确定性度量,使得算法决策的可信度更高,并有效防止过拟合,是深度学习应用于计算广告和推荐***问题应着力突破的关键技术之一。
③、传统的深度学习模型是直接通过多层全连接层完成特征的交叉和组合的,但这样的方式缺乏一定的“针对性”。
首先,全连接层并没有针对不同特征域之间进行交叉;
其次,全连接层的操作也并不是直接针对特征交叉设计的。
因此,我们需要针对具体业务,发展具有表征不同数据模式能力的深度学习模型。
发明内容
本发明的目的在于克服现有技术存在的上述缺陷,提供一种结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其包括数据预处理步骤S1、数据集划分步骤S2和模型建立步骤S3;
所述数据预处理步骤S1包括如下步骤:
步骤S11:获取用户的原始信息,并从所述用户的原始信息提取原始特征信息;其中,所述原始特征信息包括用户ID、用户手机号码归属地、任务批次号、用户当日访问DPI、用户访问DPI频次、用户访问时间和/或用户访问时长;其中,所述任务批次号表示一个日期时间段中用户的原始信息,所述用户访问DPI、用户访问DPI频次、用户访问时间和/或用户访问时长为每一个任务批次号为计量单位,所述用户当日访问DPI和用户的手机号码归属地特征为类别特征;
步骤S12:对类别特征进行处理;即对所述用户手机号码归属地特征和用户访问DPI进行One-hot编码处理;其中,所述One-hot编码处理包括:
依次按所述任务批次号将所有不同的用户访问DPI作为单独的特征展开,以及在所述任务批次号中将DPI访问频次也按照所有不同的用户访问DPI展开为DPI与用户访问DPI的频次的关系特征;
步骤S13:对连续特征进行处理;即将不同维度的访问时间和访问时长数据映射到一个统一区间,并调整数据分布近似为高斯分布;
步骤S14:采用主成分分析对髙维特征进行降维处理;
所述数据集划分步骤S2包括如下步骤:
步骤S21:预处理之后,将所述归属地特征和用户当日访问DPI是否点击的特征看作稀疏特征,将所述用户访问DPI频次定义为连续特征;
步骤S22:根据需要预测的时间点t+1之前时间序列为1,2,…t-1时间点的历史数据,形成训练集数据;而对时间点t所对应的数据作为本地验证集;
所述模型建立步骤S3包括如下步骤:
步骤S31:提供初始的贝叶斯神经网络模型,将所述训练集数据中的类别特征作为所述贝叶斯神经网络输入层的M1维特征信息,将所述M1维特征信息输入到所述贝叶斯神经网络的嵌入层进行信息抽提和降维,将所述M1维特征信息降到M2维特征信息;其中,M2小于M1,所述贝叶斯神经网络包括输入层、嵌入层、乘积层、因式分解层、全连接层和输出层;
步骤S32:将降维后的所述M2维特征加上M3维的连续特征形成M维特征,在乘积层中,对所述M维特征进行内积和外积的乘法运算,使所述M维特征的特征信息进行交互;
步骤S33:在所述因式分解层中,采用因式分解法将所述M维特征的权重矩阵做因式分解;
步骤S34:将所述M维特征的信息输入到在所述全连接层中进行训练,得到训练后的贝叶斯神经网络模型,所述贝叶斯神经网络模型为具有两个输出层神经元的用户预测模型;并采用所述本地验证集中数据对所述用户预测模型验证。
进一步地,所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法还包括步骤S35,对所述用户预测模型进行模型评价指标处理和调优处理。
进一步地,所述模型评价指标包括采用对数损失函数、相对信息增益RIG和AUC值。
进一步地,所述模型评价指标为AUC值,若所述AUC值小于一预定的阈值,再对所述用户预测模型进行模型调优处理。
进一步地,所述模型调优处理包括如下一种或几种:
①、增加批归一化,解决数据的内部协变量偏移问题;
②、在网络中增加让部分神经元在训练过程中处于休眠状态的功能;
③、调整学习率,一般会通过指数式衰减等策略调整训练过程中的学习率;
④、设置多种子训练取平均,以更好的提高由于数据方差较大引起的泛化能力不足的问题;
⑤、增加L1或者L2正则化,对损失函数施加惩罚,以降低过拟合风险;
⑥、对超参数的优化方法。
进一步地,所述对超参数的优化方法采用贝叶斯优化策略。
进一步地,对所述连续特征处理为利用RankGauss方法。
进一步地,所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,在步骤S11后,还包括对所述用户的原始信息进行异常检测与处理步骤。
进一步地,所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法还包括模型预测步骤S4,根据所述用户预测模型,得到需要预测的时间点t+1时筛选出的用户进行精准营销的任务。
进一步地,所述贝叶斯神经网络模型层级节点分布形态包括:递增型increasing、不变型constant、钻石型diamond或递减型Decreasing。
从上述技术方案可以看出,本发明的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,可以有效利用贝叶斯推断,在贝叶斯神经神经网络中引入预测的不确定性,使贝叶斯神经网络模型具有更强的鲁棒性。通过内/外积结合的方法,通过内积和外积的乘法运算对特征进行了交叉来提取高维隐性特征。该结合内/外积特征交互和贝叶斯神经网络模型可以有效扩展深度学习对于计算广告和推荐***算法问题的应用,并显著提升对用户点击行为预测的准确性。
附图说明
图1所示为本发明实施例中网络整体结构的意图
图2所示为本发明实施例中贝叶斯神经网络层级节点分布的四种形态示意图
图3所示为本发明实施例中结合内/外积特征交互和贝叶斯神经网络的营销预测方法的流程示意图
图4所示为本发明实施例中内积(A)和外积(B)操作的示意图
图5所示为本发明实施例中对权重矩阵因式分解操作示意图
图6所示为传统深度学习网络权重(左)及贝叶斯网络权重(右)的对比示意图
具体实施方式
下面结合附图1-6发明的具体实施方式作进一步的详细说明。
在下述的具体实施方式中,在详述本发明的实施方式时,为了清楚地表示本发明的结构以便于说明,特对附图中的结构不依照一般比例绘图,并进行了局部放大、变形及简化处理,因此,应避免以此作为对本发明的限定来加以理解。
需要说明的是,在以下本发明的具体实施方式中,该结合内/外积特征交互和贝叶斯神经网络的营销预测方法,是架构在贝叶斯神经网络模型的整体结构中的。请参阅图1,图1所示为本发明实施例中网络整体结构的意图。如图1所示,所述贝叶斯神经网络包括输入层(Input layer)、嵌入层(Embedding layer)、乘积层(Product layer)、因式分解层(Factorization layer)、全连接层(Fully-connected layer)和输出层(Output layer)。
具体地,输入层用于将接收的预处理后和数据集划分的特征数据,然后再经过嵌入层、乘积层和因式分解层处理,再输入全连接层和输出层。
该结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其首先是将输入原始特征信息特征中的类别特征经过独热编码(One-hot encoding)后,根据特征性质(例如,用户ID所包括的年龄和性别,DPI用户访问时间和/或用户访问时长等信息)分为不同的域(field);接着经过嵌入层嵌入处理后,通过特征间的内积或者外积进行特征信息的交互;然后通过对网络参数引入先验的高斯分布假设、通过变分推断和最小化Kullback-Leibler散度来计算后验分布得到更新后的网络权重;最后得到最终的得到神经网络模型。
与传统的利用运营商数据的数据营销领域所采用的技术相比,本发明能够通过特征工程及算法的巧妙设计,可以有效提取特征的交互信息和降低特征维度,同时,将在网络架构中加入不确定性度量,使得算法决策的可信度更高,并有效防止过拟合,从而获得了具有表征不同数据模式能力的深度学习模型(叶斯神经网络模型)。
请参阅图2,图2为本发明实施例中贝叶斯神经网络层级节点分布的四种形态示意图。如图2所示,所述贝叶斯神经网络模型层级节点分布形态包括:递增型increasing、不变型constant、钻石型diamond或递减型Decreasing。上述层级节点分布的四种形态的选择可以根据业务的不同需要进行,在此不再赘述。
请参阅图3,图3所示为本发明实施例中结合内/外积特征交互和贝叶斯神经网络的营销预测方法的流程示意图。如图3所示,稿结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其包括数据预处理步骤S1、数据集划分步骤S2、模型建立步骤S3和模型预测步骤S4。
在本发明的实施例中,数据预处理步骤非常重要,所述数据预处理步骤S1包括如下步骤:
步骤S11:获取用户的原始信息,并从所述用户的原始信息提取原始特征信息;其中,所述原始特征信息包括用户ID、用户手机号码归属地、任务批次号、用户访问DPI、用户访问DPI频次、用户访问时间和/或用户访问时长;其中,所述任务批次号表示一个日期时间段中用户的原始信息,所述用户访问DPI、用户访问DPI频次、用户访问时间和/或用户访问时长为每一个任务批次号为计量单位,所述用户访问DPI和用户的手机号码归属地特征为类别特征。
请参阅下表1,表1为预处理之前的原始数据的表格描述,以同一批次的数据为例,预处理之前的原始数据形式如下表1所示:
表1:
较佳地,在本发明的实施例中,在步骤S11中,还可以包括对所述用户的原始信息数据还需要经过异常检测与处理、类别特征处理、连续特征处理和降维处理等步骤。
异常检测与处理:在结合业务要求的过程中,对于原始数据中的缺失值、过大值等需要进行删除、填充等处理。在数据的采集过程中,由于一般用户量为百万级别,因此,采集过程中可能出现缺失情况;若缺失量较小,一般可直接进行剔除;若无法判断缺失数据是否会影响最终的模型训练效果,则一般可根据取平均数、众数、中位数等方法来填补缺失值。
另外,在数据采集中,可能还会遇到过大值的问题,比如某用户在一天之内访问了DPI上万次,这种情况一般在实际建模过程中对于提升模型的泛化能力并无特别帮助,因此,也可以采用剔除的处理,或者采用填补的方法进行相应的处理。
步骤S12:对类别特征进行处理;即对所述用户手机号码归属地特征和用户访问DPI进行One-hot编码处理;其中,所述One-hot编码处理包括依次按所述任务批次号将所有不同的用户访问DPI作为单独的特征展开,以及在所述任务批次号中将用户访问DPI频次也按照所有不同的用户访问DPI展开为DPI与用户访问DPI的频次的关系特征。
具体地,首先,可以对用户访问DPI、用户的手机号码归属地特征进行One-hot独热编码,将其展开。以用户访问DPI为例,若某个用户访问了某DPI,则记录该DPI为1,其余DPI为0;因此,若总共有10个不同的DPI,则最后会形成10列特征,并且,每一列特征中只有一个对应用户为1,其余都为0。
步骤S13:对连续特征进行处理;即将不同维度的访问时间和访问时长数据映射到一个统一区间,并调整数据分布近似为高斯分布。
步骤S14:采用主成分分析(PCA)对髙维特征进行降维处理。
具体地,从上述对类别特征的处理可知,一般经过独热编码后,会形成高维稀疏矩阵,对于贝叶斯神经网络的训练而言,这意味着在误差反向传播时,很多地方没有办法求导,这显然是不利于贝叶斯神经网络训练的。
同时,高维度特征也增加了计算开销。因此,有必要对于高维特征先进行降维处理。本领域技术人员清楚,主成分分析PCA通过求解原始数据在某投影方向的方差最大,实现降维目的;在减少特征维度的同时,还可以尽量减少原始特征包含信息的损失,以达到对所收集数据进行全面分析的目的。
经过上述步骤预处理后,数据形式请参阅下表2:
接下来,就可以执行所述数据集划分步骤S2,在本发明的实施例中,可以将用户访问DPI特征是否点击的特征看作稀疏特征,将归属地特征和用户访问DPI频数定义为连续特征。由于点击通过率(Click-Through-Rate,CTR)问题一般涉及明显的时间顺序,即需要预测的是下一个时间点用户的行为。因此,一般将其之前的历史数据,即时间序列为作为训练数据(training data);而对时间点所对应的数据进行本地验证(lidation data)。
所述数据集划分步骤S2具体包括如下步骤:
步骤S21:预处理之后,将所述归属地特征和用户当日访问DPI是否点击的特征看作稀疏特征,将所述用户访问DPI频次定义为连续特征;
步骤S22:根据需要预测的时间点t+1之前时间序列为1,2,…t-1时间点的历史数据,形成训练集数据;而对时间点t所对应的数据作为本地验证集。
然后,可以通过执行模型建立步骤S3进行所述用户预测模型的训练和验证了。在本发明的实施例中,所述用户预测模型为贝叶斯神经网络模型。
具体地,步骤S3可以具体包括:
步骤S31:提供贝叶斯神经网络初始模型,将所述训练集数据中的类别特征作为所述贝叶斯神经网络输入层的M1维特征信息,将所述M1维特征信息输入到所述贝叶斯神经网络的嵌入层进行信息抽提和降维,将所述M1维特征信息降到M2维特征信息;其中,M2小于M1。
如图1所示,所述贝叶斯神经网络包括输入层、嵌入层、乘积层、因式分解层、全连接层和输出层。假设原始特征经过预处理后,形成了N和不同的域(编号为Field1,Field2,Field3,…,FieldN)。
由于经过了独热编码的步骤,该N个域的特征(Feature1,Feature1,Feature2,Feature3,…,FeatureN)形成了髙维的稀疏矩阵。因此,首先在网络结构中添加嵌入层,对特征进行嵌入(embedding)处理,对稀疏特征信息进行一次提取和降维,得到一个低维的low-dimensional vector层。
步骤S32:将降维后的所述M2维特征加上M3维的连续特征形成M维特征,在乘积层中,对所述M维特征进行内积和外积的乘法运算,使所述M维特征的特征信息进行交互。
在所述特征降维步骤S31和S32中,所述解码器部分的输出层使用sigmoid函数作为激活函数,所述解码器部分的输出层的输出值为0和1之间的值;其余其它层的激活函数均使用ReLU激活函数。
请参阅图4,图4所示为本发明实施例中内积(A)和外积(B)操作的示意图。与现有技术的深度学习模型直接添加全连接层的操作不同,本发明还需要对上述经过嵌入处理后的特征进行内积和外积的乘法运算,对特征信息进行交互。
从图4可以看出,对外积操作得到矩阵而言,如果该矩阵只有对角线上有值,就变成了内积操作的结果,所以内积操作可以看作是外积操作的一种特殊情况。通过这种方式,就可以衡量两个不同域之间的关系。
本领域技术人员清楚,在经过对特征的内积或者外积操作后,一般模型的参数会上升。为了降低计算消耗,可采用因式分解(factorization)的方法,将大的权重矩阵转化为小的权重矩阵与该矩阵的转置的乘积。即执行步骤S33,在所述因式分解层中,采用因式分解法将所述M维特征的权重矩阵做因式分解。
请参阅图5,图5所示为本发明实施例中对权重矩阵因式分解操作示意图。上述步骤完成后,就可以执行步骤S34,即将所述M维特征的信息输入到所述全连接层中进行训练,得到训练后的贝叶斯神经网络模型,所述贝叶斯神经网络模型为具有两个输出层神经元的用户预测模型;并采用所述本地验证集中数据对所述用户预测模型验证。
请参阅图6,图6所示为传统深度学习网络权重(左)及贝叶斯网络权重(右)的对比示意图对于贝叶斯神经网络模型,其与传统的深度学习网络模型的差别之一是,网络之间的连接权重不再是一个常数,而是一种分布,并通过贝叶斯推断来求得这个分布。
在本发明的实施例中,对贝叶斯网络的算法描述可以如下:
①、从N(μ,log(1+eρ))种采样,得到网络的初始权重ω;
②、分别计算log q(ω|θ),log p(ω),log p(y|ω,x);
④、更新网络参数θ'=θ-α▽θL。
进一步地,上述模型训练完成后,所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法还包括步骤S35,对所述用户预测模型进行模型评价指标处理和调优处理。
所述模型评价指标包括通常可以所述模型评价指标包括采用对数损失函数(Logloss)、相对信息增益(Relative Information Gain,RIG)和AUC(Area under ROC curve)值。一般来说,AUC值越接近1,则用户预测模型的分类效果越好。
例如,在对数据按照上述步骤处理并通过模型训练后,通过本地验证的AUC值,可以判断该模型的训练效果;所述模型评价指标为AUC值小于一预定的阈值,再对所述用户预测模型进行模型调优处理,若效果较差,一般需要对模型进行调优,对于深度学习算法,一般可从如下几方面进行优化:
①、增加批归一化(Batch Normalization),解决数据的内部协变量偏移问题(Internal Covariate Shift)。
②、在网络中增加Dropout(神经元休眠个数),即让部分神经元在训练过程中处于休眠状态。
③、调整学习率,一般会通过指数式衰减等策略调整训练过程中的学习率。
④、设置多种子训练取平均,降低训练过程中的过拟合风险。
⑤、增加L1或者L2正则化,对损失函数施加惩罚,以降低过拟合风险。
⑥、超参数的优化方法。
在对超参数的优化方法上,一般可以采用网格搜索(Grid Search)或者随机搜索(Random Search);但上述两种方法对于计算资源的消耗较大,且效率不高。在本发明的实施例中,采用贝叶斯优化(Bayesian Optimization)策略。贝叶斯优化通过高斯过程回归计算前面n个数据点的后验概率分布,得到每一个超参数在每一个取值点的均值和方差;贝叶斯优化通过均衡均值和方差,根据超参数间的联合概率分布,最终选择一组较好的超参数。
上述所有处理步骤完成后,就可以通过将上述特征带入用户预测模型,能够提前在广告投放之前就筛选出意愿较高的部分用户,并对这些用户进行营销广告的精准投放。
即本发明还可以包括模型预测步骤S4,根据所述用户预测模型,得到需要预测的时间点t+1时筛选出的用户进行精准营销的任务。
结果表明,本用户预测模型算法选出的高意愿用户的点击率是低意愿用户点击率的10倍左右。通过该用户预测模型,可以将大量的低意愿用户直接从投放目标中筛出,从而节省大量的营销成本,实现利润率的增加。
以上所述的仅为本发明的优选实施例,所述实施例并非用以限制本发明的专利保护范围,因此凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (10)
1.一种结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,包括数据预处理步骤S1、数据集划分步骤S2和模型建立步骤S3;
所述数据预处理步骤S1包括如下步骤:
步骤S11:获取用户的原始信息,并从所述用户的原始信息提取原始特征信息;其中,所述原始特征信息包括用户ID、用户手机号码归属地、任务批次号、用户当日访问DPI、用户访问DPI频次、用户访问时间和/或用户访问时长;其中,所述任务批次号表示一个日期时间段中用户的原始信息,所述用户访问DPI、用户访问DPI频次、用户访问时间和/或用户访问时长为每一个任务批次号为计量单位,所述用户当日访问DPI和用户的手机号码归属地特征为类别特征;
步骤S12:对类别特征进行处理;即对所述用户手机号码归属地特征和用户访问DPI进行One-hot编码处理;其中,所述One-hot编码处理包括:
依次按所述任务批次号将所有不同的用户访问DPI作为单独的特征展开,以及在所述任务批次号中将DPI访问频次也按照所有不同的用户访问DPI展开为DPI与用户访问DPI的频次的关系特征;
步骤S13:对连续特征进行处理;即将不同维度的访问时间和访问时长数据映射到一个统一区间,并调整数据分布近似为高斯分布;
步骤S14:采用主成分分析对髙维特征进行降维处理;
所述数据集划分步骤S2包括如下步骤:
步骤S21:预处理之后,将所述归属地特征和用户当日访问DPI是否点击的特征看作稀疏特征,将所述用户访问DPI频次定义为连续特征;
步骤S22:根据需要预测的时间点t+1之前时间序列为1,2,…t-1时间点的历史数据,形成训练集数据;对时间点t所对应的数据作为验证集;
所述模型建立步骤S3包括如下步骤:
步骤S31:提供贝叶斯神经网络初始模型,将所述训练集数据中的类别特征作为所述贝叶斯神经网络输入层的M1维特征信息,将所述M1维特征信息输入到所述贝叶斯神经网络的嵌入层进行信息抽提和降维,将所述M1维特征信息降到M2维特征信息;其中,M2小于M1,所述贝叶斯神经网络包括输入层、嵌入层、乘积层、因式分解层、全连接层和输出层;
步骤S32:将降维后的所述M2维特征加上M3维的连续特征形成M维特征,在乘积层中,对所述M维特征进行内积和外积的乘法运算,使所述M维特征的特征信息进行交互;
步骤S33:在所述因式分解层中,采用因式分解法将所述M维特征的权重矩阵做因式分解;
步骤S34:将所述M维特征的信息输入到在所述全连接层中进行训练,得到训练后的贝叶斯神经网络模型,所述贝叶斯神经网络模型为具有两个输出层神经元的用户预测模型;并采用所述本地验证集中数据对所述用户预测模型验证。
2.根据权利要求1所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,还包括步骤S35,对所述用户预测模型进行模型评价指标处理和调优处理。
3.根据权利要求2所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,所述模型评价指标包括采用对数损失函数、相对信息增益RIG和AUC值。
4.根据权利要求3所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,所述模型评价指标为AUC值,若所述AUC值小于一预定的阈值,再对所述用户预测模型进行模型调优处理。
5.根据权利要求2所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,所述模型调优处理包括如下一种或几种:
增加批归一化,解决数据的内部协变量偏移问题;
在网络中增加让部分神经元在训练过程中处于休眠状态的功能;
调整学习率,一般会通过指数式衰减等策略调整训练过程中的学习率;
设置多种子训练取平均,以更好的提高由于数据方差较大引起的泛化能力不足的问题;
增加L1或者L2正则化,对损失函数施加惩罚,以降低过拟合风险;
对超参数的优化方法。
6.根据权利要求5所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,所述对超参数的优化方法采用贝叶斯优化策略。
7.根据权利要求1所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,对所述连续特征处理为利用RankGauss方法。
8.根据权利要求1所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,在步骤S11后,还包括对所述用户的原始信息进行异常检测与处理步骤。
9.根据权利要求1所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,还包括模型预测步骤S4,根据所述用户预测模型,得到需要预测的时间点t+1时筛选出的用户进行精准营销的任务。
10.根据权利要求1所述的结合内/外积特征交互和贝叶斯神经网络的营销预测方法,其特征在于,所述贝叶斯神经网络模型层级节点分布形态包括:递增型increasing、不变型constant、钻石型diamond或递减型Decreasing。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125002.3A CN112819523B (zh) | 2021-01-29 | 2021-01-29 | 结合内/外积特征交互和贝叶斯神经网络的营销预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125002.3A CN112819523B (zh) | 2021-01-29 | 2021-01-29 | 结合内/外积特征交互和贝叶斯神经网络的营销预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819523A true CN112819523A (zh) | 2021-05-18 |
CN112819523B CN112819523B (zh) | 2024-03-26 |
Family
ID=75860166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110125002.3A Active CN112819523B (zh) | 2021-01-29 | 2021-01-29 | 结合内/外积特征交互和贝叶斯神经网络的营销预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819523B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240025A (zh) * | 2021-05-19 | 2021-08-10 | 电子科技大学 | 一种基于贝叶斯神经网络权重约束的图像分类方法 |
CN113344615A (zh) * | 2021-05-27 | 2021-09-03 | 上海数鸣人工智能科技有限公司 | 一种基于gbdt和dl融合模型的营销活动预测方法 |
TWI773507B (zh) * | 2021-09-01 | 2022-08-01 | 國立陽明交通大學 | 預測系統可靠度之方法與裝置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090138386A1 (en) * | 2007-11-26 | 2009-05-28 | Wachovia Corporation | Interactive statement |
US20120310737A1 (en) * | 2011-06-03 | 2012-12-06 | Korea Advanced Institute Of Science And Technology | Method for providing advertisement, computer-readable medium including program for performing the method and advertisement providing system |
WO2019018533A1 (en) * | 2017-07-18 | 2019-01-24 | Neubay Inc | NEURO-BAYESIAN ARCHITECTURE FOR THE IMPLEMENTATION OF GENERAL ARTIFICIAL INTELLIGENCE |
CN109831801A (zh) * | 2019-01-04 | 2019-05-31 | 东南大学 | 基于深度学习神经网络的用户行为预测的基站缓存算法 |
CN110619540A (zh) * | 2019-08-13 | 2019-12-27 | 浙江工业大学 | 一种神经网络的点击流预估方法 |
CN110956497A (zh) * | 2019-11-27 | 2020-04-03 | 桂林电子科技大学 | 一种电子商务平台用户重复购买行为预测方法 |
CN112149352A (zh) * | 2020-09-23 | 2020-12-29 | 上海数鸣人工智能科技有限公司 | 一种结合gbdt自动特征工程对营销活动点击的预测方法 |
CN112258223A (zh) * | 2020-10-13 | 2021-01-22 | 上海数鸣人工智能科技有限公司 | 一种基于决策树的营销广告点击的预测方法 |
-
2021
- 2021-01-29 CN CN202110125002.3A patent/CN112819523B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090138386A1 (en) * | 2007-11-26 | 2009-05-28 | Wachovia Corporation | Interactive statement |
US20120310737A1 (en) * | 2011-06-03 | 2012-12-06 | Korea Advanced Institute Of Science And Technology | Method for providing advertisement, computer-readable medium including program for performing the method and advertisement providing system |
WO2019018533A1 (en) * | 2017-07-18 | 2019-01-24 | Neubay Inc | NEURO-BAYESIAN ARCHITECTURE FOR THE IMPLEMENTATION OF GENERAL ARTIFICIAL INTELLIGENCE |
CN109831801A (zh) * | 2019-01-04 | 2019-05-31 | 东南大学 | 基于深度学习神经网络的用户行为预测的基站缓存算法 |
CN110619540A (zh) * | 2019-08-13 | 2019-12-27 | 浙江工业大学 | 一种神经网络的点击流预估方法 |
CN110956497A (zh) * | 2019-11-27 | 2020-04-03 | 桂林电子科技大学 | 一种电子商务平台用户重复购买行为预测方法 |
CN112149352A (zh) * | 2020-09-23 | 2020-12-29 | 上海数鸣人工智能科技有限公司 | 一种结合gbdt自动特征工程对营销活动点击的预测方法 |
CN112258223A (zh) * | 2020-10-13 | 2021-01-22 | 上海数鸣人工智能科技有限公司 | 一种基于决策树的营销广告点击的预测方法 |
Non-Patent Citations (6)
Title |
---|
何慧;: "基于Ranking的贝叶斯序列推荐算法", 小型微型计算机***, no. 07 * |
刘振鹏;尹文召;王文胜;孙静薇;: "HRS-DC:基于深度学习的混合推荐模型", 计算机工程与应用, no. 14 * |
吴英: "基于贝叶斯方法的网络广告预测模型研究", 中国优秀硕士学位论文 * |
夏国恩;金炜东;: "基于支持向量机的客户流失预测模型", ***工程理论与实践, no. 01 * |
李诗文;潘善亮;: "基于注意力机制的神经网络贝叶斯群组推荐算法", 计算机应用与软件, no. 05 * |
陈巧红;董雯;孙麒;贾宇波;: "基于门控循环单元神经网络的广告点击率预估", 浙江理工大学学报(自然科学版), no. 05 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240025A (zh) * | 2021-05-19 | 2021-08-10 | 电子科技大学 | 一种基于贝叶斯神经网络权重约束的图像分类方法 |
CN113240025B (zh) * | 2021-05-19 | 2022-08-12 | 电子科技大学 | 一种基于贝叶斯神经网络权重约束的图像分类方法 |
CN113344615A (zh) * | 2021-05-27 | 2021-09-03 | 上海数鸣人工智能科技有限公司 | 一种基于gbdt和dl融合模型的营销活动预测方法 |
CN113344615B (zh) * | 2021-05-27 | 2023-12-05 | 上海数鸣人工智能科技有限公司 | 一种基于gbdt和dl融合模型的营销活动预测方法 |
TWI773507B (zh) * | 2021-09-01 | 2022-08-01 | 國立陽明交通大學 | 預測系統可靠度之方法與裝置 |
Also Published As
Publication number | Publication date |
---|---|
CN112819523B (zh) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112819523B (zh) | 结合内/外积特征交互和贝叶斯神经网络的营销预测方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及*** | |
CN112967088A (zh) | 基于知识蒸馏的营销活动预测模型结构和预测方法 | |
CN113344615B (zh) | 一种基于gbdt和dl融合模型的营销活动预测方法 | |
US10963802B1 (en) | Distributed decision variable tuning system for machine learning | |
CN113591971B (zh) | 基于dpi时间序列词嵌入向量的用户个性行为预测方法 | |
CN110619540A (zh) | 一种神经网络的点击流预估方法 | |
CN110110372B (zh) | 一种用户时序行为自动切分预测方法 | |
CN113255844B (zh) | 基于图卷积神经网络交互的推荐方法及*** | |
CN111611488A (zh) | 基于人工智能的信息推荐方法、装置、电子设备 | |
CN112258223B (zh) | 一种基于决策树的营销广告点击的预测方法 | |
Grob et al. | A recurrent neural network survival model: Predicting web user return time | |
CN111178986A (zh) | 用户-商品偏好的预测方法及*** | |
CN111428181A (zh) | 一种基于广义加性模型结合矩阵分解的银行理财产品推荐方法 | |
CN112581177B (zh) | 结合自动特征工程及残差神经网络的营销预测方法 | |
CN113256024B (zh) | 一种融合群体行为的用户行为预测方法 | |
CN113360772B (zh) | 一种可解释性推荐模型训练方法与装置 | |
CN111984842B (zh) | 银行客户数据处理方法及装置 | |
CN111815066B (zh) | 一种基于梯度提升决策树的用户点击预测方法 | |
CN115293800A (zh) | 基于阴影特征筛选的针对互联网点击率预测的预测方法 | |
KR102343579B1 (ko) | 부모예측모형을 이용한 서비스 제공 방법 | |
CN113793187B (zh) | 基于实例权重平衡和双重注意力的点击率预测方法及*** | |
CN115271784A (zh) | 基于遗传算法进行特征交互和伪标签学习的点击预测方法 | |
CN115935178A (zh) | 基于无标签样本学习的预测集成建模方法 | |
CN115271823A (zh) | 基于dpi共现关系特征的半监督用户行为预估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 200436 room 406, 1256 and 1258 Wanrong Road, Jing'an District, Shanghai Applicant after: Shanghai Shuming Artificial Intelligence Technology Co.,Ltd. Address before: Room 1601-026, 238 JIANGCHANG Third Road, Jing'an District, Shanghai, 200436 Applicant before: Shanghai Shuming Artificial Intelligence Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |