CN114049155A - 基于大数据分析的营销运营方法、*** - Google Patents

基于大数据分析的营销运营方法、*** Download PDF

Info

Publication number
CN114049155A
CN114049155A CN202111364439.9A CN202111364439A CN114049155A CN 114049155 A CN114049155 A CN 114049155A CN 202111364439 A CN202111364439 A CN 202111364439A CN 114049155 A CN114049155 A CN 114049155A
Authority
CN
China
Prior art keywords
data
model
prediction
time sequence
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111364439.9A
Other languages
English (en)
Other versions
CN114049155B (zh
Inventor
张蕾
唐金格
汪冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Huakun Daowei Data Technology Co ltd
Original Assignee
Zhejiang Huakun Daowei Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Huakun Daowei Data Technology Co ltd filed Critical Zhejiang Huakun Daowei Data Technology Co ltd
Priority to CN202111364439.9A priority Critical patent/CN114049155B/zh
Publication of CN114049155A publication Critical patent/CN114049155A/zh
Application granted granted Critical
Publication of CN114049155B publication Critical patent/CN114049155B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据分析的营销运营方法,包括:营销运营***根据商家输入的数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充;然后,基于多元时间序列数据预测模型的输出数据,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分,并根据电商时序数据,利用预先训练的加权融合模型预测用户购买意向;最终,营销运营***将用户画像聚类结果和购买意向预测结果通过智能终端展示给商家。本发明通过向商家提供营销运营***,降低了商家应用大数据分析拓展客群的营销成本,同时通过改进的算法对电商时序数据作缺失值填充、用户画像聚类以及购买意向预测,提升了数据分析结果的准确度。

Description

基于大数据分析的营销运营方法、***
技术领域
本发明涉及数据分析技术领域,具体涉及一种基于大数据分析的营销运营方法、***。
背景技术
随着网络购物的快速发展,电商领域的订单数量呈现爆发式增长,传统的借助人工的销售手段已经难以帮助商家快速且精准的寻找到客户并占领市场。在大数据时代的当下,各行各业的商家开始重视起数据的应用,以形成新的营销策略,精准拓展客户。
借助大数据分析技术,对网络购物订单数据进行采集和数据清洗等处理后,再利用大数据算法进行用户画像、分析用户购物需求,使市场营销的成本大大降低。然而这种新的商业模式应用门槛较高,应用范围还比较局限,虽然部分电商平台的交易数据接口会对商家开放,但是大多数商家没有能力有效利用这些数据进行精准营销。且现有的部分电商数据分析算法虽分析精度较高,但算法本身过于复杂,开发难度大,使用成本较高,不适合中小商家使用,要么算法不够先进,所作出的数据分析结果精确度不高,使用价值不大。
发明内容
本发明以降低商家应用大数据分析拓展客群的营销成本,同时确保数据分析结果的准确度为目的,提供了一种基于大数据分析的营销运营方法、***。
为达此目的,本发明采用以下技术方案:
提供一种基于大数据分析的营销运营方法,包括:
营销运营***根据商家输入的数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充;
然后,基于所述多元时间序列数据预测模型的输出数据,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分;
并根据所述电商时序数据,利用预先训练的加权融合模型预测用户购买意向;
最终,所述营销运营***将用户画像聚类结果和购买意向预测结果通过智能终端展示给商家。
优选地,所述多元时间序列数据预测模型的训练方法包括:
步骤A1,迭代训练用于对所述电商时序数据作数据分类的分类器,所述电商时序数据包括用户行为明细时序数据、电商交易明细时序数据、用户投放行为明细时序数据和营销行为明细时序数据中的任意一种或多种;
步骤A2,将所述电商时序数据输入到所述分类器中,以所述分类器的输出为GAN网络中生成器的训练样本,以所述生成器的输入和输出为GAN网络中判别器的训练样本,通过所述判别器引导所述生成器的训练,直至满足训练终止条件,得到完成训练的所述生成器和所述判别器;
步骤A3,将所述分类器、所述生成器和所述判别器融合为所述多元时间序列数据预测模型。
3.根据权利要求2所述的基于大数据分析的营销运营方法,其特征在于,对所述分类器进行迭代训练的终止条件通过以下公式(1)表达:
|Lk-Lk-1|≤T 公式(1)
公式(1)中,Lk表示对经第k次迭代后的所述分类器的性能评估值;
Lk-1表示第k-1次迭代后的所述分类器的性能评估值;
T表示分类器的性能评估值变化幅度阈值;
Lk、Lk-1分别通过以下公式(2)-(3)计算而得:
Figure BDA0003360374340000021
Figure BDA0003360374340000022
公式(2)-(3)中,c0表示所述分类器初次对所述电商时序数据的分类结果的置信度;
ck表示经k次迭代后的所述分类器对所述电商时序数据的分类结果的置信度;
ck-1表示经k-1次迭代后的所述分类器对所述电商时序数据的分类结果的置信度;
0表示初始电商时序数据进行分类预测的数据噪声率;
k表示经k次迭代后的所述分类器对所述电商时序数据进行分类预测的数据噪声率;
k-1表示经k-1次迭代后的所述分类器对所述电商时序数据进行分类预测的数据噪声率;
优选地,使用训练样本对判别器的目标函数作最大化学习到所述判别器的参数后完成对所述判别器的训练,判别器的目标函数通过以下公式(4)表达:
Figure BDA0003360374340000023
公式(4)中,V(D)表示所述判别器的目标函数;
i表示预测的第i个时间序列数据;
k表示时间序列数据的个数;
D(x)表示所述判别器对真样本x判断为真的概率;
0.9-D(G(z))表示所述判别器对假样本G(z)判断为假的概率;
G(z)表示所述分类器对输入的所述电商时序数据作分类预测后输出的所述电商时序数据;
优选地,使用训练样本对生成器的目标函数作最大化学习到所述生成器的参数后完成对所述生成器的训练,所述生成器的目标函数通过以下公式(5)表达:
Figure BDA0003360374340000031
公式(5)中,V(G(表示所述生成器的目标函数;
i表示预测的第i个时间序列数据;
k表示时间序列数据的个数;
α表示超参数,为|x-G(x)|所占比重;
x表示输入所述生成器的真样本;
G(z)表示所述分类器对输入的所述电商时序数据作分类预测后输出的所述电商时序数据;
|x-G(z)|表示x与G(z)之间距离的度量;
β表示超参数,为log(0.9-D(G(z)))所占比重;
0.9-D(G(z))表示所述判别器对假样本G(z)判断为假的概率;
优选地,用户的数据维度包括基本维度、社会维度、消费维度中的任意一种或多种,其中,用户的基本维度包括性别属性、年龄属性、地区属性中的任意一种或多种;社会维度包括家庭属性、工作属性、社会特征属性中的任意一种或多种;消费维度包括消费水平属性、消费行为属性、消费心理属性中的任意一种或多种。
优选地,利用改进的所述WFCM聚类算法对用户作多维度的画像聚类划分的方法包括:
步骤B1,确定对用户作画像聚类的分类数、隶属度因子m和迭代次数;
步骤B2,初始化样本隶属度uij
步骤B3,计算以样本点i为中心的中心密度值pi,并根据所述样本隶属度uij和所述中心密度值pi计算聚类中心cj
步骤B4,根据所述聚类中心cj构建WFCM聚类中心目标函数J;
步骤B5,根据步骤B3计算的所述聚类中心cj更新计算所述样本隶属度uij,然后返回所述步骤B3,直至达到迭代次数。
优选地,所述中心密度值pj通过以下公式(6)计算而得:
Figure BDA0003360374340000041
公式(6)中,n*表示中心密度值计算范围内的样本点数量;
odiz表示样本点i到样本点z的欧式距离;
odiz通过以下公式(7)计算而得:
Figure BDA0003360374340000042
公式(7)中,kis表示样本点i的特征向量ki中的第s个元素的元素值;
kzs表示样本点z的特征向量kz中的第s个元素的元素值;
ws表示样本点的特征向量中的第s个元素的特征权重变量;
d表示样本点的特征向量中的元素个数;
优选地,步骤B3中,对所述中心密度值pi进行归一化后再结合所述样本隶属度uij计算所述聚类中心cj,所述聚类中心cj通过以下公式(8)计算而得:
Figure BDA0003360374340000043
公式(8)中,pi *表示对所述中心密度值pi进行归一化后的值,pi *满足以下两个约束条件:
Figure BDA0003360374340000044
0≤pi *≤1
n表示总的样本点数量;
c表示聚类的类别数;
uij m表示表示样本点i相对于簇j的隶属度;
优选地,步骤B4中的所述目标函数J通过以下公式(9)表达:
Figure BDA0003360374340000051
优选地,步骤B5中,通过以下公式(10)更新计算所述样本隶属度uij
Figure BDA0003360374340000052
公式(10)中,r表示不等于j的聚类中心;
||ki-cj||表示ki与cj之间的欧式距离;
‖ki-cr‖表示ki与cr之间的欧式距离;
优选地,训练所述加权融合模型的方法包括:
步骤C1,将作为训练样本的电商交易明细特征数据输入给核岭回归模型作购买意向预测,并计算所述核岭回归模型的预测误差,记为ε1
步骤C2,以所述核岭回归模型的输出作为新的数据特征输入到套索回归模型中继续对用户作购买意向预测,并计算所述套索回归模型的预测误差,记为ε2
步骤C3,以所述套索回归模型的输出作为新的数据特征输入到基于基尼系数的决策树模型中继续对用户作购买意向预测,并计算所述决策树模型的预测误差,记为ε3
步骤C4,以所述决策树模型的输出作为新的数据特征输入到随机森林模型中继续对用户作购买意向预测,并计算所述随机森林模型的预测误差,记为ε4
步骤C5,以所述随机森林模型的输出作为新的数据特征输入到LightGBM模型中继续对用户作购买意向预测,并计算所述LightGBM模型的预测误差,记为ε5
步骤C6,根据预测误差更新各模型的训练参数,并重复步骤C1-C5进行k次迭代训练后计算各模型k次预测结果的平均误差;
步骤C7,根据各模型k次预测结果的平均误差,计算每个模型对购买意向预测结果的影响权重;
步骤C8,计算各模型对购买意向结果的影响权重与第k次模型预测结果的乘积并求和,所得和值作为所述加权融合模型对第k次预测时模型输入的预测结果,并计算所述加权融合模型的预测误差;
步骤C9,判断步骤C8所得预测结果的误差是否小于预设的误差阈值,
若是,则终止对所述加权融合模型的迭代训练;
若否,则返回步骤C1继续对所述加权融合模型进行迭代训练;
优选地,步骤C7中,每个模型对购买意向预测结果的影响权重通过以下公式(11)计算而得:
Figure BDA0003360374340000061
公式(11)中,wik表示经k次迭代训练后的第i个模型对购买意向预测结果的影响权重;
εik表示第i个模型在k次用户购买意向预测中的平均误差;
Sk表示各模型的平均误差的和值。
本发明还提供了一种基于大数据分析的营销运营***,可实现所述的基于大数据分析的营销运营方法,所述营销运营***包括:
数据分析指令输入模块,用于提供给商家输入数据分析指令;
数据分类及缺失值填充模块,连接所述数据分析指令输入模块,用于根据所述数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充;
用户聚类模块,连接所述数据分类及缺失值填充模块,用于基于所述多元时间序列数据预测模型的输出数据,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分;
用户购买意向预测模块,连接所述数据分类及缺失值填充模块,用于根据所述电商时序数据,利用预先训练的加权融合模型预测用户购买意向。
本发明具有以下有益效果:
1、通过营销运营***向商家提供了一个精准营销的“窗口”,商家只需要向营销运营***输入数据分析指令,***便开始基于输入的电商时序数据自动对用户作多维度的画像聚类划分并预测用户的购买意向,然后将画像聚类结果和购买意向预测结果展示给用户,有利于商家根据画像聚类结果和购买意向预测结果挖掘潜在客户,获得更多利润。
2、通过多元时间序列数据预测模型实现了对电商时序数据的缺失值预测和自动填充,后续对用户作画像聚类划分和购买意向预测时以缺失值填充后的电商时序数据为数据分析对象,有利于提升画像聚类和购买意向预测的准确度。
3、通过改进的WFCM聚类算法对用户作多维度的画像聚类划分,进一步提升了画像聚类的准确度。
4、利用加权融合模型预测用户购买意向,提升了购买意向预测的准确度。
5、本发明提供的多元时间序列数据预测模型、WFCM聚类算法以及加权融合模型是基于现有算法改进而来的,算法应用成本较低,降低了商家使用本发明提供的营销运营***的成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是多元时间序列数据预测模型的训练方法的实现步骤图;
图2是利用改进的WFCM聚类算法对用户作多维度的画像聚类划分的方法步骤图;
图3是训练加权融合模型的方法步骤图;
图4是本发明一实施例提供的基于大数据分析的营销运营***的结构示意图;
图5是多元时间序列数据预测模型对缺失值进行预测、填充的流程图;
图6是训练多元时间序列数据预测模型的RGAN网络的结构图;
图7加权融合模型预测用户购买行为的示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明实施例提出的一种基于大数据分析的营销运营方法的具体技术方案如下:
首先,营销运营***根据商家输入的数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充,以提高数据可用性;电商时序数据的输入方法可以是商家从电商平台获取数据后人为输入,或者利用营销运营***提供的接口对接功能与电商平台作数据接口对接后,由营销运营***根据商家输入的数据获取指令自动从电商平台中获取电商数据并整合后形成为电商时序数据;
然后,营销运营***基于多元时间序列数据预测模型的输出数据(经缺失值填充后的电商时序数据),利用改进的WFCM聚类算法对用户作多维度(维度包括用户的基本维度、社会维度、消费维度中的任意一种或多种,用户的基本维度又包括性别属性、年龄属性、地区属性中的任意一种或多种;社会维度包括家庭属性、工作属性、社会特征属性中的任意一种或多种;消费维度包括消费水平属性、消费行为属性、消费心理属性中的任意一种或多种)的画像聚类划分,协助商家在不同维度下进行CRM客户管理。
同时,营销运营***还根据电商时序数据,利用预先训练的加权融合模型预测用户的购买意向,挖掘高潜力客户群体,提升客户忠诚度和消费粘度,助力精准营销。
电商数据包括用户的基本信息数据和电商交易明细数据。营销运营***从电商平台获取到关联商家的这些电商数据后接入***的数据集成平台进行加密,加密后的数据存储在Hive(数据仓库工具)中。本发明中,Hive采用5层结构,分别为ODS层、DWD层、DWM层、DWS层和ADS层。
第一层ODS层为原始数据层,用于存放获取的原始电商数据;
第二层DWD层为数据明细层,用于存放清洗后的电商数据(主要包括用户行为明细数据、电商交易明细数据、用户投放行为明细数据(具体投放给哪些用户以营销信息)、营销行为明细数据)。本发明中,清洗数据主要指对数据作缺失值填充。缺失值是数据分析中常见的问题。特别是在电商数据中,由于电商数据量大,且来源复杂,因此缺失值不可避免。为保证用户数据的完整程度,提高数据的可利用性,正确处理缺失值至关重要。
传统的缺失值填充方法主要有均值填充、众数填充或中值填充等,但是这些方法都没有考虑数据间的时序关系对缺失值填充数值的影响,填充效果并不理想,甚至适得其反。在精准营销中,时序因素对电商数据投放效果的影响很大。因此,本发明针对电商数据的时序特征,创新提出了基于改进的RGAN(RelativisticGAN)算法来预测、填充缺失值。以下对本发明提供的缺失值预测、填充方法进行具体阐述:
在原始的GAN网络中,生成器将随机噪声向量作为输入,并将随机噪声映射为与真实数据分布相似的时间序列映射。判别器用于区分真实数据和生成数据样本,并输出样本是否是来自真实数据的概率值。GAN通过博弈的方式对目标函数进行优化,当生成器与判别器达到“纳什均衡”时完成网络训练。
在本发明中,由于待填充的部分是确定的电商明细时序数据值,因此要将随机噪声替换为时序数据,即生成器的输入为某时段的电商时间序列数据(简称电商时序数据),输出为预测的电商时序数据;判别器的输入为真实的电商时序数据和生成器预测的电商时序数据,输出为时序样本为真实电商时序数据的概率。
以下结合图1和图5对多元时间序列数据预测模型的训练过程以及模型填充缺失值的方法作具体阐述:
为了提高缺失值预测的准确度,在多元时间序列数据预测模型(训练多元时间序列数据预测模型的RGAN网络的结构请参照图6)中,我们首先训练一个时间序列分类器,分类器输出的结果将代替传统的随机序列(随机噪声向量)输入。首先对带标签的电商数据进行特征提取,并训练一个初始分类器,利用初始分类器对标签数据进行分类预测。本发明评估初始分类器性能的函数设置为L,具体为:
L=c0(1-2ε)2
c0表示对标签样本的分类预测结果的置信度;
ε表示数据噪声率,即电商数据中的噪声数据占总数据量的比例。初始分类器的输出作为下一个分类器的输入,从而实现自我迭代训练,第k次数据更新后得到的分类器性能评估函数Lk表达为:
Figure BDA0003360374340000091
第k-1次数据更新后得到的分类器性能评估函数Lk-1表达为:
Figure BDA0003360374340000092
c0表示分类器初次对电商时序数据的分类结果的置信度;
ck表示经k次迭代后的所述分类器对所述电商时序数据的分类结果的置信度;
ck-1表示经k-1次迭代后的所述分类器对所述电商时序数据的分类结果的置信度;
0表示初始电商时序数据进行分类预测的数据噪声率;
k表示经k次迭代后的所述分类器对所述电商时序数据进行分类预测的数据噪声率;
k-1表示经k-1次迭代后的所述分类器对所述电商时序数据进行分类预测的数据噪声率;
当|Lk-Lk-1|≤T(T表示分类器的性能评估值变化幅度阈值)时,分类器的迭代训练结束,最后再经过一层全连接层输出完成分类预测的电商时序数据(用G(z)表示)。本发明中,电商时序数据包括用户行为明细时序数据、电商交易明细时序数据、用户投放行为明细和用户投放行为明细时序数据。
接着,将分类器预测的k个电商时序数据G(z)输入到判别器(用D表示)中,判别器D的目标函数为:
Figure BDA0003360374340000101
V(D)表示判别器的目标函数;
i表示第i次迭代训练判别器;
k表示迭代训练判别器的次数;
D(x)表示判别器对真样本(真实数据样本)x判断为真的概率;
0.9-D(G(z))表示判别器对假样本G(z)判断为假的概率;这里设置为0.9-D(G(z))而不是设置为1-D(G(z))是为了将标签数据作单边平滑处理,以减少过拟合的风险。我们的目标是使判别器尽可能将真样本判断为真,同时尽可能将假的样本判断为假,也就是要最大化目标函数。另外,本发明采用Adam算法更新判别器的参数θ:
Figure BDA0003360374340000102
生成器(用G表示)的目标函数设置为:
Figure BDA0003360374340000103
i表示预测的第i个时间序列数据;
k表示时间序列数据的个数;
α表示超参数,为|x-G(x)|所占比重;
x表示输入所述生成器的真样本;
G(z)表示所述分类器对输入的所述电商时序数据作分类预测后输出的所述电商时序数据;
|x-G(z)|表示x与G(z)之间距离的度量;
β表示超参数,为log(0.9-D(G(z)))所占比重;
同样的,本发明采用Adam算法更新生成器的参数θ:
Figure BDA0003360374340000111
本发明训练多元时间序列数据预测模型采用的RGAN网络的网络结构如图6所示。图6中的FC是全连接层,GRU为门控循环神经网络单元,使用全连接层的目的是使输入的电商时序数据的维度与GRU相同。GRU单元提取输入的电商时序数据的特征,最后一个GRU单元的输出作为全连接层FC的输入,全连接层FC将电商时序数据映射为一维,最后经过sigmoid函数输出0-1的概率值,来衡量数据来自真实电商时序数据的可能性。
简而言之,本发明训练多元时间序列数据预测模型的方法如图1所示,包括:
步骤A1,迭代训练用于对电商时序数据作数据分类的分类器,电商时序数据包括用户行为明细时序数据、电商交易明细时序数据、用户投放行为明细时序数据和营销行为明细时序数据中的任意一种或多种;
步骤A2,将电商时序数据输入到分类器中,以分类器的输出为GAN网络中生成器的训练样本,以生成器的输入和输出为GAN网络中判别器的训练样本,通过判别器引导生成器的训练,直至满足训练终止条件(终止条件为判别器和生成器在k次和k-1次迭代训练时目标函数的值基本不变,即表示目标函数值已最大化,达到了终止迭代训练的条件),得到完成训练的生成器和判别器;
步骤A3,将分类器、生成器和判别器融合为多元时间序列数据预测模型,融合方法为现有不做具体阐述。
多元时间序列数据预测模型训练好后,对电商时序数据中是否存在确实的数据进行预测并对缺失值进行填充。填充后针对数据投放效果对模型的缺失值填充性能进行评估,并根据评估结果调整模型参数对模型进行更新优化。
经数据清洗后的电商时序数据将在第三层DWM层(数据中间层)进行加工分类,依据数据来源不同划分为个人基础属性明细数据和不同行业属性明细数据(如电商行业、金融行业、游戏行业等)。
第四层DWS层为数据服务层。DWS层存放的是经过标签赋予的标签数据,包括用户基础标签、用户属性标签、行业标签等。其中,电商行业数据标签还包括社会属性、消费水平、消费行为、消费心理标签等。如电商交易明细数据中的“金额”经过平均值计算后可以得到赋予该用户相应的消费水平标签。
最后一层ADS层为数据应用层。在数据应用层,本发明提供的营销运营***运用大数据分析技术,通过机器学习建模构建用户画像,精准把握用户的需求及特征,精确筛选高潜力目标客户群体,以帮助商户作更有针对性的营销。
针对用户画像,本发明在现有的WFCM聚类算法上,提出了一种基于特征+密度权重改进的WFCM聚类算法对用户作多维度的画像。多维度包括用户基本维度、社会维度、消费维度,每个维度下又包括3个属性,其中用户基本维度包括性别属性、年龄属性、地区属性;社会维度包括家庭属性、工作属性、社会特征属性;消费维度包括消费水平属性、消费行为属性、消费心理属性。
本发明改进的WFCM聚类算法通过引入特征权重,充分考虑了各个数据特征属性对聚类结果不同程度的影响,通过引入密度权重,减少了样本基数不平衡对WFCM聚类结果的影响,并增加了聚类的收敛性。
下面以消费维度为例,介绍本发明利用改进的WFCM聚类算法对用户作多维度的画像聚类划分的方法。
假设当前样本空间有k个用户,每个用户的特征向量用ki表示,ku={ki1、ki2、ki3},ki1、ki2、ki3分别表示用户i的消费水平属性、消费行为属性和消费心理属性。一个用户的特征数据代表画像聚类中的一个样本点。WFCM聚类中,用户i和用户z之间的欧式距离用odiz表示。引入特征权重变量w后,在消费维度下,用户i和用户z之间的欧式距离odiz表达如下:
Figure BDA0003360374340000121
从而得出以用户i为中心的中心密度值pi为:
Figure BDA0003360374340000122
n*表示中心密度值计算范围内的样本点数量。从pi和odiz的计算公式可知,当用户i周围的样本点越多(即n*越大),且周围样本与kz越相似时,pi的值越大。
接下来,对pi进行归一化,得到新的中心密度值pi *(即密度权重),归一化公式为:
Figure BDA0003360374340000123
pi *的计算需满足以下2个约束条件,分别为:
Figure BDA0003360374340000124
0≤pi *≤1
n表示总的样本点数量;
然后利用pi *改进传统的FCM聚类中心目标函数如下:
Figure BDA0003360374340000125
J表示改进的聚类中心目标函数;
c表示聚类的类别数;
uij m表示表示用户i相对于簇j的隶属度;
cj为簇j的聚类中心;
m表示隶属度因子;
ki表示第i个用户的数据样本;
||ki-cj||2表示用户与簇中心距离的度量。
然后,分别对目标函数J中的变量uij和cj求导数,得到:
Figure BDA0003360374340000131
Figure BDA0003360374340000132
其中,r表示不等于j的聚类中心;
||ki-cj||表示ki与cj之间的欧式距离;
‖ki-cr‖表示ki与cr之间的欧式距离;。
接下来,执行迭代训练的过程,当聚类中心几乎不再变化时,认为算法收敛较好,停止迭代。WFCM算法引入特征权重和密度权重后,在迭代中对于样本隶属度uij和簇中心cj的计算都实现了优化调整。
最后,营销运营***将用户画像聚类结果展示给商家,帮助商家对已有客户进行精准分群,有效增强用户用户的转化率。
简而言之,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分的方法如图2所示,包括:
步骤B1,确定对用户作画像聚类的分类数、隶属度因子m和迭代次数;
步骤B2,初始化样本隶属度uij
步骤B3,计算以样本点j为中心的中心密度值pi,并根据样本隶属度uij和中心密度值pi计算聚类中心cj
步骤B4,根据聚类中心cj构建WFCM聚类中心目标函数J;
步骤B5,根据步骤B3计算的聚类中心cj更新计算样本隶属度uij,然后返回步骤B3,直至达到迭代次数。
当目标函数J不再变化或者变化幅度小于预设阈值时,认为算法收敛较好,停止迭代。
为了更精细化的解决产品营销的投放问题,本发明基于以电商行业为基础的各行业海量数据,改进以往单一看待需求问题的方式和单一的模型算法方案,专门设计了一套加权融合算法去预测用户购买意向。该算法可根据用户历史购买行为预测用户购买意向(包括预测用户购买行为和购买时间),挖掘高潜力用户群体,进一步降低企业的营销成本,助力企业精准营销。
经过对各类算法融合后的用户购买意向预测效果对比,本发明最终选取DecisionTree-Gini(基于基尼系数的决策树)、Random Forest(随机森林)、Kernel RidgeRegression(核岭回归)、LASSO Regression(套索回归)、LightGBM共5种模型算法,并将该5种模型算法融合为加权融合模型,并以权重实时更新方式对加权融合模型输出的用户购买意向预测结果进行更新校正,大幅提升了模型预测用户购买意向的准确度。
图7示出了加权融合模型预测用户购买行为的示意图。以下结合图7对加权融合模型预测用户购买行为的过程以及对加权融合模型的训练过程进行说明:
图7中的F1表示用户特征、F2表示用户曾经购买的产品特征、F3表示用户与产品的关联关系特征。本发明对于加权融合模型的训练是有监督的模型训练,以用户的真实购买行为作为标记信息。模型训练过程中,选定的5个算法模型的每一个算法模型的输出作为新的特征输入到下一个算法模型。
假设核岭回归模型、套索回归模型、决策树模型、随机森林模型和LightGBM模型基于模型输入数据输出的用户购买意向预测结果分别为X1、X2、X3、X4、X5,对加权融合模型最终输出的用户购买意向预测结果的影响权重分别为w1、w2、w3、w4、w5,真实的用户购买行为记为Y,加权融合模型最终输出的购买意向预测结果记为R。
核岭回归模型主要训练连续性的变量特征,用ε1表示核岭回归模型的预测结果与真实结果之间的误差:
ε1=(X1-Y)2
将核岭回归模型的输出作为新的数据特征输入到套索回归模型中继续对用户作购买意向预测,并计算套索回归模型的预测误差,记为ε2
ε2=(X2-Y)2
将套索回归模型的输出作为新的数据特征输入到决策树模型中继续对用户作购买意向预测,并计算决策树模型的预测误差,记为ε3
ε3=(X3-Y)2
将决策树模型的输出作为新的数据特征输入到随机森林模型中继续对用户作购买意向预测,并计算随机森林模型的预测误差,记为ε4
ε4=(X4-Y)2
将随机森林模型的输出作为新的数据特征输入到LightGBM模型中继续对用户作购买意向预测,并计算LightGBM模型的预测误差,记为ε5
ε5=(X5-Y)2
加权融合模型初始训练完成后,这5个算法模型对预测结果的影响权重相同,即各个模型对于预测结果的影响权重均为
Figure BDA0003360374340000151
则:
Figure BDA0003360374340000152
在对加权融合模型进行迭代训练时,当训练到第k次时,分别计算5个算法模型在k次预测中的预测结果的平均误差,分别记为ε1k、ε2k、ε3k、ε4k、ε5k。以ε1k为例:
Figure BDA0003360374340000153
然后实时更新5个模型对加权融合模型预测结果的影响权重。如果某个算法模型的平均误差较大,说明该模型当前的预测效果不好,则给该个模型分配相对小的权重值,反之分配更大的权重值。赋予第i个模型在第k次训练中的权重值w的方法通过以下公式表达:
Figure BDA0003360374340000154
wik表示经k次迭代训练后的第i个模型对购买意向预测结果的影响权重;
εik表示第i个模型在k次用户购买意向预测中的平均误差;
Sk表示各模型的平均误差的和值,即Sk=ε1k2k3k4k5k
最终根据赋予每个模型的预测结果影响权重,更新加权融合模型的用户购买意向预测结果R为:
R=w1kX1+w2kX2+w3kX3+w4kX4+w5kX5
简而言之,如图3所示,本发明训练加权融合模型的方法包括:
步骤C1,将作为训练样本的电商交易明细特征数据输入给核岭回归模型作购买意向预测,并计算核岭回归模型的预测误差,记为ε1
步骤C2,以核岭回归模型的输出作为新的数据特征输入到套索回归模型中继续对用户作购买意向预测,并计算套索回归模型的预测误差,记为ε2
步骤C3,以套索回归模型的输出作为新的数据特征输入到基于基尼系数的决策树模型中继续对用户作购买意向预测,并计算决策树模型的预测误差,记为ε3
步骤C4,以决策树模型的输出作为新的数据特征输入到随机森林模型中继续对用户作购买意向预测,并计算随机森林模型的预测误差,记为ε4
步骤C5,以随机森林模型的输出作为新的数据特征输入到LightGBM模型中继续对用户作购买意向预测,并计算LightGBM模型的预测误差,记为ε5
步骤C6,根据预测误差更新各模型的训练参数,并重复步骤C1-C5进行k次迭代训练后计算各模型k次预测结果的平均误差;
步骤C7,根据各模型k次预测结果的平均误差,计算每个模型对购买意向预测结果的影响权重;
步骤C8,计算各模型对购买意向结果的影响权重与第k次模型预测结果的乘积并求和,所得和值作为加权融合模型对第k次预测时模型输入的预测结果;
步骤C9,判断步骤C8所得预测结果的误差是否小于预设的误差阈值,
若是,则终止对加权融合模型的迭代训练;
若否,则返回步骤C1继续对加权融合模型进行迭代训练。
综上,本发明基于加权融合算法对用户购买意向的预测结果更加准确。基于多元时间序列数据预测模型实现了对电商时序数据中缺失值的自动预测和自动填充,提升了数据的可用性,有利于提升后续用户画像的精度。另外,基于改进的WFCM聚类算法,提升了对用户画像聚类的精确度。
本发明还提供了一种基于大数据分析的营销运营***,可实现上述的营销运营方法,如图4所示,该营销运营***包括:
数据分析指令输入模块,用于提供给商家输入数据分析指令;
数据分类及缺失值填充模块,连接数据分析指令输入模块,用于根据数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充;
用户聚类模块,连接数据分类及缺失值填充模块,用于基于多元时间序列数据预测模型的输出数据,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分;
用户购买意向预测模块,连接数据分类及缺失值填充模块,用于根据电商时序数据,利用预先训练的加权融合模型预测用户购买意向。
关于营销运营***如何实现对电商时序数据的缺失值预测、填充,如何实现用户画像聚类,如何实现对用户购买意向的预测在上述的营销运营方法中已作了详细阐述,在此不再赘述。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (10)

1.一种基于大数据分析的营销运营方法,其特征在于,包括:
营销运营***根据商家输入的数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充;
然后,基于所述多元时间序列数据预测模型的输出数据,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分;
并根据所述电商时序数据,利用预先训练的加权融合模型预测用户购买意向;
最终,所述营销运营***将用户画像聚类结果和购买意向预测结果通过智能终端展示给商家。
2.根据权利要求1所述的基于大数据分析的营销运营方法,其特征在于,所述多元时间序列数据预测模型的训练方法包括:
步骤A1,迭代训练用于对所述电商时序数据作数据分类的分类器,所述电商时序数据包括用户行为明细时序数据、电商交易明细时序数据、用户投放行为明细时序数据和营销行为明细时序数据中的任意一种或多种;
步骤A2,将所述电商时序数据输入到所述分类器中,以所述分类器的输出为GAN网络中生成器的训练样本,以所述生成器的输入和输出为GAN网络中判别器的训练样本,通过所述判别器引导所述生成器的训练,直至满足训练终止条件,得到完成训练的所述生成器和所述判别器;
步骤A3,将所述分类器、所述生成器和所述判别器融合为所述多元时间序列数据预测模型。
3.根据权利要求2所述的基于大数据分析的营销运营方法,其特征在于,对所述分类器进行迭代训练的终止条件通过以下公式(1)表达:
|Lk-Lk-1|≤T 公式(1)
公式(1)中,Lk表示对经第k次迭代后的所述分类器的性能评估值;
Lk-1表示第k-1次迭代后的所述分类器的性能评估值;
T表示分类器的性能评估值变化幅度阈值;
Lk、Lk-1分别通过以下公式(2)-(3)计算而得:
Figure FDA0003360374330000011
Figure FDA0003360374330000012
公式(2)-(3)中,c0表示所述分类器初次对所述电商时序数据的分类结果的置信度;
ck表示经k次迭代后的所述分类器对所述电商时序数据的分类结果的置信度;
ck-1表示经k-1次迭代后的所述分类器对所述电商时序数据的分类结果的置信度;
0表示初始电商时序数据进行分类预测的数据噪声率;
k表示经k次迭代后的所述分类器对所述电商时序数据进行分类预测的数据噪声率;
k-1表示经k-1次迭代后的所述分类器对所述电商时序数据进行分类预测的数据噪声率。
4.根据权利要求2所述的基于大数据分析的营销运营方法,其特征在于,使用训练样本对判别器的目标函数作最大化学习到所述判别器的参数后完成对所述判别器的训练,判别器的目标函数通过以下公式(4)表达:
Figure FDA0003360374330000021
公式(4)中,V(D)表示所述判别器的目标函数;
i表示预测的第i个时间序列数据;
k表示时间序列数据的个数;
D(x)表示所述判别器对真样本x判断为真的概率;
0.9-D(G(z))表示所述判别器对假样本G(z)判断为假的概率;
G(z)表示所述分类器对输入的所述电商时序数据作分类预测后输出的所述电商时序数据。
5.根据权利要求2所述的基于大数据分析的营销运营方法,其特征在于,使用训练样本对生成器的目标函数作最大化学习到所述生成器的参数后完成对所述生成器的训练,所述生成器的目标函数通过以下公式(5)表达:
Figure FDA0003360374330000022
公式(5)中,V(G)表示所述生成器的目标函数;
i表示预测的第i个时间序列数据;
k表示时间序列数据的个数;
α表示超参数,为|x-G(x)|所占比重;
x表示输入所述生成器的真样本;
G(z)表示所述分类器对输入的所述电商时序数据作分类预测后输出的所述电商时序数据;
|x-G(z)|表示x与G(z)之间距离的度量;
β表示超参数,为log(0.9-D(G(z)))所占比重;
0.9-D(G(z))表示所述判别器对假样本G(z)判断为假的概率。
6.根据权利要求1所述的基于大数据分析的营销运营方法,其特征在于,用户的数据维度包括基本维度、社会维度、消费维度中的任意一种或多种,其中,用户的基本维度包括性别属性、年龄属性、地区属性中的任意一种或多种;社会维度包括家庭属性、工作属性、社会特征属性中的任意一种或多种;消费维度包括消费水平属性、消费行为属性、消费心理属性中的任意一种或多种。
7.根据权利要求6所述的基于大数据分析的营销运营方法,其特征在于,利用改进的所述WFCM聚类算法对用户作多维度的画像聚类划分的方法包括:
步骤R1,确定对用户作画像聚类的分类数、隶属度因子m和迭代次数;
步骤B2,初始化样本隶属度uij
步骤B3,计算以样本点i为中心的中心密度值pi,并根据所述样本隶属度uij和所述中心密度值pi计算聚类中心cj
步骤B4,根据所述聚类中心cj构建WFCM聚类中心目标函数J;
步骤B5,根据步骤B3计算的所述聚类中心cj更新计算所述样本隶属度uij,然后返回所述步骤B3,直至达到迭代次数。
8.根据权利要求7所述的基于大数据分析的营销运营方法,其特征在于,所述中心密度值pi通过以下公式(6)计算而得:
Figure FDA0003360374330000031
公式(6)中,n*表示中心密度值计算范围内的样本点数量;
odiz表示样本点i到样本点z的欧式距离;
odiz通过以下公式(7)计算而得:
Figure FDA0003360374330000032
公式(7)中,kis表示样本点i的特征向量ki中的第s个元素的元素值;
kzs表示样本点z的特征向量kz中的第s个元素的元素值;
ws表示样本点的特征向量中的第s个元素的特征权重变量;
d表示样本点的特征向量中的元素个数;
优选地,步骤B3中,对所述中心密度值pi进行归一化后再结合所述样本隶属度uij计算所述聚类中心cj,所述聚类中心cj通过以下公式(8)计算而得:
Figure FDA0003360374330000041
公式(8)中,pi *表示对所述中心密度值pi进行归一化后的值,pi *满足以下两个约束条件:
Figure FDA0003360374330000042
0≤pi *≤1
n表示总的样本点数量;
c表示聚类的类别数;
uij m表示表示样本点i相对于簇j的隶属度;
优选地,步骤B4中的所述目标函数J通过以下公式(9)表达:
Figure FDA0003360374330000043
优选地,步骤B5中,通过以下公式(10)更新计算所述样本隶属度uij
Figure FDA0003360374330000044
公式(10)中,r表示不等于j的聚类中心;
||ki-cj||表示ki与cj之间的欧式距离;
||ki-cr||表示ki与cr之间的欧式距离。
9.根据权利要求1所述的基于大数据分析的营销运营方法,其特征在于,训练所述加权融合模型的方法包括:
步骤C1,将作为训练样本的电商交易明细特征数据输入给核岭回归模型作购买意向预测,并计算所述核岭回归模型的预测误差,记为ε1
步骤C2,以所述核岭回归模型的输出作为新的数据特征输入到套索回归模型中继续对用户作购买意向预测,并计算所述套索回归模型的预测误差,记为ε2
步骤C3,以所述套索回归模型的输出作为新的数据特征输入到基于基尼系数的决策树模型中继续对用户作购买意向预测,并计算所述决策树模型的预测误差,记为ε2
步骤C4,以所述决策树模型的输出作为新的数据特征输入到随机森林模型中继续对用户作购买意向预测,并计算所述随机森林模型的预测误差,记为ε4
步骤C5,以所述随机森林模型的输出作为新的数据特征输入到LightGBM模型中继续对用户作购买意向预测,并计算所述LightGBM模型的预测误差,记为ε5
步骤C6,根据预测误差更新各模型的训练参数,并重复步骤C1-C5进行k次迭代训练后计算各模型k次预测结果的平均误差;
步骤C7,根据各模型k次预测结果的平均误差,计算每个模型对购买意向预测结果的影响权重;
步骤C8,计算各模型对购买意向结果的影响权重与第k次模型预测结果的乘积并求和,所得和值作为所述加权融合模型对第k次预测时模型输入的预测结果,并计算所述加权融合模型的预测误差;
步骤C9,判断步骤C8所得预测结果的误差是否小于预设的误差阈值,
若是,则终止对所述加权融合模型的迭代训练;
若否,则返回步骤C1继续对所述加权融合模型进行迭代训练;
优选地,步骤C7中,每个模型对购买意向预测结果的影响权重通过以下公式(11)计算而得:
Figure FDA0003360374330000051
公式(11)中,wik表示经k次迭代训练后的第i个模型对购买意向预测结果的影响权重;
εik表示第i个模型在k次用户购买意向预测中的平均误差;
Sk表示各模型的平均误差的和值。
10.一种基于大数据分析的营销运营***,可实现如权利要求1-9任意一项所述的基于大数据分析的营销运营方法,其特征在于,所述营销运营***包括:
数据分析指令输入模块,用于提供给商家输入数据分析指令;
数据分类及缺失值填充模块,连接所述数据分析指令输入模块,用于根据所述数据分析指令,利用预先训练的多元时间序列数据预测模型对输入的电商时序数据作数据分类及缺失值预测、填充;
用户聚类模块,连接所述数据分类及缺失值填充模块,用于基于所述多元时间序列数据预测模型的输出数据,利用改进的WFCM聚类算法对用户作多维度的画像聚类划分;
用户购买意向预测模块,连接所述数据分类及缺失值填充模块,用于根据所述电商时序数据,利用预先训练的加权融合模型预测用户购买意向。
CN202111364439.9A 2021-11-17 2021-11-17 基于大数据分析的营销运营方法、*** Expired - Fee Related CN114049155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111364439.9A CN114049155B (zh) 2021-11-17 2021-11-17 基于大数据分析的营销运营方法、***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111364439.9A CN114049155B (zh) 2021-11-17 2021-11-17 基于大数据分析的营销运营方法、***

Publications (2)

Publication Number Publication Date
CN114049155A true CN114049155A (zh) 2022-02-15
CN114049155B CN114049155B (zh) 2022-08-19

Family

ID=80209910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111364439.9A Expired - Fee Related CN114049155B (zh) 2021-11-17 2021-11-17 基于大数据分析的营销运营方法、***

Country Status (1)

Country Link
CN (1) CN114049155B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114549071A (zh) * 2022-02-18 2022-05-27 上海钧正网络科技有限公司 一种营销策略的确定方法、装置、计算机设备及存储介质
US20230111115A1 (en) * 2021-09-29 2023-04-13 Oracle International Corporation Identifying a contribution of an individual entity to an outcome value corresponding to multiple entities
CN116227929A (zh) * 2023-03-07 2023-06-06 广州爱浦路网络技术有限公司 通信数据的分析方法、装置、设备及存储介质
CN116776131A (zh) * 2023-08-23 2023-09-19 腾讯科技(深圳)有限公司 基于图的特征降维方法、意向评级方法及相关设备
CN116843377A (zh) * 2023-07-25 2023-10-03 河北鑫考科技股份有限公司 基于大数据的消费行为预测方法、装置、设备及介质
CN117290364A (zh) * 2023-11-24 2023-12-26 深圳市成为高科技有限公司 一种市场调查数据智能存储方法
CN117593044A (zh) * 2024-01-18 2024-02-23 青岛网信信息科技有限公司 一种双角度的营销活动效果预测方法、介质及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814149A (zh) * 2010-05-10 2010-08-25 华中科技大学 一种基于在线学习的自适应级联分类器训练方法
US20200065812A1 (en) * 2018-08-24 2020-02-27 Capital One Services, Llc Methods and arrangements to detect fraudulent transactions
CN111369070A (zh) * 2020-03-13 2020-07-03 西安理工大学 一种基于包络线聚类的多模融合光伏功率预测方法
US20200218937A1 (en) * 2019-01-03 2020-07-09 International Business Machines Corporation Generative adversarial network employed for decentralized and confidential ai training
US20210073630A1 (en) * 2019-09-10 2021-03-11 Robert Bosch Gmbh Training a class-conditional generative adversarial network
CN113159389A (zh) * 2021-03-25 2021-07-23 大连海事大学 一种基于深度森林生成对抗网络的金融时间序列预测方法
CN113469730A (zh) * 2021-06-08 2021-10-01 北京化工大学 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置
CN113643068A (zh) * 2021-08-18 2021-11-12 北京小米移动软件有限公司 商品购买意图确定方法、装置、存储介质及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814149A (zh) * 2010-05-10 2010-08-25 华中科技大学 一种基于在线学习的自适应级联分类器训练方法
US20200065812A1 (en) * 2018-08-24 2020-02-27 Capital One Services, Llc Methods and arrangements to detect fraudulent transactions
US20200218937A1 (en) * 2019-01-03 2020-07-09 International Business Machines Corporation Generative adversarial network employed for decentralized and confidential ai training
US20210073630A1 (en) * 2019-09-10 2021-03-11 Robert Bosch Gmbh Training a class-conditional generative adversarial network
CN111369070A (zh) * 2020-03-13 2020-07-03 西安理工大学 一种基于包络线聚类的多模融合光伏功率预测方法
CN113159389A (zh) * 2021-03-25 2021-07-23 大连海事大学 一种基于深度森林生成对抗网络的金融时间序列预测方法
CN113469730A (zh) * 2021-06-08 2021-10-01 北京化工大学 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置
CN113643068A (zh) * 2021-08-18 2021-11-12 北京小米移动软件有限公司 商品购买意图确定方法、装置、存储介质及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张建彬,霍佳震: "基于Stacking模型融合的用户购买行为预测研究", 《上海管理科学》 *
王忠玉: "《模糊数据统计学》", 31 March 2008, 哈尔滨:哈尔滨工业大学出版社 *
谢玖柞: "基于机器学习的某商业银行客户画像模型研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230111115A1 (en) * 2021-09-29 2023-04-13 Oracle International Corporation Identifying a contribution of an individual entity to an outcome value corresponding to multiple entities
CN114549071A (zh) * 2022-02-18 2022-05-27 上海钧正网络科技有限公司 一种营销策略的确定方法、装置、计算机设备及存储介质
CN116227929A (zh) * 2023-03-07 2023-06-06 广州爱浦路网络技术有限公司 通信数据的分析方法、装置、设备及存储介质
CN116227929B (zh) * 2023-03-07 2024-03-19 广州爱浦路网络技术有限公司 通信数据的分析方法、装置、设备及存储介质
CN116843377A (zh) * 2023-07-25 2023-10-03 河北鑫考科技股份有限公司 基于大数据的消费行为预测方法、装置、设备及介质
CN116776131A (zh) * 2023-08-23 2023-09-19 腾讯科技(深圳)有限公司 基于图的特征降维方法、意向评级方法及相关设备
CN117290364A (zh) * 2023-11-24 2023-12-26 深圳市成为高科技有限公司 一种市场调查数据智能存储方法
CN117290364B (zh) * 2023-11-24 2024-01-30 深圳市成为高科技有限公司 一种市场调查数据智能存储方法
CN117593044A (zh) * 2024-01-18 2024-02-23 青岛网信信息科技有限公司 一种双角度的营销活动效果预测方法、介质及***
CN117593044B (zh) * 2024-01-18 2024-05-31 青岛网信信息科技有限公司 一种双角度的营销活动效果预测方法、介质及***

Also Published As

Publication number Publication date
CN114049155B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN114049155B (zh) 基于大数据分析的营销运营方法、***
Jiang et al. Maximizing customer satisfaction through an online recommendation system: A novel associative classification model
Wu et al. Modeling users’ preferences and social links in social networking services: a joint-evolving perspective
Darko et al. Modeling customer satisfaction through online reviews: A FlowSort group decision model under probabilistic linguistic settings
CN103377296B (zh) 一种多指标评价信息的数据挖掘方法
Ling et al. Customer purchase intent prediction under online multi-channel promotion: A feature-combined deep learning framework
CN114219169A (zh) 颖幡供应链销售和库存预测算法模型和应用***
CN109685087A (zh) 信息处理方法和装置以及信息检测方法和装置
CN115053240A (zh) 使用库存数据来测量和预测产品的可用性并优化配搭的***和方法
US11651417B2 (en) Method, system, and non-transitory processor-readable medium for intelligent listing creation for a for sale object
CN112115358A (zh) 一种利用知识图谱中多跳路径特征的个性化推荐方法
CN112613953A (zh) 一种商品选品方法、***及计算机可读存储介质
CN111695024A (zh) 对象评估值的预测方法及***、推荐方法及***
Zhang Prediction of Purchase Volume of Cross‐Border e‐Commerce Platform Based on BP Neural Network
Baghla et al. Performance evaluation of various classification techniques for customer churn prediction in e-commerce
Kedia et al. Early bird catches the worm: Predicting returns even before purchase in fashion E-commerce
Xu et al. Online data valuation and pricing for machine learning tasks in mobile health
JP2011253534A (ja) 最適価格学習
CN115511582B (zh) 一种基于人工智能的商品推荐***及方法
Chashmi et al. Predicting customer turnover using recursive neural networks
Zu et al. A multi-factor customer classification evaluation model
Julian et al. Analysis and Estimation of Discounts on Product Prices in E-Commerce Sites
Jankowski et al. Fuzzy modeling of digital products pricing in the virtual marketplace
Sun Prediction method of consumer repeat purchase behaviour in e-commerce environment
Tajuddin et al. Impacts of consumer-brand identification for strengthening the sustainability of Malaysian fashion brands

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220819