CN116151857A - 一种营销模型的构建方法及装置 - Google Patents
一种营销模型的构建方法及装置 Download PDFInfo
- Publication number
- CN116151857A CN116151857A CN202310127830.XA CN202310127830A CN116151857A CN 116151857 A CN116151857 A CN 116151857A CN 202310127830 A CN202310127830 A CN 202310127830A CN 116151857 A CN116151857 A CN 116151857A
- Authority
- CN
- China
- Prior art keywords
- user
- training
- data
- model
- marketing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种营销模型的构建方法及装置,包括:获取用户的静态数据和动态数据,确定用户的数据特征;将数据特征输入第一训练模型,得到第一训练结果;若判断第一训练结果包括混合区域,则将混合区域中用户的特征数据映射到第一训练模型的第二训练模型,得到第二训练结果;混合区域包括至少两个类别的用户的数据特征;第二训练模型和第一训练模型的输出神经元的数量相同;将第二训练结果作为第一训练结果,直至第一训练结果不包括混合区域;根据第一训练模型和第二训练模型构建营销模型,营销模型用于输出用户对营销策略的敏感度。以此增加训练样本的维度,提高构建后的营销模型的聚类准确度,进而提高构建后的营销模型的预测结果的准确率。
Description
技术领域
本发明涉及模型构建技术领域,尤其涉及一种营销模型的构建方法及装置。
背景技术
随着互联网的高速发展,零售场景进入O2O(Online To Offline,线上到线下)新零售时代,新零售指将线下的商务机会与互联网结合,让互联网成为线下交易的平台。新零售等市场需要针对营销活动,通过网络模型分析出用户对营销策略的敏感度、用户的偏好、对营销策略作出回应的概率等预测结果。
目前针对营销策略的网络模型,一般是基于单个训练模型,以用户的标识、性别、年龄等基本信息作为训练样本对训练模型进行训练,得到营销策略的网络模型。
但目前针对营销策略构建的网络模型的预测结果的准确率较低,因此如何提高营销策略的网络模型的预测结果的准确率是目前亟需解决的问题。
发明内容
本发明实施例提供一种营销模型的构建方法及装置,用于提高营销策略对应的营销模型的预测结果的准确率。
第一方面,本发明实施例提供一种营销模型的构建方法,包括:
获取用户的静态数据和动态数据,确定所述用户的数据特征;
将所述用户的数据特征输入第一训练模型,得到第一训练结果;
判断所述第一训练结果是否包括混合区域;若是,则针对任一混合区域,将所述混合区域中用户的特征数据映射到所述第一训练模型的第二训练模型,得到第二训练结果;所述混合区域包括至少两个类别的用户的数据特征;所述第二训练模型和第一训练模型的输出神经元的数量相同;
将所述第二训练结果作为第一训练结果,直至判断所述第一训练结果不包括混合区域;
根据所述第一训练模型和所述第二训练模型构建营销模型;所述营销模型用于输出用户对营销策略的敏感度。
上述技术方案中,用户的数据特征包括用户的静态数据和动态数据;其中,静态数据表示用户的稳定信息,如性别、年龄、婚姻状况、出生地址等;动态数据表示用户的行为变化信息,如浏览的购物网站、商品链接、支付商品的类型等。用户的数据特征作为模型的训练样本,通过提高训练样本的维度,提高构建后的营销模型的预测结果的准确率。
本发明实施例中,第一训练模型和第二训练模型为SOM(Self-Organizing Map,自组织映射神经网络)模型。其中,第二训练模型为第一训练模型的子SOM模型,也就是说,构建后的营销模型为树形结构模型。且第二训练模型和第一训练模型的输出神经元的数量相同,表示第二训练模型和第一训练模型的聚类结果相同,以此提高构建后的营销模型的聚类准确度,进而提高构建后的营销模型的预测结果的准确率。
另外,判断第一训练结果不包括混合区域,表示第一训练结果仅包括单一区域,将仅包括单一区域对应的SOM模型称为叶子模型;其中,所述叶子模型不具有子SOM模型,单一区域表示仅包括一种类别的用户的数据特征。以此提高构建后的营销模型的预测结果的准确率。
敏感度表示用户的偏好、对营销策略作出回应的概率等预测结果。
可选的,根据用户的静态数据和动态数据确定所述用户的数据特征,包括:
对所述用户的静态数据和动态数据进行特征提取,得到所述用户的静态特征和动态特征;
根据所述用户的静态特征和第一权重、所述用户的动态特征和第二权重确定所述用户的数据特征。
上述技术方案中,第一权重和第二权重是基于营销策略预设的。通过第一权重和第二权重设置动态数据和静态数据的比重,以此实现构建后的营销模型对营销策略具有针对性,提高构建后的营销模型针对该营销策略的预测结果的准确率。
可选的,将所述用户的数据特征输入第一训练模型之前,还包括:
针对任一用户的数据特征,计算所述用户的数据特征与其他用户的数据特征之间的第一欧式距离;
根据所述第一欧式距离对所述用户进行异常检测。
可选的,根据所述第一欧式距离对所述用户进行异常检测,包括:
计算所述第一欧氏距离大于第一阈值的数量比例;
判断所述数量比例是否大于第二阈值;若是,则将所述用户确定为异常用户;否则将所述用户确定为正常用户。
上述技术方案中,在将用户的数据特征输入第一训练模型之前,对用户进行异常检测,以此降低异常用户的数据特征对SOM模型的聚类影响,提高SOM模型的聚类精度和稳定性,进而提高构建后的营销模型针对该营销策略的预测结果的准确率。
可选的,判断所述第一训练结果是否包括混合区域,包括:
将所述第一训练结果划分为多个区域;
针对任一区域,若所述区域中至少两个用户的数据特征处于不同的预设分类范围,则所述区域为混合区域,确定所述第一训练结果包括混合区域;
若所述区域中各用户的数据特征处于相同的预设分类范围,则所述区域为单一区域,确定所述第一训练结果不包括混合区域;所述单一区域包括同种类别的用户的数据特征。
可选的,所述方法还包括:
所述第一训练模型和所述第二训练模型执行以下训练操作:
初始化输出神经元的权重和学习率;
根据待输入数据特征从所述输出神经元中确定获胜神经元;
根据待输入数据特征计算所述获胜神经元的权重,直至所述学习率满足训练条件。
可选的,根据待输入数据特征从所述输出神经元中确定获胜神经元,包括:
对所述待输入数据特征进行归一化处理;
计算归一化后的数据特征与所述输出神经元的权重的相乘结果;
将最大相乘结果对应的输出神经元确定为获胜神经元;
或计算所述待输入数据特征与所述输出神经元的权重的第二欧氏距离;
将最小第二欧式距离对应的输出神经元确定为获胜神经元。
第二方面,本发明实施例提供一种模型构建装置,包括:
确定模块,用于获取用户的静态数据和动态数据,确定所述用户的数据特征;
处理模块,用于将所述用户的数据特征输入第一训练模型,得到第一训练结果;
判断所述第一训练结果是否包括混合区域;若是,则针对任一混合区域,将所述混合区域中用户的特征数据映射到所述第一训练模型的第二训练模型,得到第二训练结果;所述混合区域包括至少两个类别的用户的数据特征;所述第二训练模型和第一训练模型的输出神经元的数量相同;
将所述第二训练结果作为第一训练结果,直至判断所述第一训练结果不包括混合区域;
根据所述第一训练模型和所述第二训练模型构建营销模型;所述营销模型用于输出用户对营销策略的敏感度。
可选的,所述确定模块具体用于:
对所述用户的静态数据和动态数据进行特征提取,得到所述用户的静态特征和动态特征;
根据所述用户的静态特征和第一权重、所述用户的动态特征和第二权重确定所述用户的数据特征。
可选的,所述处理模块还用于:
将所述用户的数据特征输入第一训练模型之前,针对任一用户的数据特征,计算所述用户的数据特征与其他用户的数据特征之间的第一欧式距离;
根据所述第一欧式距离对所述用户进行异常检测。
可选的,所述处理模块具体用于:
计算所述第一欧氏距离大于第一阈值的数量比例;
判断所述数量比例是否大于第二阈值;若是,则将所述用户确定为异常用户;否则将所述用户确定为正常用户。
可选的,所述处理模块具体用于:
将所述第一训练结果划分为多个区域;
针对任一区域,若所述区域中至少两个用户的数据特征处于不同的预设分类范围,则所述区域为混合区域,确定所述第一训练结果包括混合区域;
若所述区域中各用户的数据特征处于相同的预设分类范围,则所述区域为单一区域,确定所述第一训练结果不包括混合区域;所述单一区域包括同种类别的用户的数据特征。
第三方面,本发明实施例还提供一种计算机设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述模型构建方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述模型构建方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种***架构示意图;
图2为本发明实施例提供的一种模型构建方法的流程示意图;
图3为本发明实施例提供的一种营销模型的示意图;
图4为本发明实施例提供的一种输入营销模型前的用户的特征数据的分布示意图;
图5为本发明实施例提供的一种输入营销模型后的用户的特征数据的分布示意图;
图6为本发明实施例提供的一种模型构建装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了更好的阐述本发明技术方案,下面对本发明涉及到的名词进行解释。
新零售:指的是线上与线下结合,线下作为线上的体验店,以此降低引流投入。
特征提取:指使用计算机提取图像、文本等数据中属于特征性信息的方法及过程,用于将图像、文本等数据变换为具有特征性的参数。
SOM:是无监督学习方法中一类方法,由输入层和竞争层(输出层)构成的两层网络,用于完成分类聚类。其中,分类为有监督,聚类为无监督。
随着互联网的发展,零售商户逐渐由线下转移到线上。线上借助社交平台、购物平台等形成新经营方案和新流量阵地,导致零售场景进入O2O新零售场景。
离群点:指远离序列水平值的极端大值或极端小值。
商户或品牌方希望借助新经营方案(如用于引流获客的红包、折扣、满减等方案),提升销售额。结合智慧商圈、新零售等市场需要尝试创新经营方案,整合营销、数据、科技能力为零售商户、商圈、品牌方在经营上提供线商业综合体数字化综合解决方案,以此协助新零售商户建设营销策略。
针对营销策略,需要对用户的数据进行分析,以此确定出用户对营销策略的敏感度、用户的偏好、对营销策略作出回应的概率等信息。
在相关技术中心,一般是通过对用户数据进行采集,结合具有特征提取能力的机器学习技术,对用户数据进行特征提取,然后基于提取后的特征进行分类,并构建营销策略模型。
营销策略模型用于对用户进行分析、聚类,以此挖据出营销策略对应的目标用户。例如针对9折活动的营销策略,输入参数为用户的数据特征,输出参数为用户的兴趣程度,兴趣程度包括感兴趣、一般感兴趣和不感兴趣。也就是说,将输入的各用户化为分3个类别,分别是对9折活动感兴趣的用户,对9折活动一般感兴趣的用户,对9折活动不感兴趣的用户。
但在上述技术方案中,特征提取的用户数据不够丰富,构建的模型一般是单一模型,且仅采用了数据统计、传统聚类分析等算法,导致构建的营销策略模型的预测结果准确率较低。
因此,现亟需一种模型构建方法,以提高营销模型的预测结果的准确率,提高对用户分类的准确度。
图1示例性的示出了本发明实施例所适用的一种***架构,该***架构包括服务器100,该服务器100可以包括处理器110、通信接口120和存储器130。
其中,通信接口120用于获取用户的静态数据和动态数据。
处理器110是服务器100的控制中心,利用各种接口和路线连接整个服务器100的各个部分,通过运行或执行存储在存储器130内的软件程序/或模块,以及调用存储在存储器130内的数据,执行服务器100的各种功能和处理数据。可选地,处理器110可以包括一个或多个处理单元。
存储器130可用于存储软件程序以及模块,处理器110通过运行存储在存储器130的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器130可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据业务处理所创建的数据等。此外,存储器130可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
需要说明的是,上述图1所示的结构仅是一种示例,本发明实施例对此不做限定。
基于上述描述,图2示例性的示出了本发明实施例提供的一种模型构建方法的流程示意图,该流程可由模型构建装置执行。
如图2所示,该流程具体包括:
步骤210,获取用户的静态数据和动态数据,确定所述用户的数据特征。
本发明实施例中,用户的静态数据表示用户的基础信息,如用户的年龄、性别、婚姻状况、民族、出生地、出生日期、身高、体重、生活地域等信息。用户的动态信息表示用户的行为变化信息,如用户浏览的购物网站、搜索商品的类型、搜索商品的价格、下单支付商品的类型等信息。
步骤220,将所述用户的数据特征输入第一训练模型,得到第一训练结果。
本发明实施例中,第一训练模型为SOM模型。其中,第一训练模型的输入层神经元的数量是由输入向量的维度确定的;竞争层神经元的数量表示分类数量。例如,分类数量为3,将用户针对营销策略兴趣度区分为优、良、差3个类别。
输入层是一维的神经元,具有多个节点,竞争层的神经元处于二维平面网络节点上,构成一个二维节点矩阵。输入层与竞争层的神经元之间通过权值进行连接。
第一训练结果表示对用户的分类结果。
步骤230,判断所述第一训练结果是否包括混合区域;若是,则针对任一混合区域,将所述混合区域中用户的特征数据映射到所述第一训练模型的第二训练模型,得到第二训练结果;
本发明实施例中,第二训练模型和第一训练模型的输出神经元的数量相同,表示第二训练模型和第一训练模型的分类数量一致。
混合区域包括至少两个类别的用户的数据特征;例如,混合区域包括2个类别的用户数据特征,分别为对营销策略感兴趣的用户,对营销策略不感兴趣的用户。
步骤240,将所述第二训练结果作为第一训练结果,直至判断所述第一训练结果不包括混合区域。
本发明实施例中,第一训练结果包括以下3种情况:第一种是第一训练结果仅包括混合区域,第二种是第一训练结果包括混合区域和单一区域,第三种是第一训练结果仅包括单一区域。其中,单一区域表示仅包括一种类别的用户的数据特征。例如,第一训练结果中所有用户均对营销策略感兴趣,则第一训练结果仅包括单一区域。
步骤250,根据所述第一训练模型和所述第二训练模型构建营销模型。
本发明实施例中,营销模型用于输出用户对营销策略的敏感度。
在相关技术中,营销模型的训练结果包括多个类别的用户的数据特征。而本发明实施例中,第二训练模型为第一训练模型的子SOM模型,仅包括单一区域对应的SOM模型为叶子模型,即叶子模型的训练结果仅包括一个类别的用户的数据特征。由此可知,叶子模型预测结果的准确率大于相关技术中的营销模型,进而提高构建后的营销模型的预测结果的准确率。
在步骤210中,对用户的静态数据和动态数据进行特征提取,得到用户的静态特征和动态特征;根据用户的静态特征和第一权重、用户的动态特征和第二权重确定所述用户的数据特征。
示例性的,第一权重和第二权重是基于营销策略预设的。例如,第一权重为0.3,第二权重为0.7等,在此不作具体限定。
通过将静态特征和第一权重相乘,得到第一结果;将动态特征和第二权重相乘,得到第二结果。然后结合第一结果和第二结果,得到用户的数据特征。例如,用户的静态特征为[0.8,0.9],用户的静态特征为[0.4,0.5],则第一结果为[0.24,0.27],第二结果为[0.28,0.35],进而得到用户的数据特征为[0.24,0.27,0.28,0.35]。
本发明实施例中,通过第一权重和第二权重设置动态数据和静态数据的比重,实现构建后的营销模型对营销策略具有针对性。静态数据用于数据统计分析,动态数据用于分析用户的品类综合偏好度和对营销策略的敏感度,进而提高构建后的营销模型针对该营销策略的预测结果的准确率。
通过设置权重函数来融合动态特征和静态特征,根据第一权重和第二权重动态更新,使用户的动态数据和静态数据的特征提取更加抽象,从而克服采用单一静态数据或单一动态数据构建的营销模型应用场景单一,增加营销模型的应用场景丰富性。
示例性的,将用户的数据特征输入第一训练模型之前,针对任一用户的数据特征,计算用户的数据特征与其他用户的数据特征之间的第一欧式距离;根据第一欧式距离对所述用户进行异常检测。
例如,将用户的数据特征作为数据点,共有10个用户的数据点(a1、a2、……、a10),针对数据点a1,计算出数据点a1与其他数据点(a2、a3、……、a10)的第一欧氏距离(b2、b3、……、b10)。然后根据第一欧氏距离(b2、b3、……、b10)对数据点a1进行异常检测。
示例性的,计算第一欧氏距离大于第一阈值的数量比例;判断数量比例是否大于第二阈值;若是,则将用户确定为异常用户;否则将用户确定为正常用户。其中,第一阈值和第二阈值可以是根据经验预设的值,如第一阈值为0.1,第二阈值为0.8等,在此不作具体限定。
基于上述描述进行举例,第一欧氏距离(b2、b3、……、b10)中,大于第一阈值的数量为8,不大于第一阈值的数量为1,则比例为0.88。该比例大于第二阈值(0.8),则将数据点a1确定为异常数据点,即数据点a1为离群点,进而确定数据点a1对应的用户为异常用户。
本发明实施例中,对离群点进行隔离,即离群点不作为训练样本,不参与模型构建时的训练。以此降低异常用户的数据特征对SOM模型的聚类影响,提高SOM模型的聚类精度和稳定性,提高构建后的营销模型针对该营销策略的预测结果的准确率。
在步骤230中,根据预设的分类范围确定第一训练结果是否包括混合区域。具体的,将第一训练结果划分为多个区域,针对任一区域,若所述区域中至少两个用户的数据特征处于不同的分类范围,则确定所述区域为混合区域。
本发明实施例中,第二训练模型的数量是根据混合区域的数量确定的。具体的,第二训练模型的数量与混合区域的数量一致。
为了更好的阐述本发明的技术方案,图3为本发明实施例示例性提供的一种营销模型的示意图。如图3所示,营销模型共包括3层SOM模型。其中,第1层SOM模型为根SOM模型;第2层SOM模型为第1层SOM模型的子SOM模型;第3层SOM模型为第2层SOM模型的子SOM模型,也为叶子模型。
基于图3进行举例,将用户的数据特征输入第一训练模型之前,初始化根SOM模型的权值,并构建特征矩阵。如以4个用户的数据特征构建特征矩阵,3个用户的数据特征分别为用户a1:[0.24,0.27,0.28,0.35],用户a2:[0.61,0.65,0.58,0.53],用户a3:[0.82,0.73,0.91,0.75],用户a4:[0.72,0.83,0.81,0.92]。得到特征矩阵为:
将特征矩阵输入第一训练模型,此时第一训练模型为根SOM模型,由根SOM模型进行训练,得到第一训练结果。本发明实施例中,第一训练结果可以称为第一输出平面,此时第一输出平面为根平面。
示例性的,根平面包括第一区域和第二区域,第一区域包括用户a1:[0.24,0.27,0.28,0.35]和用户a2:[0.61,0.65,0.58,0.53],第二区域包括用户a3:[0.82,0.73,0.91,0.75],用户a4:[0.72,0.83,0.81,0.92]。假设分类范围包括0~0.4、0.4~0.7、0.7~1。
可以看出,第一区域中用户a1和用户a2处于不同的分类范围,因此用户a1和用户a2为不同的类别,因此第一区域为混淆区域。第二区域中用户a3和用户a4处于相同的分类范围,因此用户a3和用户a4为相同的类别,因此第二区域为单一区域。
针对混合区域,将混合区域中用户的特征数据映射到第一训练模型的第二训练模型,此时第二训练模型为第2层SOM模型,由第2层SOM模型根据混合区域中用户的特征数据进行训练,得到第二训练结果。本发明实施例中,第二训练结果可以称为树平面,即除根平面之外的其他输出平面为树平面。
在得到第二训练结果之后,将第二训练结果作为第一训练结果,再次执行上述步骤230,直至第一训练结果不包括混合区域。例如,将第2层SOM模型的训练结果作为第一训练结果,判断第2层SOM模型的训练结果中是否包括混合区域,若是,则将第2层SOM模型的训练结果中的混合区域映射到第3层SOM模型,直至第一训练结果不包括混合区域。
以图3为例,假设第2层SOM模型的训练结果中包括两个混合区域y1、y2,则第3层SOM模型包括SOM模型z1和SOM模型z2,SOM模型z1用于对混合区域y1进行训练,SOM模型z2用于对混合区域y2进行训练。SOM模型z1和SOM模型z2的训练结果中均不包括混合区域,则SOM模型z1和SOM模型z2作为该营销模型中的叶子模型。
本发明实施例中,针对上述图3中所示的任一层SOM模型,SOM模型执行以下训练操作:
初始化输出神经元的权重和学习率。
例如,对输出层的输出神经元的权重按照随机小数的方式进行赋值,并进行归一化处理,得到Wj,Wj表示第j个输出神经元的权重。对学习率η赋初始值。示例性的,η可以为根据经验预设的值,如η为0.15,在此不作具体限定。
根据待输入数据特征从输出神经元中确定获胜神经元。
具体的,对待输入数据特征进行归一化处理;计算归一化后的数据特征与所述输出神经元的权重的相乘结果;将最大相乘结果对应的输出神经元确定为获胜神经元。例如,对待输入数据特征进行归一化处理,得到Xp,Xp表示第p个归一化处理后的待输入数据特征,计算Xp与Wj的相乘结果,将最大相乘结果对应的输出神经元Wij作为获胜神经元。Wij表示输出神经元中第i个神经元。
或计算待输入数据特征与输出神经元的权重的第二欧氏距离;将最小第二欧式距离对应的输出神经元确定为获胜神经元。
根据待输入数据特征计算所述获胜神经元的权重,直至所述学习率满足训练条件。
具体的,根据下述公式(1)计算所述获胜神经元的权重;
Wij(t+1)=Wij(t)+η(t)*(x-Wij(t)) (1);
其中,Wij(t+1)表示第t+1时刻的获胜神经元的权重,Wij(t)表示第t时刻的获胜神经元的权重,η(t)表示第t时刻的学习率,x表示待输入数据特征。训练条件为学习率为0或学习率小于学习阈值。
在一种应用场景中,营销策略为优惠活动,营销模型用于确定用户对优惠活动是否敏感,将用户分为非常敏感、较敏感、一般敏感、不敏感4个类别。
用户的静态数据包括用户的年龄、性别等,用户的动态数据为用户在一年时间范围内的历史订单数据。其中,用户订单中参与活动的比例来判断用户的类别,具体的,用户参与优惠活动订单比例越高,敏感度越高,优惠金额比例越大,敏感度越高。静态特征的第一权重可设置为0.3,动态特征的第二权重可设置为0.7。
基于上述技术方案,图4为本发明示例性提供的一种输入营销模型前的用户的特征数据的分布示意图。如图4所示,包括多个数据点,共包括4各类别,分别以圆形标识、三角形标识、四边形标识和五角星标识进行展示。其中,圆形标识表示非常敏感类别,三角形标识表示较敏感类别,四边形标识表示一般敏感类别,五角星标识表示不敏感4类别。
图5为本发明示例性提供的一种输入营销模型后的用户的特征数据的分布示意图。可以看出,通过营销模型之后,将各数据点进行聚类。
上述技术方案中,叶子模型的任一区域为单一区域,因此可以在该单一区域中找到每一个输入向量(即用户的数据特征)的最佳匹配神经元,以此提高对用户聚类的精度和稳定性,进而提高构建后的营销模型针对该营销策略的预测结果的准确率。通过多个SOM模型进行聚类分析,综合用户品类偏好度、用户分群、营销敏感度等多种分析方式,提高营销模型对营销策略的预测结果的精准性。
基于相同的技术构思,图6示例性的示出了本发明实施例提供的一种模型构建装置的结构示意图,该装置可以执行上述模型构建方法的流程。
如图6所示,该装置具体包括:
确定模块610,用于获取用户的静态数据和动态数据,确定所述用户的数据特征;
处理模块620,用于将所述用户的数据特征输入第一训练模型,得到第一训练结果;
判断所述第一训练结果是否包括混合区域;若是,则针对任一混合区域,将所述混合区域中用户的特征数据映射到所述第一训练模型的第二训练模型,得到第二训练结果;所述混合区域包括至少两个类别的用户的数据特征;所述第二训练模型和第一训练模型的输出神经元的数量相同;
将所述第二训练结果作为第一训练结果,直至判断所述第一训练结果不包括混合区域;
根据所述第一训练模型和所述第二训练模型构建营销模型;所述营销模型用于输出用户对营销策略的敏感度。
可选的,所述确定模块610具体用于:
对所述用户的静态数据和动态数据进行特征提取,得到所述用户的静态特征和动态特征;
根据所述用户的静态特征和第一权重、所述用户的动态特征和第二权重确定所述用户的数据特征。
可选的,所述处理模块620还用于:
将所述用户的数据特征输入第一训练模型之前,针对任一用户的数据特征,计算所述用户的数据特征与其他用户的数据特征之间的第一欧式距离;
根据所述第一欧式距离对所述用户进行异常检测。
可选的,所述处理模块620具体用于:
计算所述第一欧氏距离大于第一阈值的数量比例;
判断所述数量比例是否大于第二阈值;若是,则将所述用户确定为异常用户;否则将所述用户确定为正常用户。
可选的,所述处理模块620具体用于:
将所述第一训练结果划分为多个区域;
针对任一区域,若所述区域中至少两个用户的数据特征处于不同的预设分类范围,则所述区域为混合区域,确定所述第一训练结果包括混合区域;
若所述区域中各用户的数据特征处于相同的预设分类范围,则所述区域为单一区域,确定所述第一训练结果不包括混合区域;所述单一区域包括同种类别的用户的数据特征。
基于相同的技术构思,本发明实施例还提供一种计算机设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述模型构建方法。
基于相同的技术构思,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述模型构建方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种营销模型的构建方法,其特征在于,包括:
获取用户的静态数据和动态数据,确定所述用户的数据特征;
将所述用户的数据特征输入第一训练模型,得到第一训练结果;
判断所述第一训练结果是否包括混合区域;若是,则针对任一混合区域,将所述混合区域中用户的特征数据映射到所述第一训练模型的第二训练模型,得到第二训练结果;所述混合区域包括至少两个类别的用户的数据特征;所述第二训练模型和第一训练模型的输出神经元的数量相同;
将所述第二训练结果作为第一训练结果,直至判断所述第一训练结果不包括混合区域;
根据所述第一训练模型和所述第二训练模型构建营销模型;所述营销模型用于输出用户对营销策略的敏感度。
2.如权利要求1所述的方法,其特征在于,根据用户的静态数据和动态数据确定所述用户的数据特征,包括:
对所述用户的静态数据和动态数据进行特征提取,得到所述用户的静态特征和动态特征;
根据所述用户的静态特征和第一权重、所述用户的动态特征和第二权重确定所述用户的数据特征。
3.如权利要求1所述的方法,其特征在于,将所述用户的数据特征输入第一训练模型之前,还包括:
针对任一用户的数据特征,计算所述用户的数据特征与其他用户的数据特征之间的第一欧式距离;
根据所述第一欧式距离对所述用户进行异常检测。
4.如权利要求3所述的方法,其特征在于,根据所述第一欧式距离对所述用户进行异常检测,包括:
计算所述第一欧氏距离大于第一阈值的数量比例;
判断所述数量比例是否大于第二阈值;若是,则将所述用户确定为异常用户;否则将所述用户确定为正常用户。
5.如权利要求1所述的方法,其特征在于,判断所述第一训练结果是否包括混合区域,包括:
将所述第一训练结果划分为多个区域;
针对任一区域,若所述区域中至少两个用户的数据特征处于不同的预设分类范围,则所述区域为混合区域,确定所述第一训练结果包括混合区域;
若所述区域中各用户的数据特征处于相同的预设分类范围,则所述区域为单一区域,确定所述第一训练结果不包括混合区域;所述单一区域包括同种类别的用户的数据特征。
6.如权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
所述第一训练模型和所述第二训练模型执行以下训练操作:
初始化输出神经元的权重和学习率;
根据待输入数据特征从所述输出神经元中确定获胜神经元;
根据待输入数据特征计算所述获胜神经元的权重,直至所述学习率满足训练条件。
7.如权利要求6所述的方法,其特征在于,根据待输入数据特征从所述输出神经元中确定获胜神经元,包括:
对所述待输入数据特征进行归一化处理;
计算归一化后的数据特征与所述输出神经元的权重的相乘结果;
将最大相乘结果对应的输出神经元确定为获胜神经元;
或
计算所述待输入数据特征与所述输出神经元的权重的第二欧氏距离;
将最小第二欧式距离对应的输出神经元确定为获胜神经元。
8.一种营销模型的构建装置,其特征在于,包括:
确定模块,用于获取用户的静态数据和动态数据,确定所述用户的数据特征;
处理模块,用于将所述用户的数据特征输入第一训练模型,得到第一训练结果;
判断所述第一训练结果是否包括混合区域;若是,则针对任一混合区域,将所述混合区域中用户的特征数据映射到所述第一训练模型的第二训练模型,得到第二训练结果;所述混合区域包括至少两个类别的用户的数据特征;所述第二训练模型和第一训练模型的输出神经元的数量相同;
将所述第二训练结果作为第一训练结果,直至判断所述第一训练结果不包括混合区域;
根据所述第一训练模型和所述第二训练模型构建营销模型;所述营销模型用于输出用户对营销策略的敏感度。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310127830.XA CN116151857A (zh) | 2023-02-17 | 2023-02-17 | 一种营销模型的构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310127830.XA CN116151857A (zh) | 2023-02-17 | 2023-02-17 | 一种营销模型的构建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116151857A true CN116151857A (zh) | 2023-05-23 |
Family
ID=86338717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310127830.XA Pending CN116151857A (zh) | 2023-02-17 | 2023-02-17 | 一种营销模型的构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116151857A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117291649A (zh) * | 2023-11-27 | 2023-12-26 | 云南电网有限责任公司信息中心 | 一种集约化的营销数据处理方法及*** |
-
2023
- 2023-02-17 CN CN202310127830.XA patent/CN116151857A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117291649A (zh) * | 2023-11-27 | 2023-12-26 | 云南电网有限责任公司信息中心 | 一种集约化的营销数据处理方法及*** |
CN117291649B (zh) * | 2023-11-27 | 2024-02-23 | 云南电网有限责任公司信息中心 | 一种集约化的营销数据处理方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009174B (zh) | 风险识别模型训练方法、装置及服务器 | |
US11416867B2 (en) | Machine learning system for transaction reconciliation | |
CN107016026B (zh) | 一种用户标签确定、信息推送方法和设备 | |
CN108345587B (zh) | 一种评论的真实性检测方法与*** | |
CN111966886A (zh) | 对象推荐方法、对象推荐装置、电子设备及存储介质 | |
CN112487284A (zh) | 银行客户画像生成方法、设备、存储介质及装置 | |
CN114997916A (zh) | ***的预测方法、***、电子设备和存储介质 | |
CN112015909A (zh) | 知识图谱的构建方法及装置、电子设备、存储介质 | |
CN114202336A (zh) | 一种金融场景下的风险行为监测方法及*** | |
CN111091409B (zh) | 客户标签的确定方法、装置和服务器 | |
CN116151857A (zh) | 一种营销模型的构建方法及装置 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN111144899A (zh) | 识别虚假交易的方法及装置和电子设备 | |
CN111667307B (zh) | 一种理财产品销量的预测方法及装置 | |
CN112330373A (zh) | 用户行为分析方法、装置及计算机可读存储介质 | |
CN111784403A (zh) | 基于网上商城的用户类别分析方法、装置和计算机设备 | |
CN116821759A (zh) | 类别标签的识别预测方法、装置和处理器及电子设备 | |
Shaji et al. | Weather Prediction Using Machine Learning Algorithms | |
CN113706258B (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 | |
CN115439180A (zh) | 一种目标对象确定方法、装置、电子设备及存储介质 | |
KR102309006B1 (ko) | 인공지능을 이용한 자전거 부품 분류 및 견적 기반 추천 방법 및 시스템 | |
CN114529399A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
Lee et al. | Application of machine learning in credit risk scorecard | |
CN113393303A (zh) | 物品推荐方法、装置、设备及存储介质 | |
CN117009883B (zh) | 对象分类模型构建方法、对象分类方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |