CN110717806A - 产品信息推送方法、装置、设备及存储介质 - Google Patents
产品信息推送方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110717806A CN110717806A CN201910847224.9A CN201910847224A CN110717806A CN 110717806 A CN110717806 A CN 110717806A CN 201910847224 A CN201910847224 A CN 201910847224A CN 110717806 A CN110717806 A CN 110717806A
- Authority
- CN
- China
- Prior art keywords
- information
- preset
- customer
- sub
- piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 91
- 238000007637 random forest analysis Methods 0.000 claims abstract description 48
- 238000003066 decision tree Methods 0.000 claims description 113
- 239000011159 matrix material Substances 0.000 claims description 55
- 230000010354 integration Effects 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 abstract description 11
- 238000012216 screening Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种产品信息推送方法、装置、设备及可读存储介质,所述方法包括:收集历史预设时间段内接收到的各客户的各客户信息;基于预设的流形学习算法模型对所述各客户信息进行降维处理,得到降维信息;将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。本发明基于智能决策的方式解决由于难以精准筛选有用的客户信息,致使保险产品信息推送不精准的技术问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种产品信息推送方法、装置、设备及可读存储介质。
背景技术
在大数据时代,客户的相关信息越来越多,维度高,复杂性高,现有技术中,使用原始数据分析方法即是通过手动方式获取有用的客户信息,现有的原始数据分析方法很难从大量的冗余数据中获取到有用的客户信息,浪费人力、物力、财力,且难以准确得到有用的客户信息,因而,也难以根据有用的客户信息进行精准推荐。
发明内容
本发明的主要目的在于提供一种产品信息推送方法、装置、设备及可读存储介质,旨在解决现有技术中,由于难以精准筛选有用的客户信息,致使保险产品信息推送不精准的技术问题。
为实现上述目的,本发明提供一种产品信息推送方法,所述产品信息推送方法包括:
收集历史预设时间段内接收到的各客户的各客户信息;
从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;
根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;
将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
可选地,所述从所述流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵步骤包括:
根据预设的欧式距离算法,获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个欧式距离;
根据所述各个欧式距离的大小,获取每条客户信息的预设个数的近邻样本;
根据预设的局部协方差算法,确定所述每条客户信息与所述各个样本信息的权重系数向量;
根据所述权重系数向量、与预设的权重系数向量与局部重建权值矩阵的关联关系,确定所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵。
可选地,所述从所述流形学习算法模型中获取每条客户信息的预设个数的近邻样本步骤之前包括:
获取所述客户信息每个子维度的名称,根据所述每个子维度的名称确定所述客户信息维度整合的整合顺序,其中,所述整合顺序包括根据每个子维度的名称的首位字母在字母表中的先后顺序确定;
根据所述整合顺序对所述客户信息进行维度整合,得到整合后的客户信息。
可选地,所述将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果步骤之前包括:
获取预设的用例以及所述降维信息的各个子维度;
从所述降维信息进行不同次数的不同个数的子维度的随机选取,以进行不同决策树群集的构建,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的;
其中,决策树群集生成过程为:从所有N个降维信息的子维度中选取n个子维度,n小于N,并随机确定所述n个子维度的决策影响度,基于该n个子维度以及n个子维度的决策影响度得到一颗决策树,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的,建立m棵决策树,这m棵决策树形成随机森林,网格搜索各个决策树数量,得到各个决策树群集;
将所述用例中的预设比例的用例设为第一用例,所述第一用例外的其他用例设为第二用例;
将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,并将所述第二用例作为测试用例进行所述决策树群集的测试,以从所有决策树群集中选取测试误差小于预设误差值的最优的目标决策树群集,将所述目标决策树群集设置为预设的随机森林算法模型。
可选地,所述将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果步骤包括:
将所述降维信息输入至预设的随机森林算法模型中,获取预设的随机森林算法模型中不同决策树对所述降维信息的分类,得到不同初始目标分类结果;
根据不同初始目标分类结果的分类占比,确定目标分类结果。
本发明还提供一种产品信息推送装置,所述产品信息推送装置包括:
收集模块,用于收集历史预设时间段内接收到的各客户的各客户信息;
第一获取模块,用于从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;
第二获取模块,用于根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;
分类模块,用于将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
第三获取模块,用于获取预设的客户类型与不同保险产品的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推荐保险产品。可选地,所述第一获取模块包括:
第一获取单元,用于根据预设的欧式距离算法,获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个欧式距离;
第二获取单元,用于根据所述各个欧式距离的大小,获取每条客户信息的预设个数的近邻样本;
第一确定单元,用于根据预设的局部协方差算法,确定所述每条客户信息与所述各个样本信息的权重系数向量;
第二确定单元,用于根据所述权重系数向量、与预设的权重系数向量与局部重建权值矩阵的关联关系,确定所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵。
可选地所述产品信息推送装置包括:
第四获取模块,用于获取所述客户信息每个子维度的名称,根据所述每个子维度的名称确定所述客户信息维度整合的整合顺序,其中,所述整合顺序包括根据每个子维度的名称的首位字母在字母表中的先后顺序确定;
整合模块,用于根据所述整合顺序对所述客户信息进行维度整合,得到整合后的客户信息。
可选地,所述产品信息推送装置包括:
第五获取模块,用于获取预设的用例以及所述降维信息的各个子维度;
随机选取模块,用于从所述降维信息进行不同次数的不同个数的子维度的随机选取,以进行不同决策树群集的构建,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的;
其中,决策树群集生成过程为:从所有N个降维信息的子维度中选取n个子维度,n小于N,并随机确定所述n个子维度的决策影响度,基于该n个子维度以及n个子维度的决策影响度得到一颗决策树,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的,建立m棵决策树,这m棵决策树形成随机森林,网格搜索各个决策树数量,得到各个决策树群集;
设置模块,用于将所述用例中的预设比例的用例设为第一用例,所述第一用例外的其他用例设为第二用例;
调整训练模块,用于将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,并将所述第二用例作为测试用例进行所述决策树群集的测试,以从所有决策树群集中选取测试误差小于预设误差值的最优的目标决策树群集,将所述目标决策树群集设置为预设的随机森林算法模型。
可选地,所述分类模块包括:
第三获取单元,用于将所述降维信息输入至预设的随机森林算法模型中,获取预设的随机森林算法模型中不同决策树对所述降维信息的分类,得到不同初始目标分类结果;
分类单元,用于根据不同初始目标分类结果的分类占比,确定目标分类结果。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
收集历史预设时间段内接收到的各客户的各客户信息;
基于预设的流形学习算法模型对所述各客户信息进行降维处理,得到降维信息;
将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
本发明通过收集历史预设时间段内接收到的各客户的各客户信息;从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。在本申请中,根据预设的流形学习算法模型进行有用客户信息的筛选,然后再根据随机森林算法模型与该有用的客户信息进行客户的分类,在分类后,根据预设的客户类型与不同保险产品的关联关系以实现对不同类型的客户进行保险产品的精准推荐,因而解决了难以精准筛选有用的客户信息,致使保险产品信息推送不精准的技术问题。
附图说明
图1为本发明产品信息推送方法第一实施例的流程示意图;
图2为本发明产品信息推送方法中基于预设的流形学习算法模型对所述各客户信息进行降维处理,得到降维信息步骤的细化流程示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种产品信息推送方法,在本发明产品信息推送方法的第一实施例中,参照图1,所述产品信息推送方法包括:
步骤S10,收集历史预设时间段内接收到的各客户的各客户信息;
步骤S20,从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;
步骤S30,根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;
步骤S40,将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
步骤S50,获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
具体步骤如下:
步骤S10,收集历史预设时间段内接收到的各客户的各客户信息;
在本实施例中,产品信息推送方法应用于产品信息推送***,收集过去预设时间段内产品信息推送***获取的各客户的客户信息,可以是半年,预设时间段可以是一年。
具体地,客户信息包括客户姓名,年龄,住址,学历,工资,身份证号码等子维度,进行客户信息的采集的目的在于确保客户信息的及时有效性,以根据最新鲜的数据实现精准推荐的目的,在获取客户信息后,对客户信息进行维度的整合,进行维度的整合即是:将不同子维度的客户信息按照一定的顺序进行有序排序,例如,客户信息中包括姓名,住址,学历,年龄等子维度,则确定客户信息按照姓名,年龄,住址,学历的顺序进行客户信息的排列,例如按照张三,25岁,住址深圳南山,大学学历等顺序排列,排序的目的在于在进行降维处理时能够有序确定客户信息的坐标。
步骤S20,从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;
在本实施例中,在得到客户信息后,基于预设的流形学习算法模型对所述整合信息进行降维处理,得到降维信息,其中,预设的流形学习算法模型是预存的且已经训练好的能够对整合信息进行降维处理的模型,在预设的流形学习算法模型中,主要基于流行学习算法进行整合信息的降维处理。
在本实施例中,将所述客户信息输入至所述预设的流形学习算法模型中,预设的流形学习算法模型首先对各个客户的客户信息进行坐标位置确定处理,在确定客户信息的坐标位置后,对所述客户信息进行预设个数的近邻样本确定处理,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵。
所述从所述流形学习算法模型中获取每条客户信息的预设个数的近邻样本步骤之前包括:
步骤A1,获取所述客户信息每个子维度的名称,根据所述每个子维度的名称确定所述客户信息维度整合的整合顺序,其中,所述整合顺序包括根据每个子维度的名称的首位字母在字母表中的先后顺序确定;
在本实施例中,整合顺序是根据所述每个子维度的名称确定的,具体地,是根据每个子维度的名称的首位字母在字母表中的先后顺序确定,若不同子维度的名称的首位字母相同,则根据不同子维度的名称的次位字母在字母表中的先后顺序确定,其中,名称的首位字母在字母表中越靠前,则在整合顺序中越靠前,例如,学历X在住址Z之前,因而,整合顺序中学历在住址之前。
步骤A2,根据所述整合顺序对所述客户信息进行维度整合,得到整合后的客户信息。
根据所述整合顺序对所述客户信息进行维度整合,得到整合后的客户信息。
具体地,所述从所述流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵步骤包括:
步骤S211,根据预设的欧式距离算法,获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个欧式距离;
在本实施例中,流形学习算法模型中包括各个客户样本,该各个客户样本简称为样本,样本对应有样本的客户信息,样本的客户信息简称为样本信息,该样本信息也包括客户姓名,年龄,住址,学历,工资,身份证号码等子维度,其中,流形学习算法模型中各个样本对应的样本信息的坐标是确定的。
流形学习算法模型中包括欧式距离算法或者是余弦算法(现有的计算公式),以获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个欧式距离,或者获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个余弦距离,其中欧式距离的计算公式为:
其中,在上述(1)公式中,D为欧式距离,X与Y分别为某一维度下的样本信息与客户信息。
步骤S212,根据所述各个欧式距离的大小,获取每条客户信息的预设个数的近邻样本;
在确定各个欧式距离后,根据所述各个欧式距离的大小从低至高获取每条客户信息的预设个数的近邻样本,也即对每条客户信息而言,都选取预设个数的近邻样本,其中,预设个数的值可以为7或者8。
步骤S213,根据预设的局部协方差算法,确定所述每条客户信息与所述各个样本信息的权重系数向量;
根据预设的局部协方差算法,确定所述每条客户信息与所述各个样本信息的权重系数向量,具体确定过程包括:
假设客户信息xi的近邻样本为(xi1,xi2,...,xik),则获取预设的局部协方差算法,求出局部协方差矩阵Zi=(xi-xj)T(xi-xj),基于该局部协方差矩阵Zi=(xi-xj)T(xi-xj),求出对应的权重系数向量Wi;
Wi=(Zi-11k)/(1kTZi-11k)
其中,最近邻数为k。
步骤S214,根据所述权重系数向量、与预设的权重系数向量与局部重建权值矩阵的关联关系,确定所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵。
在得到权重系数向量后,由权重系数向量Wi组成权重系数矩阵W,计算矩阵M=(I-W)(I-W)T。
步骤S30,根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;
在得到局部重建权值矩阵后,根据所述局部重建权值矩阵与所述样本信息对应的样本矩阵确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息,降维信息是从客户信息中选取得到的对精准推荐有用的信息或者影响大的客户信息。
步骤S40,将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
在得到降维信息后,将降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果,其中,预设的随机森林算法模型是能够基于降维信息进行客户分类的模型。在本实施例中,是将降维信息而不是全部的客户信息作为输入数据输入至预设的随机森林算法模型中,因而,能够提升预测的准确性。
步骤S50,获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
在得到目标分类结果后,获取用户的目标类型,获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息,例如,客户的类型为高知型,向所述各客户定向推荐Q保险,客户的类型为谨慎型,向所述各客户定向推荐T保险。
本发明通过收集历史预设时间段内接收到的各客户的各客户信息;从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。在本申请中,根据预设的流形学习算法模型进行有用客户信息的筛选,然后再根据随机森林算法模型与该有用的客户信息进行客户的分类,在分类后,根据预设的客户类型与不同保险产品的关联关系以实现对不同类型的客户进行保险产品的精准推荐,因而解决了难以精准筛选有用的客户信息,致使保险产品信息推送不精准的技术问题。
进一步地,本发明提供产品信息推送方法的另一实施例,在该实施例中,所述将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果步骤之前包括:
步骤B1,获取预设的用例以及所述降维信息对应的各个子维度;
需要说明的是,在本实施例中,在得到预设的随机森林算法模型前需要经过多次的训练以及测试处理,其中,在处理前,需要获取预存的用例以及所述降维信息的各个子维度,其中,所述降维信息的各个子维度指的是维度,而不是具体的维度信息,如降维信息中的学历维度,而不是学历为硕士的具体内容。
其中,随机森林是由很多独立的决策树组成的一个森林,每棵决策树之间相互独立,每棵树的权重相等,利用Python的sklearn库可以快速便捷地生成大量决策树,决策树即是分类过程,具体地,决策树每个节点表示一个属性上的测试,每个分支代表一个测试输出,每个决策树上的节点代表一种类别。
步骤B2,从所述降维信息进行不同次数的不同个数的子维度的随机选取,以进行不同决策树群集的构建,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的;
其中,决策树群集生成过程为:从所有N个降维信息的子维度中选取n个子维度,n小于N,并随机确定所述n个子维度的决策影响度,基于该n个子维度以及n个子维度的决策影响度得到一颗决策树,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的,建立m棵决策树,这m棵决策树形成随机森林,网格搜索各个决策树数量,得到各个决策树群集。
在得到降维信息后,从所述降维信息进行不同次数的不同个数的子维度的随机选取,以进行不同决策树群集的构建,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的。
决策树生成过程可是:从所有N个降维信息的子维度中选取n个子维度,n小于N,并随机确定该n个子维度的决策影响度,基于该n个子维度以及n个子维度的决策影响度得到一颗决策树,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的,重复以上m次,即建立了m棵决策树,这m棵决策树形成随机森林,重复以上两步w次,即建立了w棵决策树,这w棵决策树也可形成随机森林,网格搜索各个决策树数量,得到各个决策树群集。
步骤B3,将所述用例中的预设比例的用例设为第一用例,第一训练用例外的其他用例设为第二用例;
在得到各个决策树群集后,将所述用例中的预设比例的用例设为第一用例,第一训练用例外的其他用例设为第二用例,需要说明的是,可以通过放回抽样的方式进行多个第一用例以及对应多个第二用例的设置,以更准确地基于多个第一用例以及对应多个第二用例进行目标决策树群集的确定。
步骤B4,将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,并将所述第二用例作为测试用例进行所述决策树群集的测试,以从所有决策树群集中选取测试误差小于预设误差值的最优的目标决策树群集,将所述目标决策树群集设置为预设的随机森林算法模型。
在得到第一用例以及第二用例后,将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,具体地,将第一用例输入至该各个不同的目标决策树群集型中,得到各个训练结果,以判断第一用例中有多少被预测正确了,以得到最接近真实记录结果时的决策树群集,在得到最接近真实记录结果时的决策树群集后,再将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,并将所述第二用例作为测试用例进行所述决策树群集的测试,从所有决策树群集中选取测试误差小于预设误差值的最优的目标决策树群集,将所述目标决策树群集设置为预设的随机森林算法模型。
在本实施例中,通过获取预设的用例以及所述降维信息的各个子维度;从所述降维信息进行不同次数的不同个数的子维度的随机选取,以进行不同决策树群集的构建,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的;将所述用例中的预设比例的用例设为第一用例,第一训练用例外的其他用例设为第二用例;将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,并将所述第二用例作为测试用例进行所述决策树群集的测试,以从所有决策树群集中选取测试误差小于预设误差值的最优的目标决策树群集,将所述目标决策树群集设置为预设的随机森林算法模型。在本实施例中,随机森林算法是基于降维信息进行决策树的构建,因而,避免无用的客户信息影响保险产品的推荐。
进一步地,本发明提供产品信息推送方法的另一实施例,在该实施例中,所述将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果步骤包括:
步骤C1,将所述降维信息输入至预设的随机森林算法模型中,获取预设的随机森林算法模型中不同决策树对所述降维信息的分类,得到不同初始目标分类结果;
在本实施例中,在得到目标分类结果前,是基于随机森林算法模型中不同决策树对所述降维信息的分类结果确定的,不同决策树对所述降维信息的分类结果可以是不同的,例如,A决策树对所述降维信息的分类结果为0,B决策树对所述降维信息的分类结果为1.
步骤C2,根据不同初始目标分类结果的分类占比,确定目标分类结果。
根据不同初始目标分类结果的分类占比,确定目标分类结,如降维信息的分类结果为0的占比为80%,降维信息的分类结果为1的占比为20%,确定目标分类结果为0。
在本实施例中,通过将所述降维信息输入至预设的随机森林算法模型中,获取预设的随机森林算法模型中不同决策树对所述降维信息的分类,得到不同初始目标分类结果;根据不同初始目标分类结果的分类占比,确定目标分类结果。提升了分类的准确性。
参照图3,图3是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例产品信息推送设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面3)播放器、便携计算机等终端设备。
如图3所示,该产品信息推送设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该产品信息推送设备还可以包括目标用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。目标用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选目标用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的产品信息推送设备结构并不构成对产品信息推送设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块以及产品信息推送程序。操作***是管理和控制产品信息推送设备硬件和软件资源的程序,支持产品信息推送程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与产品信息推送设备中其它硬件和软件之间通信。
在图3所示的产品信息推送设备中,处理器1001用于执行存储器1005中存储的产品信息推送程序,实现上述任一项所述的产品信息推送方法的步骤。
本发明产品信息推送设备具体实施方式与上述产品信息推送方法各实施例基本相同,在此不再赘述。
本发明还提供一种产品信息推送装置,所述产品信息推送装置包括:
收集模块,用于收集历史预设时间段内接收到的各客户的各客户信息;
降维模块,用于基于预设的流形学习算法模型对所述各客户信息进行降维处理,得到降维信息;
分类模块,用于将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
第一获取模块,用于获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
本发明产品信息推送装置具体实施方式与上述产品信息推送方法各实施例基本相同,在此不再赘述。
本发明提供了一种可读存储介质,所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的产品信息推送方法的步骤。
本发明可读存储介质具体实施方式与上述产品信息推送方法各实施例基本相同,在此不再赘述。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利处理范围内。
Claims (10)
1.一种产品信息推送方法,其特征在于,所述产品信息推送方法包括:
收集历史预设时间段内接收到的各客户的各客户信息;
从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;
根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;
将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
2.如权利要求1所述的产品信息推送方法,其特征在于,所述从所述流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵步骤包括:
根据预设的欧式距离算法,获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个欧式距离;
根据所述各个欧式距离的大小,获取每条客户信息的预设个数的近邻样本;
根据预设的局部协方差算法,确定所述每条客户信息与所述各个样本信息的权重系数向量;
根据所述权重系数向量、与预设的权重系数向量与局部重建权值矩阵的关联关系,确定所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵。
3.如权利要求1所述的产品信息推送方法,其特征在于,所述从所述流形学习算法模型中获取每条客户信息的预设个数的近邻样本步骤之前包括:
获取所述客户信息每个子维度的名称,根据所述每个子维度的名称确定所述客户信息维度整合的整合顺序,其中,所述整合顺序包括根据每个子维度的名称的首位字母在字母表中的先后顺序确定;
根据所述整合顺序对所述客户信息进行维度整合,得到整合后的客户信息。
4.如权利要求1所述的产品信息推送方法,其特征在于,所述将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果步骤之前包括:
获取预设的用例以及所述降维信息的各个子维度;
从所述降维信息进行不同次数的不同个数的子维度的随机选取,以进行不同决策树群集的构建,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的;
其中,决策树群集生成过程为:从所有N个降维信息的子维度中选取n个子维度,n小于N,并随机确定所述n个子维度的决策影响度,基于该n个子维度以及n个子维度的决策影响度得到一颗决策树,其中,所有决策树群集中每颗决策树的节点上子维度的决策影响度是随机的,建立m棵决策树,这m棵决策树形成随机森林,网格搜索各个决策树数量,得到各个决策树群集;
将所述用例中的预设比例的用例设为第一用例,所述第一用例外的其他用例设为第二用例;
将所述第一用例作为训练用例进行所述不同决策树群集中决策影响度的调整训练,并将所述第二用例作为测试用例进行所述决策树群集的测试,以从所有决策树群集中选取测试误差小于预设误差值的最优的目标决策树群集,将所述目标决策树群集设置为预设的随机森林算法模型。
5.如权利要求4所述的产品信息推送方法,其特征在于,所述将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果步骤包括:
将所述降维信息输入至预设的随机森林算法模型中,获取预设的随机森林算法模型中不同决策树对所述降维信息的分类,得到不同初始目标分类结果;
根据不同初始目标分类结果的分类占比,确定目标分类结果。
6.一种产品信息推送装置,其特征在于,所述产品信息推送装置包括:
收集模块,用于收集历史预设时间段内接收到的各客户的各客户信息;
第一获取模块,用于从预设流形学习算法模型中获取每条客户信息的预设个数的近邻样本,并获取所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵;
第二获取模块,用于根据所述局部重建权值矩阵与所述样本信息确定所述客户信息的低维矩阵,以根据所述低维矩阵得到降维信息;
分类模块,用于将所述降维信息输入至预设的随机森林算法模型中,以对所述各客户进行分类,并得到目标分类结果;
第三获取模块,用于获取预设的客户类型与不同产品信息的关联关系,根据所述关联关系与所述目标分类结果,向所述各客户定向推送对应的产品信息。
7.如权利要求6所述的产品信息推送装置,其特征在于,所述第一获取模块包括:
第一获取单元,用于根据预设的欧式距离算法,获取所述每条客户信息与所述流形学习算法模型中各个样本对应的样本信息的各个欧式距离;
第二获取单元,用于根据所述各个欧式距离的大小,获取每条客户信息的预设个数的近邻样本;
第一确定单元,用于根据预设的局部协方差算法,确定所述每条客户信息与所述各个样本信息的权重系数向量;
第二确定单元,用于根据所述权重系数向量、与预设的权重系数向量与局部重建权值矩阵的关联关系,确定所述近邻样本对应的样本信息与所述每条客户信息的局部重建权值矩阵。
8.如权利要求1所述的产品信息推送方法,其特征在于,所述产品信息推送装置包括:
第四获取模块,用于获取所述客户信息每个子维度的名称,根据所述每个子维度的名称确定所述客户信息维度整合的整合顺序,其中,所述整合顺序包括根据每个子维度的名称的首位字母在字母表中的先后顺序确定;
整合模块,用于根据所述整合顺序对所述客户信息进行维度整合,得到整合后的客户信息。
9.一种产品信息推送设备,其特征在于,所述产品信息推送设备包括:存储器、处理器,通信总线以及存储在所述存储器上的产品信息推送程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述产品信息推送程序,以实现如权利要求1至5中任一项所述的产品信息推送方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有产品信息推送程序,所述产品信息推送程序被处理器执行时实现如权利要求1至5中任一项所述的产品信息推送方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910847224.9A CN110717806B (zh) | 2019-09-06 | 2019-09-06 | 产品信息推送方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910847224.9A CN110717806B (zh) | 2019-09-06 | 2019-09-06 | 产品信息推送方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110717806A true CN110717806A (zh) | 2020-01-21 |
CN110717806B CN110717806B (zh) | 2024-04-02 |
Family
ID=69209738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910847224.9A Active CN110717806B (zh) | 2019-09-06 | 2019-09-06 | 产品信息推送方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717806B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353860A (zh) * | 2020-03-30 | 2020-06-30 | 中国建设银行股份有限公司 | 产品信息推送方法及*** |
CN111371853A (zh) * | 2020-02-24 | 2020-07-03 | ***股份有限公司 | 资源信息推送方法、装置、服务器及存储介质 |
CN112016098A (zh) * | 2020-09-01 | 2020-12-01 | 中国平安财产保险股份有限公司 | 扫描结果的处理方法、装置、计算机设备和存储介质 |
CN114266601A (zh) * | 2021-12-24 | 2022-04-01 | 深圳前海微众银行股份有限公司 | 营销策略确定方法、装置、终端设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653670A (zh) * | 2015-12-29 | 2016-06-08 | 中国电力科学研究院 | 一种基于流形学习聚类算法的智能用电数据挖掘方法 |
EP3048563A1 (en) * | 2015-01-22 | 2016-07-27 | Alcatel Lucent | Method and system for incremental manifold learning |
CN106503205A (zh) * | 2016-10-25 | 2017-03-15 | 四川大学 | 一种基于非线性流形学习的歌曲推荐方法 |
CN109409923A (zh) * | 2018-09-03 | 2019-03-01 | 平安普惠企业管理有限公司 | 销售区域的分配方法、计算机可读存储介质及终端设备 |
CN110163657A (zh) * | 2019-04-12 | 2019-08-23 | 中国平安财产保险股份有限公司 | 基于流形学习算法的保险产品推荐方法及相关设备 |
-
2019
- 2019-09-06 CN CN201910847224.9A patent/CN110717806B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3048563A1 (en) * | 2015-01-22 | 2016-07-27 | Alcatel Lucent | Method and system for incremental manifold learning |
CN105653670A (zh) * | 2015-12-29 | 2016-06-08 | 中国电力科学研究院 | 一种基于流形学习聚类算法的智能用电数据挖掘方法 |
CN106503205A (zh) * | 2016-10-25 | 2017-03-15 | 四川大学 | 一种基于非线性流形学习的歌曲推荐方法 |
CN109409923A (zh) * | 2018-09-03 | 2019-03-01 | 平安普惠企业管理有限公司 | 销售区域的分配方法、计算机可读存储介质及终端设备 |
CN110163657A (zh) * | 2019-04-12 | 2019-08-23 | 中国平安财产保险股份有限公司 | 基于流形学习算法的保险产品推荐方法及相关设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111371853A (zh) * | 2020-02-24 | 2020-07-03 | ***股份有限公司 | 资源信息推送方法、装置、服务器及存储介质 |
CN111353860A (zh) * | 2020-03-30 | 2020-06-30 | 中国建设银行股份有限公司 | 产品信息推送方法及*** |
CN112016098A (zh) * | 2020-09-01 | 2020-12-01 | 中国平安财产保险股份有限公司 | 扫描结果的处理方法、装置、计算机设备和存储介质 |
CN112016098B (zh) * | 2020-09-01 | 2023-09-08 | 中国平安财产保险股份有限公司 | 扫描结果的处理方法、装置、计算机设备和存储介质 |
CN114266601A (zh) * | 2021-12-24 | 2022-04-01 | 深圳前海微众银行股份有限公司 | 营销策略确定方法、装置、终端设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110717806B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717806B (zh) | 产品信息推送方法、装置、设备及存储介质 | |
US11526799B2 (en) | Identification and application of hyperparameters for machine learning | |
US10235602B1 (en) | Machine learning artificial intelligence system for identifying vehicles | |
CN105027162B (zh) | 图像解析装置、图像解析***、图像解析方法 | |
CN112528025A (zh) | 基于密度的文本聚类方法、装置、设备及存储介质 | |
WO2019019255A1 (zh) | 建立预测模型的装置、方法、预测模型建立程序及计算机可读存储介质 | |
CN111797927A (zh) | 用于确定机器学习样本的重要特征的方法及*** | |
CN104993962A (zh) | 获取终端使用状态的方法和*** | |
WO2022193753A1 (zh) | 持续学习方法、装置、终端及存储介质 | |
CN112084812B (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN110059212A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
JPWO2009031297A1 (ja) | 画像検索装置、画像分類装置及び方法並びにプログラム | |
CN110363206B (zh) | 数据对象的聚类、数据处理及数据识别方法 | |
CN110378516B (zh) | 分析师画像生成方法、装置、设备及计算机可读存储介质 | |
CN118094118A (zh) | 数据集质量评估方法、***、电子设备及存储介质 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN111275683B (zh) | 图像质量评分处理方法、***、设备及介质 | |
CN116894721A (zh) | 一种指标预测方法、装置、计算机设备 | |
US20160357708A1 (en) | Data analysis method, data analysis apparatus, and recording medium having recorded program | |
CN110163657B (zh) | 基于流形学习算法的保险产品推荐方法及相关设备 | |
CN111966851B (zh) | 基于少量样本的图像识别方法和*** | |
CN114529892A (zh) | 卡证信息检测方法、装置、计算机设备和存储介质 | |
CN113515701A (zh) | 信息推荐方法及装置 | |
CN111291829A (zh) | 一种精选图片的自动确定方法和*** | |
CN114139657B (zh) | 客群画像生成方法、装置、电子设备和储存介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |