CN108694606B - 一种基于关联规则的客户画像及服务推送方法 - Google Patents

一种基于关联规则的客户画像及服务推送方法 Download PDF

Info

Publication number
CN108694606B
CN108694606B CN201810447891.3A CN201810447891A CN108694606B CN 108694606 B CN108694606 B CN 108694606B CN 201810447891 A CN201810447891 A CN 201810447891A CN 108694606 B CN108694606 B CN 108694606B
Authority
CN
China
Prior art keywords
data
density
point
distance
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810447891.3A
Other languages
English (en)
Other versions
CN108694606A (zh
Inventor
赵学健
范章章
孙知信
孙哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201810447891.3A priority Critical patent/CN108694606B/zh
Publication of CN108694606A publication Critical patent/CN108694606A/zh
Application granted granted Critical
Publication of CN108694606B publication Critical patent/CN108694606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于关联规则的客户画像及服务推送方法,针对传统物流定制化服务推荐的盲目性和机械性的问题,采用数据挖掘技术中的聚类分析与关联规则相结合的办法,多层次的分析客户的信息数据,并根据数据间的关联分析客户不同的需求,从而实现对客户的定制化服务推送。本发明可以实现对物流客户的各种信息的聚类分析,建立物流需求行为的客户画像,在此基础上进行的定制化服务推送,可以有效提高客户满意度及忠诚度。

Description

一种基于关联规则的客户画像及服务推送方法
技术领域
本发明涉及一种基于关联规则的客户画像及服务推送方法,尤其是基于密度的K-中心点聚类和多层次的关联规则分析的客户画像及服务推送,属于聚类分析结合关联规则技术领域。
背景技术
快递配送在当前生活中的应用越来越广泛,在它为广大的网购用户提供方便的同时也给各快递公司带来了很多的问题。客户画像技术不仅能够有效的标识客户,而且可以精准定位客户需求与喜好,从而在实现目标客户多群细分的同时,使得快递公司的服务大大提高了效率。客户画像技术的众多优势促使其应用领域日益广阔,最近几年,该技术逐渐深入到金融、管理、营销、推广等众多领域,客户画像技术也因此日益受到快递界的关注和青睐。
目前,研究者提出了多种不同的改进方法提高客户画像的效率和精准度,从而更好的实现客户定制化服务推送。但是依然存在着一些问题没有更好的解决:(1)客户信息数据是庞大的,如何有效的处理并使用这些数据是需要解决的问题;(2)客户信息数据具有不完整性,如何提取隐含的、未知的、有用的信息是需要解决的问题;(3)客户的信息数据是动态的且不稳定的,如何及时更新客户信息数据是需要解决的问题;(4)客户与客户之间的信息会存在共性与差异性,如何解决共性与差异性是需要解决的问题。因此,本发明基于聚类分析和关联规则相结合提出一种基于密度的K-中心点聚类和多层次的关联规则分析的客户画像及服务推送。
发明内容
本发明的目的在于:针对现有技术存在的缺陷,提出一种基于关联规则的客户画像及定制化服务推送方法,以期望解决现有技术中物流服务平台只能简单、粗放的推送信息,无法对客户的需求进行挖掘分析,不能满足客户的个性化需求等技术问题。
为了达到以上目的,本发明提供了一种基于关联规则的客户画像及服务推送方法,包括如下步骤:
步骤1.确立中心点,收集客户信息并进行分类整理,利用基于密度的k-中心点算法,确定所有的中心点;
步骤2.根据分类信息中的占比分布情况,建立均衡簇内与簇间距离的目标函数;
步骤3.根据设定的初始化的中心点输出不同的聚类结果;
步骤4.对输出的聚类结果数据预处理,层次划分构建多层次数据集;每个数据项之间会存在概念层次,通过建立某些高层次的规则也会显示有用的信息。
步骤5.对数据集扫描,设置最小支持度,找到频繁项集,支持度大于等于最小支持度的项目组称为高频项目组,找出数据中的高频项目组,直到无法再找到更长的高频项目组为止;
步骤6.设置最小支持度,找到频繁项集;设置最小置信度,由频繁项集产生关联规则;在多个不同的层次对数据进行关联分析,输出分析结果;
步骤7.根据结果对客户进行定制化服务推送。
进一步的,所述步骤1中利用基于密度的k-中心点算法,首先计算每个样本的密度和样本的平均密度,将样本密度大于平均密度的样本放在集合中,取最大的密度点作为第一个中心,再取离第一个中心点最远的高密度点作为第二个中心点,以此类推以确定所有的中心点。
所述k-中心点算法中,每个样本的密度计算公式为:
D(x)={o∈C|dist(x,o)≤r} (1)
其中,dist是某种距离度量,r为半径,C为相似度序列数据集,式(1)表明以x为中心点,r为半径组成的球体所包含的样本数;r规定为r=p×q,q为给定常数,而p则为两两数据对象距离的均值,见式(2)
Figure RE-GDA0001792282100000021
样本的平均密度为:
Figure BDA0001657692530000031
将样本密度大于平均密度AD(x)的样本全部放在集合L中,L可以表示为
L={xi|D(xi)>AD(x)}i=1,2,L,n (4)
在L中取最大密度点作为第一个聚类中心Y1,并从L中删除;取距离Y1最远的高密度点作为第二个中心点Y2;重复以上两步直至找到k个中心点;最终k 个中心点就是相隔距离较远的k个处于高密度区域的点,从而以保证聚类结果的稳定性,避免初始中心选择的随机性。
进一步的,所述步骤2中,一个目标函数用来评估划分的质量,使得簇内对象相互相似,而与其他簇中的对象相异。也就是说该目标函数以簇内高相似和簇间低相似性为目标。传统的聚类方法都是以簇内节点到中心点距离和最小作为目标函数,没有考虑到簇间的影响。基于此本文提出了新的目标函数,均衡簇内与簇间距离,当E值越小则表明分类效果越好,以此建立目标函数:
Figure BDA0001657692530000032
其中,θ簇间距离的权重是簇内距离的θ倍,一般取值为1,in(d)为簇内距离和,即簇内每一点到它所属类中心的距离的平方和,out(d)为簇间距离和,即不同聚类中心间的距离
Figure BDA0001657692530000033
进一步的,所述步骤4中,预处理的方法为:对输出的聚类结果数据通过所有数据点的坐标值进行计算和分析,计算得到各个数据点的局部离群点因子,利用离群点去噪将各个子点组内的异常的数据点移除;对离群点去噪后的所有数据点进行拟合并移除偏差较大的数据点,并输出去噪后数据组;
所述数据集划分成三层,依次是中心服务器层,数据服务器层和用户层。
进一步的,所述步骤6中,设置最小支持度,找到频繁项集;
Figure BDA0001657692530000034
设置最小置信度,由频繁项集产生关联规则;
Figure BDA0001657692530000041
在多个不同的层次对数据进行关联分析,输出分析结果。
进一步的,所述步骤7中,根据结果对客户进行定制化服务推送,所述定制化服务推送根据商户的地理位置及分类数据进行设置,告知电商客户可以一起销售的捆绑包,设置相应的交叉销售。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(1)将客户的基本信息以及信息之间隐含的内容都进行聚类分析;(2) 减少了数据分析时的不必要繁琐操作,大大提高了分析效率;(3)通过关联规则挖掘客户的实际需求,可有效提高客户体验以及客户忠诚度。
附图说明
下面结合附图对本发明作进一步的说明。
图1是本发明中基于密度的k-中心点聚类分析的流程框图。
图2是本发明中关联规则挖掘基本模型示意图。
具体实施方式
下面对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
本发明提供的一种基于关联规则的客户画像及定制化服务推送方法,基于密度的K-中心点聚类和多层次的关联规则分析,包括如下步骤:
步骤1,收集淘宝服装商家的基本资料信息,将商家所售商品分类整理,把所有服装分为男子、女子、儿童等,其中又细分为上衣、裤子、鞋子、内衣等。
步骤2,根据每件服装的在线销售及关注情况在各类中的占比分布情况,确定样本的中心点,考虑样本类间与样本类内的距离确定目标函数。
步骤3,再根据每个样本点距离各个中心点的距离,也就是每件服装在将样本点分配到距离其最近的初始聚类中心所在的子类中。
步骤4,根据前面处理得到的相关数据,确定“服装类型占比”和“种类搭配复杂度”两大类变量,先对变量1“服装类型占比”进行聚类,对聚类出的需求状态根据变量2“种类搭配复杂度”再聚类,以此得到细分的客户需求状态。
步骤5,对上一步骤聚类的结果进行深度聚类,进一步细化需求状态的类型,分析淘宝用户在商家店铺里的浏览记录,对哪件服装收藏度高,哪种服装搭配受欢迎度高。
步骤6,根据以上的操作可以得出,商品浏览型的需求状态最多,其次是多次搜索型的需求状态占比也比较高,这两种类型的顾客说明有强烈的购物需求,而占比较少的随意浏览型顾客则相对购物需求不大。
步骤7,对聚类处理过的数据建立最小置信度为70%和最小支持度为15%,即购买服装A在总销售数N中出现的概率为70%和购买服装A后又购买服装B 的条件概率为15%,如某位顾客购买了夹克之后又购买了牛仔裤。
步骤8,在步骤7的基础上加入多层次的概念,即将具体的服装向上一层次的抽象概念推进,从而产生各服装之间的隐含关联关系,建立顾客的兴趣度模型。
步骤9根据关联之后的数据判断该淘宝商家的销售情况,建立个性化的推荐服务,向商家推荐每天的服装预售情况,哪种服装搭配会更加吸引顾客的关注,同时也可对商家进行的上门取件服务时间进行预判,从而有效的提高服务效率,提高商家的满意度。

Claims (4)

1.一种基于关联规则的客户画像及服务推送方法,其特征在于:包括如下步骤:
步骤1.确立中心点,收集客户信息并进行分类整理,利用基于密度的k-中心点算法,确定所有的中心点;利用基于密度的k-中心点算法,首先计算每个样本的密度和样本的平均密度,将样本密度大于平均密度的样本放在集合中,取最大的密度点作为第一个中心,再取离第一个中心点最远的高密度点作为第二个中心点,以此类推以确定所有的中心点;
k-中心点算法中,每个样本的密度计算公式为:
D(x)={o∈C|dist(x,o)≤r} (1)
其中,dist是某种距离度量,r为半径,C为相似度序列数据集,式(1)表明以x为中心点,r为半径组成的球体所包含的样本数;r规定为r=p×q,q为给定常数,而p则为两两数据对象距离的均值,见式(2)
Figure FDA0003589329870000011
样本的平均密度为:
Figure FDA0003589329870000012
将样本密度大于平均密度AD(x)的样本全部放在集合L中,L可以表示为
L={xi|D(xi)>AD(x)}i=1,2,L,n (4)
在L中取最大密度点作为第一个聚类中心Y1,并从L中删除;取距离Y1最远的高密度点作为第二个中心点Y2;重复以上两步直至找到k个中心点;最终k个中心点就是相隔距离较远的k个处于高密度区域的点,从而以保证聚类结果的稳定性,避免初始中心选择的随机性;
步骤2.根据分类信息中的占比分布情况,建立均衡簇内与簇间距离的目标函数;
均衡簇内与簇间距离,当E值越小则表明分类效果越好,以此建立目标函数:
Figure FDA0003589329870000021
其中,簇间距离的权重是簇内距离的θ倍,一般取值为1,in(d)为簇内距离和,即簇内每一点到它所属类中心的距离的平方和,out(d)为簇间距离和,即不同聚类中心间的距离:
Figure FDA0003589329870000022
步骤3.根据设定的初始化的中心点输出不同的聚类结果;
步骤4.对输出的聚类结果数据预处理,层次划分构建多层次数据集;
步骤5.对数据集逐层扫描,设置最小支持度,找到频繁项集,支持度大于等于最小支持度的项目组称为高频项目组,找出所有的高频项目组,直到无法再找到更长的高频项目组为止;
步骤6.设置最小置信度,由频繁项集产生关联规则;在多个不同的层次对数据进行关联分析,输出分析结果;
步骤7.根据结果对客户进行定制化服务推送。
2.根据权利要求1所述的基于关联规则的客户画像及服务推送方法,其特征在于:所述步骤4中,预处理的方法为:对输出的聚类结果数据通过所有数据点的坐标值进行计算和分析,计算得到各个数据点的局部离群点因子,利用离群点去噪将各个子点组内的异常的数据点移除;对离群点去噪后的所有数据点进行拟合并移除偏差较大的数据点,并输出去噪后数据组;
所述数据集划分成三层,依次是中心服务器层,数据服务器层和用户层。
3.根据权利要求1所述的基于关联规则的客户画像及服务推送方法,其特征在于:所述步骤6中,设置最小支持度,找到频繁项集;
Figure FDA0003589329870000023
设置最小置信度,由频繁项集产生关联规则;
Figure FDA0003589329870000031
在多个不同的层次对数据进行关联分析,输出分析结果。
4.根据权利要求1所述的基于关联规则的客户画像及服务推送方法,其特征在于:所述步骤7中,根据结果对客户进行定制化服务推送,所述定制化服务推送根据商户的地理位置及分类数据进行设置,告知电商客户能够一起销售的捆绑包,设置相应的交叉销售。
CN201810447891.3A 2018-05-11 2018-05-11 一种基于关联规则的客户画像及服务推送方法 Active CN108694606B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810447891.3A CN108694606B (zh) 2018-05-11 2018-05-11 一种基于关联规则的客户画像及服务推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810447891.3A CN108694606B (zh) 2018-05-11 2018-05-11 一种基于关联规则的客户画像及服务推送方法

Publications (2)

Publication Number Publication Date
CN108694606A CN108694606A (zh) 2018-10-23
CN108694606B true CN108694606B (zh) 2022-07-26

Family

ID=63846216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810447891.3A Active CN108694606B (zh) 2018-05-11 2018-05-11 一种基于关联规则的客户画像及服务推送方法

Country Status (1)

Country Link
CN (1) CN108694606B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135433A (zh) * 2019-05-07 2019-08-16 宏图物流股份有限公司 一种基于车辆推荐的画像数据可用性判断方法
CN110489453B (zh) * 2019-07-02 2023-04-14 广东工业大学 基于大数据日志分析的用户游戏实时推荐方法及***
CN110688375B (zh) * 2019-09-26 2022-09-27 招商局金融科技有限公司 客户渗透分析的方法、装置及计算机可读存储介质
CN113297479A (zh) * 2021-04-29 2021-08-24 上海淇玥信息技术有限公司 一种用户画像生成方法、装置及电子设备
CN114840579B (zh) * 2022-04-20 2022-12-27 广东铭太信息科技有限公司 一种医院内部审计***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814063A (zh) * 2010-05-24 2010-08-25 天津大学 基于距离权重的全局k-均值聚类算法
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置
CN106503086A (zh) * 2016-10-11 2017-03-15 成都云麒麟软件有限公司 分布式局部离群点的检测方法
CN106874421A (zh) * 2017-01-24 2017-06-20 聊城大学 基于自适应矩形窗口的图像检索方法
CN107526754A (zh) * 2016-09-26 2017-12-29 广州速鸿信息科技有限公司 一种基于大数据的用户画像平台建立方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814063A (zh) * 2010-05-24 2010-08-25 天津大学 基于距离权重的全局k-均值聚类算法
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置
CN107526754A (zh) * 2016-09-26 2017-12-29 广州速鸿信息科技有限公司 一种基于大数据的用户画像平台建立方法
CN106503086A (zh) * 2016-10-11 2017-03-15 成都云麒麟软件有限公司 分布式局部离群点的检测方法
CN106874421A (zh) * 2017-01-24 2017-06-20 聊城大学 基于自适应矩形窗口的图像检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种新的k-medoids聚类算法;姚丽娟等;《计算机工程与应用》;20131031;第49卷(第19期);第153-157页 *
基于金融类客户画像的二分k均值算法分析研究与应用;赵飞鸿;《中国优秀硕士学位论文全文数据库》;20170315(第3期);第1页-52页 *

Also Published As

Publication number Publication date
CN108694606A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
CN108694606B (zh) 一种基于关联规则的客户画像及服务推送方法
US20210157869A1 (en) Information sending method, apparatus and system, and computer-readable storage medium
KR101712591B1 (ko) 감성기반 사용자특성 분석을 이용한 개인화된 광고 제공 서비스 방법
US20210073890A1 (en) Catalog-based image recommendations
US12002052B2 (en) Feature subspace isolation and disentanglement in merchant embeddings
Ramasubbareddy et al. Comparative study of clustering techniques in market segmentation
Maulina et al. Data mining approach for customer segmentation in B2B settings using centroid-based clustering
CN114997956B (zh) 基于大数据的母婴产品智能推荐***
CN111767420A (zh) 一种生成服饰搭配数据的方法和装置
CN108694234A (zh) 一种基于改进协同过滤算法的服务推荐模型
Zhang et al. A Precision Marketing Strategy of e‐Commerce Platform Based on Consumer Behavior Analysis in the Era of Big Data
Dogan et al. Customer behavior analysis by intuitionistic fuzzy segmentation: comparison of two major cities in Turkey
Lewaaelhamd Customer segmentation using machine learning model: an application of RFM analysis
Kashef et al. Predicting l-CrossSold products using connected components: A clustering-based recommendation system
Anusha et al. Segmentation of retail mobile market using HMS algorithm
Lomas et al. A systematic literature review of artificial intelligence in fashion retail B2C
CN110020918B (zh) 一种推荐信息生成方法和***
Chou et al. The RFM Model Analysis for VIP Customer: A case study of golf clothing brand
Asmat et al. Data mining framework for the identification of profitable customer based on recency, frequency, monetary (RFM)
Bhargavi et al. Comparative study of consumer purchasing and decision pattern analysis using pincer search based data mining method
Dinavahi et al. Customer Segmentation in Retailing using Machine Learning Techniques
CN109658195A (zh) 一种商品展示决策方法
CN108805199B (zh) 一种基于遗传算法的实体商业营销方法
Guo et al. EC‐Structure: Establishing Consumption Structure through Mining E‐Commerce Data to Discover Consumption Upgrade
Faridizadeh et al. Market basket analysis using community detection approach: A real case

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant