CN110503446A - 基于聚类算法的电商平台的客户分类方法与决策方法 - Google Patents

基于聚类算法的电商平台的客户分类方法与决策方法 Download PDF

Info

Publication number
CN110503446A
CN110503446A CN201810465721.8A CN201810465721A CN110503446A CN 110503446 A CN110503446 A CN 110503446A CN 201810465721 A CN201810465721 A CN 201810465721A CN 110503446 A CN110503446 A CN 110503446A
Authority
CN
China
Prior art keywords
client
data
time
clustering algorithm
electric business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810465721.8A
Other languages
English (en)
Inventor
石光捷
张良
付飞龙
张晓莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU TIANZHI INTERNET TECHNOLOGY Co Ltd
Original Assignee
JIANGSU TIANZHI INTERNET TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU TIANZHI INTERNET TECHNOLOGY Co Ltd filed Critical JIANGSU TIANZHI INTERNET TECHNOLOGY Co Ltd
Priority to CN201810465721.8A priority Critical patent/CN110503446A/zh
Publication of CN110503446A publication Critical patent/CN110503446A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明具体涉及一种基于聚类算法的电商平台的客户分类方法与决策方法,包括步骤一:采集用户购买的商品的数据用户在电商网站上的购买商品几率进行集合汇总;步骤二:对步骤一中获取的数据集进行预处理,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数。步骤四:根据自动聚类细分的群,选择与之相适应的营销模型。步骤五:将所选择的营销模型进行计算并输出结果。本发明采用基于聚类算法计算提高了分析的可靠性,数据标准化处理进一步解决了数据形式一致性问题,降低了***的复杂度。

Description

基于聚类算法的电商平台的客户分类方法与决策方法
技术领域
本发明属于数据挖掘技术领域,具体涉及一种基于聚类算法的电商平台的客户分类方法与决策方法。
背景技术
在互联网+潮流下,企业市场最大的变化在于中间环节遭遇全面挤压,供应链条不断缩短,供应商与直接客户的关系日益拉近。集买家保障、卖家保障,风控为一体的B2B2C电子商务模式,能够帮助商户与买家建立互信,保障其在严密防护下安心地开展在线交易。B2B2C模式将供应商、采购商、银行(支付***)和保险四个角色,通过电子平台一键完成。由于电子平台规模增大,客户背景、行为特征的不同,对用户再次使用产品行为进行准确有效的预估,是企业优化营销资源分配、定向推送服务广告的重要依据。
发明内容
1、所要解决的技术问题:
本发明根据电商平台商品推荐的需要提供一种基于聚类算法的电商平台的客户分类方法与决策方法,通过该方法提高了分析的可靠性,数据标准化处理进一步解决了数据形式一致性问题,降低了***的复杂度。
2、技术方案:
一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:
步骤一:采集用户购买的商品的数据,并将用户在电商网站上的购买商品几率进行集合汇总;所述用户购买的商品的数据包括用户名、商品类别、商品名、价格、数量、时间、支付方式和浏览次数。
步骤二:对步骤一中获取的数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:L表示客户注册时间到本监测时间前的天数,C表示在从注册时间到本监测时间前用户购买商品的类别数,R表示客户在本次监测之前中最后一次购买的时间距本次监测的天数,F表示客户在本监测时间前的购买次数,M表示客户在本消费类别中在分析观测窗口内的累计花费,D表示客户在本本监测时间前每次购买商品所享受的平均折扣金额。
步骤三:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数。
步骤四:根据自动聚类细分的群,选择与之相适应的营销模型。
步骤五:将所选择的营销模型进行计算并输出结果。
进一步地,所述步骤一还包括预设一定的时间间隔对客户进行分类或者预设客户注册的时间长短进行分类。
进一步地,:步骤二中数据变换的过程为:数据流入标准化模块,其将流入的数据处理成具有统一格式的数据;指标计算模块,其根据不同的价值向量计算方法进行向量计算。
进一步地,步骤三中对客户的细分类过程包括:31 将所有客户的LCRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LCRFMD向量作为聚类中心;32逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;33重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤32。
3、有益效果:
通过基于聚类算法计算提高了分析的可靠性,数据标准化处理进一步解决了数据形式一致性问题,降低了***的复杂度。通过自动聚类客群细分,进一步提高了营销模型的预测效果。
附图说明
图1为本发明的流程图。
具体实施方式为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案
进行详细说明。
一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:
步骤一:采集用户购买的商品的数据,并将用户在电商网站上的购买商品几率进行集合汇总;所述用户购买的商品的数据包括用户名、商品类别、商品名、价格、数量、时间、支付方式和浏览次数。
步骤二:对步骤一中获取的数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:L表示客户注册时间到本监测时间前的天数,C表示在从注册时间到本监测时间前用户购买商品的类别数,R表示客户在本次监测之前中最后一次购买的时间距本次监测的天数,F表示客户在本监测时间前的购买次数,M表示客户在本消费类别中在分析观测窗口内的累计花费,D表示客户在本本监测时间前每次购买商品所享受的平均折扣金额。
步骤三:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数。
步骤四:根据自动聚类细分的群,选择与之相适应的营销模型。
步骤五:将所选择的营销模型进行计算并输出结果。
进一步地,所述步骤一还包括预设一定的时间间隔对客户进行分类或者预设客户注册的时间长短进行分类。
进一步地,:步骤二中数据变换的过程为:数据流入标准化模块,其将流入的数据处理成具有统一格式的数据;指标计算模块,其根据不同的价值向量计算方法进行向量计算。
进一步地,步骤三中对客户的细分类过程包括:31 将所有客户的LCRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LCRFMD向量作为聚类中心;32逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;33重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤32。
虽然本发明已以较佳实施例公开如上,但它们并不是用来限定本发明的,任何熟习此技艺者,在不脱离本发明之精神和范围内,自当可作各种变化或润饰,因此本发明的保护范围应当以本申请的权利要求保护范围所界定的为准。

Claims (4)

1.一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:
步骤一:采集用户购买的商品的数据,并将用户在电商网站上的购买商品几率进行集合汇总;所述用户购买的商品的数据包括用户名、商品类别、商品名、价格、数量、时间、支付方式和浏览次数;
步骤二:对步骤一中获取的数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:L表示客户注册时间到本监测时间前的天数,C表示在从注册时间到本监测时间前用户购买商品的类别数,R表示客户在本次监测之前中最后一次购买的时间距本次监测的天数,F表示客户在本监测时间前的购买次数,M表示客户在本消费类别中在分析观测窗口内的累计花费,D表示客户在本本监测时间前每次购买商品所享受的平均折扣金额;
步骤三:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数;
步骤四:根据自动聚类细分的群,选择与之相适应的营销模型;
步骤五:将所选择的营销模型进行计算并输出结果。
2.根据权利要求1所述的一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:所述步骤一还包括预设一定的时间间隔对客户进行分类或者预设客户注册的时间长短进行分类。
3.根据权利要求1所述的一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:步骤二中数据变换的过程为:
数据流入标准化模块,其将流入的数据处理成具有统一格式的数据;
指标计算模块,其根据不同的价值向量计算方法进行向量计算。
4.根据权利要求1所述的一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:步骤三中对客户的细分类过程包括:
31将所有客户的LCRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LCRFMD向量作为聚类中心;
32逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;
33重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤32。
CN201810465721.8A 2018-05-16 2018-05-16 基于聚类算法的电商平台的客户分类方法与决策方法 Pending CN110503446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810465721.8A CN110503446A (zh) 2018-05-16 2018-05-16 基于聚类算法的电商平台的客户分类方法与决策方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810465721.8A CN110503446A (zh) 2018-05-16 2018-05-16 基于聚类算法的电商平台的客户分类方法与决策方法

Publications (1)

Publication Number Publication Date
CN110503446A true CN110503446A (zh) 2019-11-26

Family

ID=68584681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810465721.8A Pending CN110503446A (zh) 2018-05-16 2018-05-16 基于聚类算法的电商平台的客户分类方法与决策方法

Country Status (1)

Country Link
CN (1) CN110503446A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695941A (zh) * 2020-06-15 2020-09-22 广州探途网络技术有限公司 商品交易网站数据分析方法、装置和电子设备
CN112017062A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 基于客群细分的资源额度分配方法、装置及电子设备
CN113159881A (zh) * 2021-03-15 2021-07-23 杭州云搜网络技术有限公司 一种数据聚类及b2b平台客户偏好获取方法、***
CN113781108A (zh) * 2021-08-30 2021-12-10 武汉理工大学 一种电商平台客户细分方法、装置、电子设备及存储介质
WO2022095864A1 (zh) * 2020-11-05 2022-05-12 西安邮电大学 一种基于加权rfm模型的电商平台客户细分方法
CN114638451A (zh) * 2020-12-16 2022-06-17 上海画龙信息科技有限公司 智能零售辅助决策***
CN116205675A (zh) * 2023-04-28 2023-06-02 华南师范大学 一种基于线程划分的数据采集方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150142521A1 (en) * 2013-11-20 2015-05-21 Sears Brands, Llc Customer clustering using integer programming
CN106529968A (zh) * 2016-09-29 2017-03-22 深圳大学 一种基于交易数据的客户分类方法及其***
CN107133652A (zh) * 2017-05-17 2017-09-05 国网山东省电力公司烟台供电公司 基于K‑means聚类算法的用电客户价值评估方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150142521A1 (en) * 2013-11-20 2015-05-21 Sears Brands, Llc Customer clustering using integer programming
CN106529968A (zh) * 2016-09-29 2017-03-22 深圳大学 一种基于交易数据的客户分类方法及其***
CN107133652A (zh) * 2017-05-17 2017-09-05 国网山东省电力公司烟台供电公司 基于K‑means聚类算法的用电客户价值评估方法及***

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695941A (zh) * 2020-06-15 2020-09-22 广州探途网络技术有限公司 商品交易网站数据分析方法、装置和电子设备
CN112017062A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 基于客群细分的资源额度分配方法、装置及电子设备
CN112017062B (zh) * 2020-07-15 2024-06-07 北京淇瑀信息科技有限公司 基于客群细分的资源额度分配方法、装置及电子设备
WO2022095864A1 (zh) * 2020-11-05 2022-05-12 西安邮电大学 一种基于加权rfm模型的电商平台客户细分方法
CN114638451A (zh) * 2020-12-16 2022-06-17 上海画龙信息科技有限公司 智能零售辅助决策***
CN113159881A (zh) * 2021-03-15 2021-07-23 杭州云搜网络技术有限公司 一种数据聚类及b2b平台客户偏好获取方法、***
CN113159881B (zh) * 2021-03-15 2022-08-12 杭州云搜网络技术有限公司 一种数据聚类及b2b平台客户偏好获取方法、***
CN113781108A (zh) * 2021-08-30 2021-12-10 武汉理工大学 一种电商平台客户细分方法、装置、电子设备及存储介质
CN116205675A (zh) * 2023-04-28 2023-06-02 华南师范大学 一种基于线程划分的数据采集方法及装置
CN116205675B (zh) * 2023-04-28 2023-09-08 华南师范大学 一种基于线程划分的数据采集方法及装置

Similar Documents

Publication Publication Date Title
CN110503446A (zh) 基于聚类算法的电商平台的客户分类方法与决策方法
Rahim et al. RFM-based repurchase behavior for customer classification and segmentation
CN106021337A (zh) 一种基于大数据分析的智能推荐方法及***
US20150332414A1 (en) System and method for predicting items purchased based on transaction data
CN101783004A (zh) 快速智能化的商品推荐***
US20150332292A1 (en) System and method for monitoring market information for deregulated utilities based on transaction data
CN107609060A (zh) 资源推荐方法及装置
Sun et al. GPHC: A heuristic clustering method to customer segmentation
Baumann et al. Changing perspectives: Using graph metrics to predict purchase probabilities
CN110544131A (zh) 一种数据驱动的电商用户购买行为预测方法
CN113516496B (zh) 广告转化率预估模型构建方法、装置、设备及其介质
CN111415194A (zh) 基于折扣弹性预测的易逝品动态定价方法、***
Fajariah et al. Application of Principal Component Analysis and Maximum Likelihood Estimation Method to Identify the Determinant Factors Intention to Use of Paylater in E-Commerce
CN111738805A (zh) 基于行为日志的搜索推荐模型生成方法、设备和存储介质
JP2022548435A (ja) 実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法
CN116187808A (zh) 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法
CN111242732A (zh) 一种基于商品推荐模型的推荐方法
Daruich et al. Macroeconomic implications of uniform pricing
CN110503494A (zh) 一种用于电商营销平台的推荐***
CN115713384A (zh) 推荐物品的方法、装置、存储介质及电子设备
KR102582813B1 (ko) 오프라인 구매를 위한 개인화된 추천 서비스 제공 방법 및 장치
CN115330476A (zh) 一种基于大数据的跨境零售进口商品智能推荐***
US20230230143A1 (en) Product recommendation system, product recommendation method, and recordingmedium storing product recommendation program
JP6825018B2 (ja) 管理支援システム及び方法
Aravatagimath et al. Agriculture Product Marketing Data Analysis using Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191126

RJ01 Rejection of invention patent application after publication