CN110503446A - 基于聚类算法的电商平台的客户分类方法与决策方法 - Google Patents
基于聚类算法的电商平台的客户分类方法与决策方法 Download PDFInfo
- Publication number
- CN110503446A CN110503446A CN201810465721.8A CN201810465721A CN110503446A CN 110503446 A CN110503446 A CN 110503446A CN 201810465721 A CN201810465721 A CN 201810465721A CN 110503446 A CN110503446 A CN 110503446A
- Authority
- CN
- China
- Prior art keywords
- client
- data
- time
- clustering algorithm
- electric business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000011218 segmentation Effects 0.000 title claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000012544 monitoring process Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 abstract description 3
- 238000013501 data transformation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明具体涉及一种基于聚类算法的电商平台的客户分类方法与决策方法,包括步骤一:采集用户购买的商品的数据用户在电商网站上的购买商品几率进行集合汇总;步骤二:对步骤一中获取的数据集进行预处理,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数。步骤四:根据自动聚类细分的群,选择与之相适应的营销模型。步骤五:将所选择的营销模型进行计算并输出结果。本发明采用基于聚类算法计算提高了分析的可靠性,数据标准化处理进一步解决了数据形式一致性问题,降低了***的复杂度。
Description
技术领域
本发明属于数据挖掘技术领域,具体涉及一种基于聚类算法的电商平台的客户分类方法与决策方法。
背景技术
在互联网+潮流下,企业市场最大的变化在于中间环节遭遇全面挤压,供应链条不断缩短,供应商与直接客户的关系日益拉近。集买家保障、卖家保障,风控为一体的B2B2C电子商务模式,能够帮助商户与买家建立互信,保障其在严密防护下安心地开展在线交易。B2B2C模式将供应商、采购商、银行(支付***)和保险四个角色,通过电子平台一键完成。由于电子平台规模增大,客户背景、行为特征的不同,对用户再次使用产品行为进行准确有效的预估,是企业优化营销资源分配、定向推送服务广告的重要依据。
发明内容
1、所要解决的技术问题:
本发明根据电商平台商品推荐的需要提供一种基于聚类算法的电商平台的客户分类方法与决策方法,通过该方法提高了分析的可靠性,数据标准化处理进一步解决了数据形式一致性问题,降低了***的复杂度。
2、技术方案:
一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:
步骤一:采集用户购买的商品的数据,并将用户在电商网站上的购买商品几率进行集合汇总;所述用户购买的商品的数据包括用户名、商品类别、商品名、价格、数量、时间、支付方式和浏览次数。
步骤二:对步骤一中获取的数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:L表示客户注册时间到本监测时间前的天数,C表示在从注册时间到本监测时间前用户购买商品的类别数,R表示客户在本次监测之前中最后一次购买的时间距本次监测的天数,F表示客户在本监测时间前的购买次数,M表示客户在本消费类别中在分析观测窗口内的累计花费,D表示客户在本本监测时间前每次购买商品所享受的平均折扣金额。
步骤三:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数。
步骤四:根据自动聚类细分的群,选择与之相适应的营销模型。
步骤五:将所选择的营销模型进行计算并输出结果。
进一步地,所述步骤一还包括预设一定的时间间隔对客户进行分类或者预设客户注册的时间长短进行分类。
进一步地,:步骤二中数据变换的过程为:数据流入标准化模块,其将流入的数据处理成具有统一格式的数据;指标计算模块,其根据不同的价值向量计算方法进行向量计算。
进一步地,步骤三中对客户的细分类过程包括:31 将所有客户的LCRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LCRFMD向量作为聚类中心;32逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;33重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤32。
3、有益效果:
通过基于聚类算法计算提高了分析的可靠性,数据标准化处理进一步解决了数据形式一致性问题,降低了***的复杂度。通过自动聚类客群细分,进一步提高了营销模型的预测效果。
附图说明
图1为本发明的流程图。
具体实施方式为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案
进行详细说明。
一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:
步骤一:采集用户购买的商品的数据,并将用户在电商网站上的购买商品几率进行集合汇总;所述用户购买的商品的数据包括用户名、商品类别、商品名、价格、数量、时间、支付方式和浏览次数。
步骤二:对步骤一中获取的数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:L表示客户注册时间到本监测时间前的天数,C表示在从注册时间到本监测时间前用户购买商品的类别数,R表示客户在本次监测之前中最后一次购买的时间距本次监测的天数,F表示客户在本监测时间前的购买次数,M表示客户在本消费类别中在分析观测窗口内的累计花费,D表示客户在本本监测时间前每次购买商品所享受的平均折扣金额。
步骤三:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数。
步骤四:根据自动聚类细分的群,选择与之相适应的营销模型。
步骤五:将所选择的营销模型进行计算并输出结果。
进一步地,所述步骤一还包括预设一定的时间间隔对客户进行分类或者预设客户注册的时间长短进行分类。
进一步地,:步骤二中数据变换的过程为:数据流入标准化模块,其将流入的数据处理成具有统一格式的数据;指标计算模块,其根据不同的价值向量计算方法进行向量计算。
进一步地,步骤三中对客户的细分类过程包括:31 将所有客户的LCRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LCRFMD向量作为聚类中心;32逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;33重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤32。
虽然本发明已以较佳实施例公开如上,但它们并不是用来限定本发明的,任何熟习此技艺者,在不脱离本发明之精神和范围内,自当可作各种变化或润饰,因此本发明的保护范围应当以本申请的权利要求保护范围所界定的为准。
Claims (4)
1.一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:
步骤一:采集用户购买的商品的数据,并将用户在电商网站上的购买商品几率进行集合汇总;所述用户购买的商品的数据包括用户名、商品类别、商品名、价格、数量、时间、支付方式和浏览次数;
步骤二:对步骤一中获取的数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的价值向量;所述价值向量由LCRFMD六个指标组成:L表示客户注册时间到本监测时间前的天数,C表示在从注册时间到本监测时间前用户购买商品的类别数,R表示客户在本次监测之前中最后一次购买的时间距本次监测的天数,F表示客户在本监测时间前的购买次数,M表示客户在本消费类别中在分析观测窗口内的累计花费,D表示客户在本本监测时间前每次购买商品所享受的平均折扣金额;
步骤三:采用聚类算法根据LCRFMD六个指标对客户进行自动聚类分群,将客户细分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数;
步骤四:根据自动聚类细分的群,选择与之相适应的营销模型;
步骤五:将所选择的营销模型进行计算并输出结果。
2.根据权利要求1所述的一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:所述步骤一还包括预设一定的时间间隔对客户进行分类或者预设客户注册的时间长短进行分类。
3.根据权利要求1所述的一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:步骤二中数据变换的过程为:
数据流入标准化模块,其将流入的数据处理成具有统一格式的数据;
指标计算模块,其根据不同的价值向量计算方法进行向量计算。
4.根据权利要求1所述的一种基于聚类算法的电商平台的客户分类方法与决策方法,其特征在于:步骤三中对客户的细分类过程包括:
31将所有客户的LCRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LCRFMD向量作为聚类中心;
32逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;
33重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤32。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810465721.8A CN110503446A (zh) | 2018-05-16 | 2018-05-16 | 基于聚类算法的电商平台的客户分类方法与决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810465721.8A CN110503446A (zh) | 2018-05-16 | 2018-05-16 | 基于聚类算法的电商平台的客户分类方法与决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110503446A true CN110503446A (zh) | 2019-11-26 |
Family
ID=68584681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810465721.8A Pending CN110503446A (zh) | 2018-05-16 | 2018-05-16 | 基于聚类算法的电商平台的客户分类方法与决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110503446A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695941A (zh) * | 2020-06-15 | 2020-09-22 | 广州探途网络技术有限公司 | 商品交易网站数据分析方法、装置和电子设备 |
CN112017062A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN113159881A (zh) * | 2021-03-15 | 2021-07-23 | 杭州云搜网络技术有限公司 | 一种数据聚类及b2b平台客户偏好获取方法、*** |
CN113781108A (zh) * | 2021-08-30 | 2021-12-10 | 武汉理工大学 | 一种电商平台客户细分方法、装置、电子设备及存储介质 |
WO2022095864A1 (zh) * | 2020-11-05 | 2022-05-12 | 西安邮电大学 | 一种基于加权rfm模型的电商平台客户细分方法 |
CN114638451A (zh) * | 2020-12-16 | 2022-06-17 | 上海画龙信息科技有限公司 | 智能零售辅助决策*** |
CN116205675A (zh) * | 2023-04-28 | 2023-06-02 | 华南师范大学 | 一种基于线程划分的数据采集方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150142521A1 (en) * | 2013-11-20 | 2015-05-21 | Sears Brands, Llc | Customer clustering using integer programming |
CN106529968A (zh) * | 2016-09-29 | 2017-03-22 | 深圳大学 | 一种基于交易数据的客户分类方法及其*** |
CN107133652A (zh) * | 2017-05-17 | 2017-09-05 | 国网山东省电力公司烟台供电公司 | 基于K‑means聚类算法的用电客户价值评估方法及*** |
-
2018
- 2018-05-16 CN CN201810465721.8A patent/CN110503446A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150142521A1 (en) * | 2013-11-20 | 2015-05-21 | Sears Brands, Llc | Customer clustering using integer programming |
CN106529968A (zh) * | 2016-09-29 | 2017-03-22 | 深圳大学 | 一种基于交易数据的客户分类方法及其*** |
CN107133652A (zh) * | 2017-05-17 | 2017-09-05 | 国网山东省电力公司烟台供电公司 | 基于K‑means聚类算法的用电客户价值评估方法及*** |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695941A (zh) * | 2020-06-15 | 2020-09-22 | 广州探途网络技术有限公司 | 商品交易网站数据分析方法、装置和电子设备 |
CN112017062A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN112017062B (zh) * | 2020-07-15 | 2024-06-07 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
WO2022095864A1 (zh) * | 2020-11-05 | 2022-05-12 | 西安邮电大学 | 一种基于加权rfm模型的电商平台客户细分方法 |
CN114638451A (zh) * | 2020-12-16 | 2022-06-17 | 上海画龙信息科技有限公司 | 智能零售辅助决策*** |
CN113159881A (zh) * | 2021-03-15 | 2021-07-23 | 杭州云搜网络技术有限公司 | 一种数据聚类及b2b平台客户偏好获取方法、*** |
CN113159881B (zh) * | 2021-03-15 | 2022-08-12 | 杭州云搜网络技术有限公司 | 一种数据聚类及b2b平台客户偏好获取方法、*** |
CN113781108A (zh) * | 2021-08-30 | 2021-12-10 | 武汉理工大学 | 一种电商平台客户细分方法、装置、电子设备及存储介质 |
CN116205675A (zh) * | 2023-04-28 | 2023-06-02 | 华南师范大学 | 一种基于线程划分的数据采集方法及装置 |
CN116205675B (zh) * | 2023-04-28 | 2023-09-08 | 华南师范大学 | 一种基于线程划分的数据采集方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110503446A (zh) | 基于聚类算法的电商平台的客户分类方法与决策方法 | |
Rahim et al. | RFM-based repurchase behavior for customer classification and segmentation | |
CN106021337A (zh) | 一种基于大数据分析的智能推荐方法及*** | |
US20150332414A1 (en) | System and method for predicting items purchased based on transaction data | |
CN101783004A (zh) | 快速智能化的商品推荐*** | |
US20150332292A1 (en) | System and method for monitoring market information for deregulated utilities based on transaction data | |
CN107609060A (zh) | 资源推荐方法及装置 | |
Sun et al. | GPHC: A heuristic clustering method to customer segmentation | |
Baumann et al. | Changing perspectives: Using graph metrics to predict purchase probabilities | |
CN110544131A (zh) | 一种数据驱动的电商用户购买行为预测方法 | |
CN113516496B (zh) | 广告转化率预估模型构建方法、装置、设备及其介质 | |
CN111415194A (zh) | 基于折扣弹性预测的易逝品动态定价方法、*** | |
Fajariah et al. | Application of Principal Component Analysis and Maximum Likelihood Estimation Method to Identify the Determinant Factors Intention to Use of Paylater in E-Commerce | |
CN111738805A (zh) | 基于行为日志的搜索推荐模型生成方法、设备和存储介质 | |
JP2022548435A (ja) | 実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法 | |
CN116187808A (zh) | 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法 | |
CN111242732A (zh) | 一种基于商品推荐模型的推荐方法 | |
Daruich et al. | Macroeconomic implications of uniform pricing | |
CN110503494A (zh) | 一种用于电商营销平台的推荐*** | |
CN115713384A (zh) | 推荐物品的方法、装置、存储介质及电子设备 | |
KR102582813B1 (ko) | 오프라인 구매를 위한 개인화된 추천 서비스 제공 방법 및 장치 | |
CN115330476A (zh) | 一种基于大数据的跨境零售进口商品智能推荐*** | |
US20230230143A1 (en) | Product recommendation system, product recommendation method, and recordingmedium storing product recommendation program | |
JP6825018B2 (ja) | 管理支援システム及び方法 | |
Aravatagimath et al. | Agriculture Product Marketing Data Analysis using Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191126 |
|
RJ01 | Rejection of invention patent application after publication |