CN110135871B - 计算用户复购期的方法和装置 - Google Patents
计算用户复购期的方法和装置 Download PDFInfo
- Publication number
- CN110135871B CN110135871B CN201810105295.7A CN201810105295A CN110135871B CN 110135871 B CN110135871 B CN 110135871B CN 201810105295 A CN201810105295 A CN 201810105295A CN 110135871 B CN110135871 B CN 110135871B
- Authority
- CN
- China
- Prior art keywords
- user
- consumption amount
- daily
- consumption
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims description 81
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 14
- 230000006399 behavior Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 241000209094 Oryza Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 235000013312 flour Nutrition 0.000 description 4
- 239000008267 milk Substances 0.000 description 4
- 210000004080 milk Anatomy 0.000 description 4
- 235000013336 milk Nutrition 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012946 outsourcing Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000013410 fast food Nutrition 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种计算用户复购期的方法和装置,能够准确计算用户的复购期,把握用户购买习惯,从而为目标用户设计更有效的推荐方案。该方法包括:获取用户购买特定产品的历史数据;根据所述历史数据,计算用户的真实日均消耗金额;根据所述真实日均消耗金额计算用户针对所述产品的复购期。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种计算用户复购期。
背景技术
近年来,随着电子商务的高速发展,物流服务和仓储服务的不断完善,线上产品的网络用户从低价需求逐渐转为便利性需求,尤其是快消品领域(快消品,快速消费品(FMCG,Fast Moving Consumer Goods)的简称,是指那些使用寿命较短,消费速度较快的消费品。最容易让人理解快消品包括包装的食品、个人卫生用品、烟草及酒类和饮料。之所以被称为快消,是因为它们首先是日常用品)。巨大的潜在市场吸引大量电商企业和零售企业的积极进入,成为线上产品实现快速发展的重要推力。利用用户丰富的订单数据,分析与预测用户快消品的复购行为,已经成为各公司预测销量、提升用户体验、提升转化率的一种重要手段,同时也是电商公司优化用户体验,增强用户粘性的一条捷径。
现有技术中,快消品复购周期计算逻辑大多基于如下两种:基于用户历史购买产品的时间间隔计算用户购买此产品的平均间隔时间,从而预测用户下次购买的时间;或者:基于历史订单和产品规格数据来计算用户的日消耗数量,从而预测用户下次购买的时间。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
(1)目前的用户复购时间计算,基本上都是简单的对用户购买某件产品时间间隔做简单的均值计算,准确度难以保证,容易受到用户购买非稳定期的影响,结果偏差大;
(2)未区分正常购买和囤货、在其他平台购买等情况,简单的将消耗量合并计算,不能准确体现用户的真实的日均消耗量;
(3)由于电商平台上有大量的第三方商家,这些第三方商家的产品规格数据会存在一定的缺失,如果简单的使用基于产品规格数据来计算日均消耗数量会有一些偏差;
(4)用户体验影响有限。目前用户复购产品的展示,更多的是依赖用户的历史购买产品记录,然后给予简单的曝光展示,没有针对用户的复购周期,做出智能的引导与提示,转化率提升能力有限。
发明内容
有鉴于此,本发明实施例提供一种计算用户复购期的方法和装置,能够准确计算用户的复购期,把握用户购买习惯,从而为目标用户设计更有效的推荐方案。
为实现上述目的,根据本发明实施例的一个方面,提供了一种计算用户复购期的方法。
本发明实施例的一种计算用户复购期的方法包括:获取用户购买特定产品的历史数据;根据所述历史数据,计算用户的真实日均消耗金额;根据所述真实日均消耗金额计算用户针对所述产品的复购期。
可选地,所述历史数据包括如下至少一种信息:用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息。
可选地,在根据所述历史数据,计算用户的真实日均消耗金额之前,所述方法还包括:对所述历史数据进行清洗,包括基于用户画像对不符合预设计算条件的用户数据进行剔除、对所述历史数据中的缺失值进行处理以及对异常数据进行过滤。
可选地,计算用户的真实日均消耗金额包括:以用户相邻购买日之间的时间间隔作为一个消耗段,设定一个消耗段内用户的日均消耗金额为an,各连续消耗段日均消耗金额an的振幅为g;以稳定期内各消耗段的日均消耗金额的最大值所述用户的预测日均消耗金额,所述稳定期是指由与相邻消耗段日均消耗金额相比,日均消耗金额的振幅小于等于g的消耗段组成的时期;以稳定期以外的其它消耗段日均消耗金额的最大值作为所述用户的偏差日均消耗金额,其中,所述稳定期以外的其它消耗段是指与相邻消耗段日均消耗金额相比,日均消耗金额的振幅大于g的消耗段;利用所述预测日均消耗金额和所述偏差日均消耗金额进行均值计算,得到真实日均消耗金额。
可选地,在获取用户购买特定产品的历史数据之后,所述方法还包括:
预先选定部分历史数据作为样例数据;
利用所述样例数据调整所述振幅g的取值,使所述真实日均消耗金额的计算准确度最优。
为实现上述目的,根据本发明实施例的另一方面,提供了一种计算用户复购期的装置。
本发明实施例的一种计算用户复购期的装置包括:获取模块,用于获取用户购买特定产品的历史数据;第一计算模块,用于根据所述历史数据,计算用户的真实日均消耗金额;第二计算模块,用于根据所述真实日均消耗金额计算用户针对所述产品的复购期。
可选地,所述历史数据包括如下至少一种信息:用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息。
可选地,所述获取模块还用于:在根据所述历史数据,计算用户的真实日均消耗金额之前,对所述历史数据进行清洗,包括基于用户画像对不符合预设计算条件的用户数据进行剔除、对所述历史数据中的缺失值进行处理以及对异常数据进行过滤。
可选地,所述第一计算模块还用于:以用户相邻购买日之间的时间间隔作为一个消耗段,设定一个消耗段内用户的日均消耗金额为an,各连续消耗段日均消耗金额an的振幅为g;以稳定期内各消耗段的日均消耗金额的最大值所述用户的预测日均消耗金额,所述稳定期是指由与相邻消耗段日均消耗金额相比,日均消耗金额的振幅小于等于g的消耗段组成的时期;以稳定期以外的其它消耗段日均消耗金额的最大值作为所述用户的偏差日均消耗金额,其中,所述稳定期以外的其它消耗段是指与相邻消耗段日均消耗金额相比,日均消耗金额的振幅大于g的消耗段;利用所述预测日均消耗金额和所述偏差日均消耗金额进行均值计算,得到真实日均消耗金额。
可选地,所述装置还包括:检测模块,用于在获取用户购买特定产品的历史数据之后,预先选定部分历史数据作为样例数据;利用所述样例数据调整所述振幅g的取值,使所述真实日均消耗金额的计算准确度最优。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的计算用户复购期的方法。
为实现上述目的,根据本发明实施例的又一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的计算用户复购期的方法。
上述发明中的一个实施例具有如下优点或有益效果:本发明实施例中,基于用户画像和用户历史购买行为,分析发现用户在较长的一段时间内购买同一快消品类下的产品的价位比较接近,因此采用日均消耗金额数据计算用户的复购期,从而可以忽略由于产品规格数据不全带来的日均消耗数量的计算偏差问题,使复购周期的计算方式更加的贴合实际场景;本发明可以覆盖到多种消费品类别的产品,如奶粉、纸尿裤、米面杂粮等日用百货类产品,使用场景广泛,对消费品的销售具有指导意义,应用于电商的实际业务中,可以为用户做出智能的引导与提示,转化率提升能力;通过利用用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息等历史数据,从而可以精准、有效的对用户历史购买行为进行分析;通过在利用复购计算模型对用户的真实日均消耗金额进行计算之前,对历史数据进行清洗,从而可以排除问题数据和异常数据干扰,提高计算的效率;通过区分为稳定期和非稳定期内的消耗段对日均消耗金额进行分别计算,从而能够根据正常数据和偏差数据更为准确的计算用户的真实日均消耗金额;本发明实施例中,通过设置选取部分历史数据作为样例数据,用作对复购计算模型的参数调整,从而能够保障复购计算模型计算结果的准确度最优,提高处于购买期人群的转化率。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的计算用户复购期的方法的主要步骤的示意图;
图2是根据本发明实施例的计算用户复购期的方法的主要逻辑的示意图;
图3是根据本发明实施例的计算用户复购期的装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性***架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
与3C、大家电品类不同的是,用户对于快消品类的产品的购买具有较强的周期性,同时,在较长时期内由于大部分用户的收入情况不会有明显的变化,其购买的同一快消品类下的产品几乎都位于同一价位,因此本发明实施例中针对快消品的上述特性来构建快消品的复购计算模型,以准确的实现对用户快消品的复购期的计算。
图1是根据本发明实施例的计算用户复购期的方法,如图1所示,本发明实施例的计算用户复购期的方法主要包括如下步骤:
步骤S101:获取用户购买特定产品的历史数据。本发明实施例中,历史数据可以但不限于包括如下至少一种信息:用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息。
此外,本发明实施例的计算复购期的方法还可以包括:对历史数据进行清洗,包括基于用户画像对不符合预设计算条件的用户数据进行剔除、对历史数据中的缺失值进行完善以及对异常数据进行过滤。
在步骤S101获取到用户历史数据之后,从步骤S102开始计算。
步骤S102:根据历史数据,计算用户的真实日均消耗金额。本发明实施例中,利用复购计算模型计算用户的真实日均消耗金额包括:以用户相邻购买日之间的时间间隔作为一个消耗段,设定一个消耗段内用户的日均消耗金额为an,各连续消耗段日均消耗金额an的振幅为g;以稳定期内各消耗段的日均消耗金额的最大值所述用户的预测日均消耗金额,所述稳定期是指由与相邻消耗段日均消耗金额相比,日均消耗金额的振幅小于等于g的消耗段组成的时期;以稳定期以外的其它消耗段日均消耗金额的最大值作为所述用户的偏差日均消耗金额,其中,所述稳定期以外的其它消耗段是指与相邻消耗段日均消耗金额相比,日均消耗金额的振幅大于g的消耗段;利用所述预测日均消耗金额和所述偏差日均消耗金额进行均值计算,得到真实日均消耗金额。
步骤S103:根据真实日均消耗金额计算用户针对该产品的复购期。本发明实施例中,复购计算模型中的复购期计算公式可以为:复购期=上次购买期+(上次购买总金额/真实日均消耗金额)。
此外,为了提升用户复购期的计算的准确度,可以在获取用户购买特定产品的历史数据之后,计算真实的日均消耗金额之前,本发明实施例的计算用户复购期的方法中还可以包括:预先选定部分历史数据作为样例数据,然后利用样例数据调整振幅g的取值,使所述真实日均消耗金额的计算准确度最优。
综上所述,本发明实施例中,基于用户画像和历史购买行为,分析发现在较长的一段时期内同一用户购买的同一快消品类下的产品具有相近的价位。因此用户的真实日均消耗金额可以近似的等同于用户的日均消耗数量,避免了因第三方商家的产品规格数据不全而导致无法准确衡量用户的真实日均消耗数量的问题。本发明实施例中,真实日均消耗金额是基于用户多个消耗段的日均消耗金额来取得数列,并循环迭代运算,通过衡量商业运用中GMV拉升率和转化率,确定复购计算模型参数的取值的浮动范围。
上述用户画像是指利用现有用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征、社交网络等进行大致地标签化(例如,标注此人是宅男,家庭主妇等)。在本发明中,利用用户画像排除掉明显不契合该品类的人群,提高预测的精准度。
本发明实施例的复购计算模型中,基于如下假设以及计算公式实现复购期的计算。
模型假设:
1、正常用户在较长的一段时期内购买的同一快消品类下的产品具有相近的价位;
2、正常用户的日均消耗产品的数量比较稳定,不会出现较大的波动;
3、正常用户连续囤货两次及以上是小概率事件(即连续两次囤货引起的日均消耗量显著增高的情况是小概率事件);
4、囤货行为指在较短时间内加量购买高于正常消耗的数量,引起该期间日消耗量突增的情况。
计算公式:
设某用户于第D1、D2……Dn天分别购买X1、X2……Xn金额的纸尿裤,则有消耗段(如前所述,以用户相邻购买日之间的时间间隔作为一个消耗段)内日均消耗金额an:
设各连续消耗段的日均消耗量金额的振幅为g,则有:
那么,此用户的预测日均消耗金额E如下:
其中,1<=im<=n的整数,如果则/>且
上述预测日均消耗金额E计算公式中,表示取稳定期(即由相邻消耗段内日均消耗金额的振幅小于等于g的消耗段组成的时期,此处g可根据实际计算的精度需求进行取值,例如取为15%)内的多个连续的消耗段,比如[a1,a2,a3],[a10,a11]……,用每个消耗段的平均日消耗金额作为该消耗段的日均消耗金额,最后取稳定期内的所有消耗段的日均消耗金额的最大值作为该用户的预测日均消耗金额。
另外,设15≤Dn-Dn-1≤30,对于an未处于振幅g为15%的稳定期内,则偏差日均消耗金额M计算公式如下:
M=max{an-m.....an},其中,m为大于等于0的整数
该公式表示取未在上述E的计算公式中出现过日均消耗金额的最大值,且计算时,限定该日均消耗金额an的消耗段间隔天数Dn-Dn-1为大于等于15小于等于30。
利用前述两个公式,计算用户的真实日均消耗金额A为:
A=Average{E,M}
将用户的上一次购买产品P的总金额记为X,购买日期记为Dl,用户下一次购买的日期预测值为Dn,则复购期的计算公式为:
图2是根据本发明实施例的计算用户复购期的方法的主要逻辑的示意图。以下结合图2对本发明实施例的计算用户复购期的方法的主要实现逻辑进行详细介绍。
1.数据清洗:
提取用户相关的历史数据,例如历史购买的订单表数据,包括购买金额,下单时间,收货时间,购买数量,商品单价。
数据缺失值的处理和完善,例如以用户历史数据的均值或者近3个月数据进行加权。
由于企业账号,风险账号会影响复购计算模型计算结果的精准度,考虑到本发明实施例的作用对象大多是大众消费者,因此,本发明实施例中,可以结合电商平台的用户信息数据、风控数据,将涉及企业账号、风险账号等异常用户账号进行过滤。
输出清洗后的用户订单数据。
2.利用复购计算模型计算用户的复购期:
根据输入的用户订单数据,带入算法。
输出用户、产品、下一次购买时间。
3.复购计算模型的参数调试:
将前述步骤2中复购计算模型的计算结果,进行AB测试,以验证计算结果。本发明实施例中,A版本即为统计本发明实施例的复购计算模型计算结果的准确度,B版本可以为使用用户购买间隔天数的均值来预测下一次购买的日期。经过测试证明,A版本的准确率为31.6%(即预测日期和实际日期偏差3天内),B版本的正确率为9.7%(即预测日期和实际日期偏差3天以上)。
本发明实施例中,还可以基于对复购计算模型的计算结果的准确度来调整复购计算模型的参数。通过循环迭代,调整复购计算模型的参数,主要调节连续间隔期日均消耗金额振幅参数g,使模型的输出计算结果达到最优。
4.自动化任务:
本发明实施例中,基于商业的需要,可以将本发明实施例的复购计算模型应用于其他商业***中,即通过开发商业***接口,是其他商业***与该复购计算模型对接,对底层的用户数据进行分析预测,得到用户的复购期,并输出给商业***,以为各商业***的后续决策提供依据。
具体而言,通过本发明所使用的复购计算模型计算复购期的方案,可以帮助电商平台更精准的计算用户快速消费品的日均消费金额,进而更精准的预测用户购买时间,通过对目标用户的友好触达,提升用户体验,让用户感觉到电商平台的人性化,从而实现拉升转化率以及GMV的效果。根据实验数据显示,复购计算模型对于处于购买期的人群转化率是非购买期转化率的3倍左右。具体对接到商业***中,可以包括但不限于以下几点:
(1)根据预测的用户购买时间,定期推送用户需要补充的消费品产品信息,直接通过触达渠道完成一键购买,提升用户下单效率;
(2)优化推荐产品排序,将用户近期需要补充的消费品产品优先级调高,提升用户选品效率;
(3)消费品产品销量预测,通过消耗周期的计算,作为预测消费品产品的未来一段时间的销量的因子,提升销量预测准确率,进而指导库存、定价等。
根据本发明实施例计算用户复购期的技术方案可以看出,基于用户画像和用户历史购买行为,分析发现用户在较长的一段时间内购买同一快消品类下的产品的价位比较接近,因此采用日均消耗金额数据计算用户的复购期,从而可以忽略由于产品规格数据不全带来的日均消耗数量的计算偏差问题,使复购周期的计算方式更加的贴合实际场景;本发明可以覆盖到多种消费品类别的产品,如奶粉、纸尿裤、米面杂粮等日用百货类产品,使用场景广泛,对消费品的销售具有指导意义,应用于电商的实际业务中,可以为用户做出智能的引导与提示,转化率提升能力;通过利用用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息等历史数据,从而可以精准、有效的对用户历史购买行为进行分析;通过在利用复购计算模型对用户的真实日均消耗金额进行计算之前,对历史数据进行清洗,从而可以排除问题数据和异常数据干扰,提高计算的效率;通过区分为稳定期和非稳定期内的消耗段对日均消耗金额进行分别计算,从而能够根据正常数据和偏差数据更为准确的计算用户的真实日均消耗金额;本发明实施例中,通过设置选取部分历史数据作为样例数据,用作对复购计算模型的参数调整,从而能够保障复购计算模型计算结果的准确度最优,提高处于购买期人群的转化率。
图3是根据本发明实施例的计算用户复购期的装置的主要模块的示意图。
本发明实施例的计算用户复购期的装置300主要包括如下模块:获取模块301、第一计算模块302、第二计算模块303。
其中,获取模块301用于获取用户购买特定产品的历史数据;第一计算模块302用于根据所述历史数据,计算用户的真实日均消耗金额;第二计算模块303用于根据所述真实日均消耗金额计算用户针对所述产品的复购期。
其中,历史数据包括如下至少一种信息:用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息。
本发明实施例中,获取模块301还可用于:在根据历史数据,计算用户的真实日均消耗金额之前,对历史数据进行清洗,包括基于用户画像对不符合预设计算条件的用户数据进行剔除、对历史数据中的缺失值进行处理以及对异常数据进行过滤。
第一计算模块302还可用于:以用户相邻购买日之间的时间间隔作为一个消耗段,设定一个消耗段内用户的日均消耗金额为an,各连续消耗段日均消耗金额an的振幅为g;以稳定期内各消耗段的日均消耗金额的最大值所述用户的预测日均消耗金额,所述稳定期是指由与相邻消耗段日均消耗金额相比,日均消耗金额的振幅小于等于g的消耗段组成的时期;以稳定期以外的其它消耗段日均消耗金额的最大值作为所述用户的偏差日均消耗金额,其中,所述稳定期以外的其它消耗段是指与相邻消耗段日均消耗金额相比,日均消耗金额的振幅大于g的消耗段;利用预测日均消耗金额和偏差日均消耗金额进行均值计算,得到真实日均消耗金额。
此外,装置300还可包括:检测模块(图中未示出),用于在获取用户购买特定产品的历史数据之后,预先选定部分历史数据作为样例数据;利用所述样例数据调整所述振幅g的取值,使所述真实日均消耗金额的计算准确度最优。
从以上描述可以看出,本发明实施例中,基于用户画像和用户历史购买行为,分析发现用户在较长的一段时间内购买同一快消品类下的产品的价位比较接近,因此采用日均消耗金额数据计算用户的复购期,从而可以忽略由于产品规格数据不全带来的日均消耗数量的计算偏差问题,使复购周期的计算方式更加的贴合实际场景;本发明可以覆盖到多种消费品类别的产品,如奶粉、纸尿裤、米面杂粮等日用百货类产品,使用场景广泛,对消费品的销售具有指导意义,应用于电商的实际业务中,可以为用户做出智能的引导与提示,转化率提升能力;通过利用用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息等历史数据,从而可以精准、有效的对用户历史购买行为进行分析;通过在利用复购计算模型对用户的真实日均消耗金额进行计算之前,对历史数据进行清洗,从而可以排除问题数据和异常数据干扰,提高计算的效率;通过区分为稳定期和非稳定期内的消耗段对日均消耗金额进行分别计算,从而能够根据正常数据和偏差数据更为准确的计算用户的真实日均消耗金额;本发明实施例中,通过设置选取部分历史数据作为样例数据,用作对复购计算模型的参数调整,从而能够保障复购计算模型计算结果的准确度最优,提高处于购买期人群的转化率。
图4示出了可以应用本发明实施例的计算用户复购期方法或计算用户复购期装置的示例性***架构400。
如图4所示,***架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的计算用户复购期方法一般由服务器405执行,相应地,计算用户复购期装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机***500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机***500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有***500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、第一计算模块和第二计算模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“用于获取用户购买特定产品的历史数据的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取用户购买特定产品的历史数据;根据所述历史数据,计算用户的真实日均消耗金额;根据所述真实日均消耗金额计算用户针对所述产品的复购期。
根据本发明实施例的技术方案,基于用户画像和用户历史购买行为,分析发现用户在较长的一段时间内购买同一快消品类下的产品的价位比较接近,因此采用日均消耗金额数据计算用户的复购期,从而可以忽略由于产品规格数据不全带来的日均消耗数量的计算偏差问题,使复购周期的计算方式更加的贴合实际场景;本发明可以覆盖到多种消费品类别的产品,如奶粉、纸尿裤、米面杂粮等日用百货类产品,使用场景广泛,对消费品的销售具有指导意义,应用于电商的实际业务中,可以为用户做出智能的引导与提示,转化率提升能力;通过利用用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息等历史数据,从而可以精准、有效的对用户历史购买行为进行分析;通过在利用复购计算模型对用户的真实日均消耗金额进行计算之前,对历史数据进行清洗,从而可以排除问题数据和异常数据干扰,提高计算的效率;通过区分为稳定期和非稳定期内的消耗段对日均消耗金额进行分别计算,从而能够根据正常数据和偏差数据更为准确的计算用户的真实日均消耗金额;本发明实施例中,通过设置选取部分历史数据作为样例数据,用作对复购计算模型的参数调整,从而能够保障复购计算模型计算结果的准确度最优,提高处于购买期人群的转化率。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种计算用户复购期的方法,其特征在于,包括:
获取用户购买特定产品的历史数据;
根据所述历史数据,计算用户的真实日均消耗金额,包括:以用户相邻购买日之间的时间间隔作为一个消耗段,设定一个消耗段内用户的日均消耗金额为an,各连续消耗段日均消耗金额an的振幅为g;以稳定期内各消耗段的日均消耗金额的最大值所述用户的预测日均消耗金额,所述稳定期是指由与相邻消耗段日均消耗金额相比,日均消耗金额的振幅小于等于g的消耗段组成的时期;以稳定期以外的其它消耗段日均消耗金额的最大值作为所述用户的偏差日均消耗金额,其中,所述稳定期以外的其它消耗段是指与相邻消耗段日均消耗金额相比,日均消耗金额的振幅大于g的消耗段;利用所述预测日均消耗金额和所述偏差日均消耗金额进行均值计算,得到真实日均消耗金额;
根据所述真实日均消耗金额计算用户针对所述产品的复购期,其中复购期为上次购买期与上次购买总金额除以真实日均消耗金额的商的之和。
2.根据权利要求1所述的方法,其特征在于,所述历史数据包括如下至少一种信息:用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息。
3.根据权利要求1所述的方法,其特征在于,在根据所述历史数据,计算用户的真实日均消耗金额之前,所述方法还包括:对所述历史数据进行清洗,包括基于用户画像对不符合预设计算条件的用户数据进行剔除、对所述历史数据中的缺失值进行处理以及对异常数据进行过滤。
4.根据权利要求1所述的方法,其特征在于,在获取用户购买特定产品的历史数据之后,所述方法还包括:
预先选定部分历史数据作为样例数据;
利用所述样例数据调整所述振幅g的取值,使所述真实日均消耗金额的计算准确度最优。
5.一种计算用户复购期的装置,其特征在于,包括:
获取模块,用于获取用户购买特定产品的历史数据;
第一计算模块,用于根据所述历史数据,计算用户的真实日均消耗金额,包括:以用户相邻购买日之间的时间间隔作为一个消耗段,设定一个消耗段内用户的日均消耗金额为an,各连续消耗段日均消耗金额an的振幅为g;以稳定期内各消耗段的日均消耗金额的最大值所述用户的预测日均消耗金额,所述稳定期是指由与相邻消耗段日均消耗金额相比,日均消耗金额的振幅小于等于g的消耗段组成的时期;以稳定期以外的其它消耗段日均消耗金额的最大值作为所述用户的偏差日均消耗金额,其中,所述稳定期以外的其它消耗段是指与相邻消耗段日均消耗金额相比,日均消耗金额的振幅大于g的消耗段;利用所述预测日均消耗金额和所述偏差日均消耗金额进行均值计算,得到真实日均消耗金额;
第二计算模块,用于根据所述真实日均消耗金额计算用户针对所述产品的复购期,其中复购期为上次购买期与上次购买总金额除以真实日均消耗金额的商的之和。
6.根据权利要求5所述的装置,其特征在于,所述历史数据包括如下至少一种信息:用户购买产品金额信息、下单时间信息、收货时间信息、购买数量信息以及产品单价信息。
7.根据权利要求5所述的装置,其特征在于,所述获取模块还用于:在根据所述历史数据,计算用户的真实日均消耗金额之前,对所述历史数据进行清洗,包括基于用户画像对不符合预设计算条件的用户数据进行剔除、对所述历史数据中的缺失值进行处理以及对异常数据进行过滤。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:检测模块,用于在获取用户购买特定产品的历史数据之后,预先选定部分历史数据作为样例数据;利用所述样例数据调整所述振幅g的取值,使所述真实日均消耗金额的计算准确度最优。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810105295.7A CN110135871B (zh) | 2018-02-02 | 2018-02-02 | 计算用户复购期的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810105295.7A CN110135871B (zh) | 2018-02-02 | 2018-02-02 | 计算用户复购期的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110135871A CN110135871A (zh) | 2019-08-16 |
CN110135871B true CN110135871B (zh) | 2024-06-18 |
Family
ID=67567124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810105295.7A Active CN110135871B (zh) | 2018-02-02 | 2018-02-02 | 计算用户复购期的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110135871B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689402A (zh) * | 2019-09-04 | 2020-01-14 | 北京三快在线科技有限公司 | 推荐商家的方法、装置、电子设备及可读存储介质 |
CN111461632A (zh) * | 2020-06-18 | 2020-07-28 | 北京每日优鲜电子商务有限公司 | 商品供需平衡方法及***、服务器及介质 |
CN113763076A (zh) * | 2020-07-21 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 数据过滤方法和装置 |
CN112396380A (zh) * | 2020-11-26 | 2021-02-23 | 北京沃东天骏信息技术有限公司 | 物品的定期送方法、装置、计算机设备及存储介质 |
CN116127180A (zh) * | 2022-11-09 | 2023-05-16 | 乾三(北京)科技有限公司 | 一种标签配置方法、装置、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150660A (zh) * | 2011-12-06 | 2013-06-12 | 阿里巴巴集团控股有限公司 | 在网络购物平台中产生用户提醒消息的方法和装置 |
CN103578022A (zh) * | 2012-07-19 | 2014-02-12 | 纽海信息技术(上海)有限公司 | 自动化网购装置及方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231264A (ja) * | 1996-02-23 | 1997-09-05 | Hitachi Ltd | オンラインショッピング支援方法およびシステム |
JP2013003834A (ja) * | 2011-06-16 | 2013-01-07 | Hitachi Consumer Electronics Co Ltd | 商品購入推薦装置 |
CN103971217A (zh) * | 2014-02-24 | 2014-08-06 | 浙江大学 | 一种药品库存管理方法及*** |
CN107451840A (zh) * | 2016-05-31 | 2017-12-08 | 百度在线网络技术(北京)有限公司 | 一种交易信息推送方法和装置 |
CN110135915B (zh) * | 2016-08-22 | 2023-05-02 | 北京京东尚科信息技术有限公司 | 商品推荐方法和*** |
CN107123017A (zh) * | 2017-03-22 | 2017-09-01 | 重庆允升科技有限公司 | 一种工业品原料商品推荐方法 |
-
2018
- 2018-02-02 CN CN201810105295.7A patent/CN110135871B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150660A (zh) * | 2011-12-06 | 2013-06-12 | 阿里巴巴集团控股有限公司 | 在网络购物平台中产生用户提醒消息的方法和装置 |
CN103578022A (zh) * | 2012-07-19 | 2014-02-12 | 纽海信息技术(上海)有限公司 | 自动化网购装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110135871A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135871B (zh) | 计算用户复购期的方法和装置 | |
US10824533B2 (en) | Optimization of power and computational density of a data center | |
CN110109901B (zh) | 筛选目标对象的方法和装置 | |
CN110135878B (zh) | 用于确定销售价格的方法及装置 | |
CN109961198B (zh) | 关联信息生成方法和装置 | |
CN110866625A (zh) | 促销指标信息生成方法和装置 | |
US20150161635A1 (en) | Dynamic price elasticity in unstructured marketplace data | |
CN112749323B (zh) | 一种构建用户画像的方法和装置 | |
US20220108198A1 (en) | Apparatus and method for forecasted performance level adjustment and modification | |
JP2019045899A (ja) | 決定装置、決定方法及び決定プログラム | |
CN110827102A (zh) | 用于调货比价的方法和装置 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
US20140059095A1 (en) | System and method for mean estimation for a torso-heavy tail distribution | |
CN110796461B (zh) | 一种评价选品正确性的方法和装置 | |
CN112990951B (zh) | 确定条目访问量的方法和装置 | |
JP2017010402A (ja) | 予測装置、予測方法、及び予測プログラム | |
JP6693900B2 (ja) | コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム | |
CN112418898A (zh) | 基于多时间窗口融合的物品需求数据分析方法和装置 | |
JP2020154782A (ja) | 提案装置、提案方法および提案プログラム | |
WO2018213058A1 (en) | System and method for managing limit orders | |
CN113743972B (zh) | 一种生成物品信息的方法和装置 | |
CN113361834B (zh) | 一种确定分配量的方法和装置 | |
US12045847B2 (en) | Predictions based on analysis of big data | |
CN109978422A (zh) | 积压物品判断方法和装置 | |
EP3968256A1 (en) | Scheduling displays on a terminal device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |