CN109934604B - 销量数据的处理方法、***、存储介质及电子设备 - Google Patents

销量数据的处理方法、***、存储介质及电子设备 Download PDF

Info

Publication number
CN109934604B
CN109934604B CN201711346746.8A CN201711346746A CN109934604B CN 109934604 B CN109934604 B CN 109934604B CN 201711346746 A CN201711346746 A CN 201711346746A CN 109934604 B CN109934604 B CN 109934604B
Authority
CN
China
Prior art keywords
time period
sales
sku
sales data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711346746.8A
Other languages
English (en)
Other versions
CN109934604A (zh
Inventor
龙广斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201711346746.8A priority Critical patent/CN109934604B/zh
Publication of CN109934604A publication Critical patent/CN109934604A/zh
Application granted granted Critical
Publication of CN109934604B publication Critical patent/CN109934604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种销量数据的处理方法、***、存储介质及电子设备,该方法包括:利用第一时间段的销量数据做平滑处理,对该第二时间段内的第一销量数据做数据筛选处理,对第三时间段的第二销量数据按照品类维度进行归类,从而实现了利用第一时间段的销量数据来进行平滑处理,利用第二时间段的第一销量数据做数据筛选操作,并利用第三时间段的第二销量数据按品类维度归类,以逐渐缩减畅销品名单的统计范围,提高了畅销品名单的获取速率。而且,能够减少异常数据以及促销等原因导致长时间无销量存在,从而造成的畅销品名单计算不准确的情况。

Description

销量数据的处理方法、***、存储介质及电子设备
技术领域
本发明涉及物流及计算机技术领域,具体而言,涉及一种销量数据的处理方法、***、存储介质及电子设备。
背景技术
目前,零售业领域的大型企业会涉及到不同层级仓货物存放的问题,不同层级的仓库存储不同数量级的商品。基于提升用户体验的满意度以及提升配送效率的考虑,在大型的仓库中,主要存放品类全而量大的商品,而靠近城市的仓库需要有更多的畅销品以用于满足就近需求。此时,需要对畅销品有一个计算方法,以及其重要度的度量和排序,以用于对新生产的订单有一个更好的满足率的提升。
在实现本发明的过程中,发明人发现现有技术中至少存在以下技术问题:
现有技术中对于畅销品的名单,通常是基于历史销量简单排序。这种排序方式,不考虑商品的季节性,以及异常数据,因此畅销品的名单不够准确
因此,需要一种新的销量数据的处理方法、***、存储介质及电子设备。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种销量数据的处理方法、***、存储介质及电子设备,能够更加准确的计算出的畅销品名单。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的第一方面,提供一种销量数据的处理方法,其中,所述方法包括:
对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;
从所述第一时间段内的第一销量数据提取第二时间段内的第一销量数据,并对所述第二时间段内的第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内的各SKU的第二销量数据;
从所述第二时间段内的第二销量数据提取第三时间段内的第二销量数据,并对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单;
其中,所述第一时间段包括所述第二时间段,所述第二时间段包括所述第三时间段。
根据一些实施例,所述方法包括:根据以下公式对所述第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据:
Figure GDA0002870188310000021
其中,salesi表示SKU在第i天的销量数据,μ表示所述SKU在所述第一时间段内每天的销量平均值,σ表示所述SKU在所述第一时间段内每天的平均值,C表示销量常数,α表示目标平滑参数。
根据一些实施例,所述方法还包括:获取所述目标平滑参数;
所述获取所述目标参数,包括:
获取训练数据;
根据所述平滑参数的不同取值,计算所述训练数据中的各SKU的第一销量数据;
根据每个SKU的第一销量数据、预测模型以及每个预测模型的权重,获取每个平滑参数取值对应的各SKU的第四时间段的预测销量;
根据各SKU的所述第四时间段的预测销量以及所述第四时间段内各 SKU的实际销量,计算出每个平滑参数对应的平均绝对百分误差MAPD;
获取所述MAPD最小值时的平滑参数的取值,以获取目标平滑参数。
根据一些实施例,获取目标平滑参数之后,所述方法还包括:
精确所述目标平滑参数;
所述精确所述目标平滑参数,包括:
按照精度由低到高的顺序,依次获取所述MAPD最小值时的平滑参数的取值,以精确所述目标平滑参数。
根据一些实施例,所述方法包括:通过以下公式,根据各SKU的所述第四时间段的预测销量以及所述第四时间段内各SKU的实际销量,计算出每个平滑参数对应的MAPD:
Figure GDA0002870188310000031
其中,N表示SKU的总数,j表示第j个SKU,forecast_daily_avg_salej表示第j个SKU在第四时间段的日均预测销量,real_daily_avg_salej表示第j个SKU在第四时间段的日均真实销量。
根据一些实施例,对所述第一销量数据做数据筛选处理,以获取第二销量数据,包括:
筛选出在所述第二时间段内SKU的销量之和大于0的第一销量数据,作为第二销量数据。
根据一些实施例,对所述第三时间段内的第二销量数据中的各SKU 按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单,包括:
对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,获取每种品类中的各SKU的第二销量数据;
根据每种品类中的所有SKU的总第二销量数据以及各SKU的第二销量数据,获取到所述第三时间段内的每种畅销级别中的SKU。
根据一些实施例,计算所述第三时间段内的每种品类的畅销品名单之后,所述方法还包括
根据所述畅销品名单获取各仓库中的SKU的名单。
根据本发明的第二方面,提供一种销量数据的处理***,其中,所述***包括:
第一处理模块,用于对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;
第二处理模块,用于从所述第一时间段内的第一销量数据提取第二时间段内的第一销量数据,并对所述第二时间段内的对所述第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内的各SKU的第二销量数据;
计算模块,用于从所述第二时间段内的第二销量数据提取第三时间段内的第二销量数据,并对所述第三时间段内的第二销量数据中的各SKU 按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单;
其中,所述第一时间段包括所述第二时间段,所述第二时间段包括所述第三时间段。
根据一些实施例,所述第一处理模块,用于根据以下公式对所述第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据:
Figure GDA0002870188310000041
其中,salesi表示SKU在第i天的销量数据,μ表示所述SKU在所述第一时间段内每天的销量平均值,σ表示所述SKU在所述第一时间段内每天的平均值,C表示销量常数,α表示目标平滑参数。
根据一些实施例,所述***还包括:获取模块,用于获取所述目标平滑参数;
所述获取模块,包括:
第一获取单元,用于获取训练数据;
第一计算单元,用于根据所述平滑参数的不同取值,计算所述训练数据中的各SKU的第一销量数据;
第二获取单元,用于根据每个SKU的第一销量数据、预测模型以及每个预测模型的权重,获取每个平滑参数取值对应的各SKU的第四时间段的预测销量;
第二计算单元,用于根据各SKU的所述第四时间段的预测销量以及所述第四时间段内各SKU的实际销量,计算出每个平滑参数对应的平均绝对百分误差MAPD;
第三获取单元,用于获取所述MAPD最小值时的平滑参数的取值,以获取目标平滑参数。
根据一些实施例,所述第二处理模块,配置为筛选出在所述第二时间段内SKU的销量之和大于0的第一销量数据,作为第二销量数据。
根据一些实施例,所述计算模块,包括:
归类单元,用于对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,获取每种品类中的各SKU的第二销量数据;
获取单元,用于根据每种品类中的所有SKU的总第二销量数据以及各SKU的第二销量数据,获取到所述第三时间段内的每种畅销级别中的 SKU。
根据本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如第一方面所述的方法步骤。
根据本发明的第四方面,提供一种电子设备,其中,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面所述的方法步骤。
本发明上述实施例中,通过对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;从所述第一时间段内的第一销量数据提取第二时间段内的第一销量数据,并对所述第二时间段内的第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内的各SKU 的第二销量数据;从所述第二时间段内的第二销量数据提取第三时间段内的第二销量数据,并对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,能够计算所述第三时间段内的每种品类的畅销品名单。而且,通过对销量数据数据进行平滑处理以及筛选,可以计算出的畅销品名单更加准确。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。
图1是根据一示例性实施例示出的一种销量数据的处理方法的流程图;
图2为本发明实施例示出的一种第一、二、三时间段的示意图;
图3是根据一示例性实施例示出的一种获取目标平滑参数的方法的流程图;
图4是根据一示例性实施例示出的一种获取每种畅销级别中的SKU 的方法的流程图;
图5是根据本发明实施例示出的一种销量数据的处理***的结构图;
图6是根据一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是,虽然本发明实施例中采用第一/第二等术语来描述处理模块、时间段、销量数据,但这些术语并不能限制处理模块、时间段、销量数据,仅用于将处理模块、时间段、销量数据彼此区分开。
图1是根据一示例性实施例示出的一种销量数据的处理方法的流程图。
如图1所示,在S110中,对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据。
需要说明的是,本发明实施例中的第一时间段可以是一年。
根据示例实施例,在获取到第一时间段内的各SKU的销量数据后,可以通过以下公式对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据:
Figure GDA0002870188310000071
其中,salesi表示SKU在第i天的销量数据,μ表示所述SKU在所述第一时间段内每天的销量平均值,σ表示所述SKU在所述第一时间段内每天的平均值,C表示销量常数,α表示目标平滑参数。
其中,可以通过下面计算第一时间段内的每个SKU的每天的销量平均值:
Figure GDA0002870188310000072
其中,μ表示SKU在所述第一时间段内每天的销量平均值,salesi表示所述SKU在第i天的销量数据,E表示所述SKU的期望。
可以通过下面的公式计算每个SKU在所述第一时间段内每天的标准差:
Figure GDA0002870188310000081
其中,σ以及std(sales)表示SKU在所述第一时间段内每天的标准差,salesi表示所述SKU在第i天的销量数据,
Figure GDA0002870188310000082
表示所述SKU在所述第一时间段内每天的销量平均值,也就是μ,
Figure GDA0002870188310000083
表示所述SKU的方差。
关于目标平滑参数α的方法,参见以下关于获取平滑参数的实施例。
通过公式(1)可知,当某个SKU在第一时间段内的某天的销量数据在μ-α*σ至μ+α*σ区间,且大于销量常数C时,该SKU在该天的第一销量数据等于该SKU在第一时间段内的每天的平均值,如果该SKU在第一时间段内的某天的销量数据不在μ-α*σ至μ+α*σ区间或者不大于销量常数C时,该SKU在该天的第一销量数据为其本身。
本发明实施例中,通过公式(1),将异常数据变为平均值,能够对第一时间段内的异常数据平滑处理,得到第一时间段内的各SKU的第一销量数据。
在S120中,从所述第一时间段内的第一销量数据提取第二时间段内的第一销量数据,并对所述第二时间段内的第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内的各SKU的第二销量数据。
根据示例实施例,在获取到第一时间段内的各SKU的第一销量数据后,可以从中提取出第二时间段内的各SKU的第一销量数据,并从中筛选出在该第二时间段内SKU的销量之和大于0的第一销量数据,作为第二销量数据,将在该第二时间段内的销量之和不大于0的SKU的第一销量数据剔除。
例如,第二时间段取90天,一个季度,在获取到各SKU的90天内的第一销量数据后,可以通过以下公式获取筛选出第二时间段的各SKU 的第一销量数据:
Figure GDA0002870188310000084
需要说明的是,可以存在某SKU的第二时间段内的第一销量数据小于0的情况,例如,在第二时间段内,某SKU只存在退货,或者销量数据异常。
需要指出的是,如果不剔除第二时间段内销量数据不大于0的第一销量数据,这些数据就会占据畅销品的名单,导致畅销品的量膨胀,降低计算精度。
在S130中,从所述第二时间段内的第二销量数据提取第三时间段内的第二销量数据,并对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单。
根据示例实施例,在获取到第二时间段内的第二销量数据后,可以从中提取出第三时间段内的第二销量数据,并将第三时间段内的第二销量数据中各SKU按照品类维度进行归类,例如,将各种品牌和型号的电视归纳到电视维度,从而获取到各个品类维度的SKU的名单,进而计算每种品类的畅销品名单。
进一步的,在获取到畅销品的名单后,可以根据所述畅销品名单对各仓库中的SKU进行布局,以获取到各仓库中的SKU的名单。例如,在近城市的以履约时效性为主的仓中,在有限的商品品类与商品数量限制条件之下,得到更高的订单满足率,降低仓中出现滞销品的概率以及降低仓的周转。
需要说明的是,销量数据是一个以时间排序的数据,距今时间越长的数据可用性越不强,距今越近的信息越能体现当前销量的波动性。本发明实施例中,第一时间段包括第二时间段,第二时间段包括第三时间段,如图2所示,其为本发明实施例示出的一种第一、二、三时间段的示意图,如图2所示,三个时间段包括相同的终点,从而使第二时间段和第三时间段距今最近。
本发明实施例中,通过利用第一时间段的销量数据做平滑处理,对该第二时间段内的第一销量数据做数据筛选处理,对第三时间段的第二销量数据按照品类维度进行归类,从而实现了利用第一时间段的销量数据来进行平滑处理,利用第二时间段的第一销量数据做数据筛选操作,并利用第三时间段的第二销量数据按品类维度归类,以逐渐缩减畅销品名单的统计范围,提高了畅销品名单的获取速率。而且,能够减少异常数据以及促销等原因导致长时间无销量存在,从而造成的畅销品名单计算不准确的情况。
本发明上述实施例中,通过对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;对所述第一销量数据做数据筛选处理,以获取筛选出的各SKU的第二销量数据;对所述第二销量数据中的各 SKU按品类维度归类,能够计算出每种品类的畅销品名单,而且,通过对销量数据做平滑处理,可以计算出的畅销品名单更加准确。
下面结合具体的实施例,对获取目标参数的方法进行说明。
在计算畅销品的名单时,需要使用所有现有数据,例如,今天在计算畅销品名单时,可以取第一时间段为一年,从而获取从昨日开始一年的销量数据,对这些销量数据做初步统计,统计出n个SKU在这一年的销量数据。
需要说明的是,今日的销量数据,需要今日结束才可以获取。
需要指出的是,畅销品的名单的计算是一个动态调节的过程,每次计算时需要去掉已经过时的信息,加入最新的销量信息。销量数据是一个以时间排序的数据,距今时间越长的数据可用性越不强,距今越近的信息越能体现当前销量的波动性。
本发明实施例中,以第一时间段为一年,来计算各SKU在该第一时间段内的每天的平均值μ以及标准差σ。
图3是根据一示例性实施例示出的一种获取目标平滑参数的方法的流程图。
如图3所示,在S310中,获取训练数据。
根据示例实施例,该训练数据可以是第一时间段内任意一段时间的销量数据,且该训练数据需要预测的时间段的实际销量数据已知。需要说明的是,该任意一段时间段为与第四时间段相同天数的不同时间段。例如,第四时间段可以2017年10月1日至10月七日,该任意一段时间段可以为2017年9月24日至9月30日的数据。
在S320中,根据平滑参数的不同取值,计算所述训练数据中的各SKU 的第一销量数据。
例如,设定平滑参数的不同取值,并将各平滑参数带入至公式(1),可以得到每个平滑参数的取值对应的平滑公式。
需要说明的是,每个SKU的平均值和标准差都不相同,因此,针对一个平滑参数取值,可以得到针对每个SKU的平滑公式。
在得到针对每个平滑参数的平滑公式后,利用训练数据中每个SKU 的销量数据、每个SKU的平滑公式,可以得到该训练数据在每个平滑参数的取值对应的各SKU的第一销量数据。
在S330中,根据每个SKU的第一销量数据、预测模型以及每个预测模型的权重,获取每个平滑参数取值对应的各SKU的第四时间段的预测销量。
根据示例实施例,预测模型可以包括GBDT预测模型、移动平均预测模型、加权移动平均预测模型、Xgboost预测模型。本发明实施例中为每个预测模型设置了权重,在获取到针对每个平滑参数的取值对应的各 SKU的第一销量数据后,将各SKU的销量数据带入至每个预测模型,根据每个预测模型的预测结果与每个预测模型的权重,获取到针对每个平滑参数取值的各SKU的在预测模型指定的第四时间段内的预测销量,该预测销量除以该第四时间段,可以得到根据每个平滑参数的取值预测到的每个SKU在第四时间段的日均预测销量。
在S340中,根据各SKU的该第四时间段的预测销量以及该第四时间段内各SKU的实际销量,计算出每个平滑参数对应的平均绝对百分误差MAPD。
根据示例实施例,可以通过以下公式计算每个平滑参数对应的平均绝对百分误差MAPD
Figure GDA0002870188310000111
其中,N表示SKU的总数,j表示第j个SKU,forecast_daily_avg_salej表示第j个SKU在第四时间段的日均预测销量,real_daily_avg_salej表示第j个SKU在第四时间段的日均真实销量。
需要说明的是,对应于平滑参数的不同取值,第j个SKU的第一销量数据不同,根据预测模型以及预测模型的权重计算出该SKU在第四时间段的日均预测销量forecast_daily_avg_salej不同。
需要指出的是,本发明实施例中第四时间段可以包括7天。
在S350中,获取所述MAPD最小值时的平滑参数的取值,以获取目标平滑参数。
根据示例实施例,通过公式(4)可以得到每个平滑参数的取值对应的MAPD,而MAPD可以代表预测结果与真实结果的差距,MAPD越小,代表平滑参数取值越准确,因此,本发明实施例中获取MAPD最小值时的平滑参数的取值,该取值即为目标平滑参数。
本发明上述实施例中,通过多预测模型并为每个预测模型设置权重的方式下,针对各平滑参数的取值计算各SKU的MAPD,从而获取到与真是结果最接近时平滑参数的取值,将该平滑参数作为目标平滑参数,从而实现了对目标平滑参数的准确计算。
本发明实施例中提出可以进一步精确目标平滑参数的方法。根据示例实施例,可以按照精度由低到高的顺序,依次获取所述MAPD最小值时的平滑参数的取值,以精确所述目标平滑参数。
例如,假设获取到目标平滑参数为5,分别取平滑参数为4.8、4.9、 5.1和5.2计算各SKU的MAPD,假设平滑参数取4.9时的MAPD最小,进一步的,取平滑参数为4.86、4.87、7.88、4.89、4.91、4.92、4.93、4.94、 9.95时的各SKU的MAPD,取MAPD最小时的平滑参数为目标平滑参数。
本发明实施例中,按照精度由低到高的顺序,依次获取所述MAPD最小值时的平滑参数的取值,例如,将目标平滑参数精确到小数点后两位,从而提高平滑参数的精度,进而提高平滑处理的准确度,提高第一销量数据的准确度。
下面结合具体的实施例,对根据每种品类中的所有SKU的总第二销量数据以及各SKU的第二销量数据,获取到每种畅销级别中的SKU的方法进行详细的说明。
图4是根据一示例性实施例示出的一种获取每种畅销级别中的SKU 的方法的流程图。
如图4所示,在410中,对每种品类中的各SKU的第二销量数据按照从大到小排序,并计算每种品类的总销量。
根据示例实施例,该各SKU的第二销量数据可以是将各SKU在某一指定时间段内的每天的第二销量数据求和。
需要说明的是,每种品类的总销量可以通过以下公式计算:
totalSales=∑salesi (5)
在S420中,预设每种品类维度的畅销级别,并计算每种品类维度的各级别的SKU名单。
例如,预设某SKU的畅销级别为,A、B、C、D、E及F等六个级别,这6个级别的判断条件分别为:A:占据该品类的总销量的20%(最大不超过20%),B:占据该品类的总销量的40%(最大不超过40%)…… F:占据该品类的总销量的0.000001(销量为0)。即累积销量前20%为 A-级,前20%~40%为B-级,依次类推出CDE-级,其中F-级为0销量数据。
按照第二销量数据按照从大到小顺序,计算A、B、C、D、E及F级别的畅销品名单。例如,可以通过以下公式计算:
A:sales1+...+salesi≤20%*totalSales;
B:salesi+1+...+salesj≤40%*totalSales;
……
F:salesz≤0.000001(销量为0)。
根据以上公式,可以计算出每个级别的最后一个SKU,从而获取到每个级别的SKU名单以及SKU的顺序。进一步的,可以将ABC-级的对应商品定义为畅销品,DEF-级定义为非畅销品。得到最终畅销程度的名单。需要说明的是,本发明实施例中F为畅销品名单中级别最低,也就是最不畅销的级别,在对第二时间段内的销量数据进行筛选时剔除的SKU,由于其在第二时间段内的销量数据小于等于零,因此,可以直接将其分配到F 级。
本发明实施例中,设置每个级别以及每个级别的判断条件,从而获取到每个品类的商品畅销度的级别。
应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。
下述为本发明***实施例,可以用于执行本发明方法实施例。在下文对装置的描述中,与前述方法相同的部分,将不再赘述。
图5是根据本发明实施例示出的一种销量数据的处理***的结构图。如图5所示,***500包括:
第一处理模块510,用于对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;
第二处理模块520,用于对所述第一销量数据做数据筛选处理,以获取筛选出的各SKU的第二销量数据;
计算模块530,用于对所述第二销量数据中的各SKU按品类维度归类,计算每种品类的畅销品名单。
根据一些实施例,所述第一处理模块510,用于根据以下公式对所述第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据:
Figure GDA0002870188310000141
其中,salesi表示SKU在第i天的销量数据,μ表示所述SKU在第二时间段内每天的销量平均值,σ表示所述SKU在第二时间段内每天的平均值,C表示销量常数,α表示目标平滑参数。
根据一些实施例,所述***500还包括:获取模块540,用于获取所述目标平滑参数;
所述获取模块540,包括:
第一获取单元541,用于获取训练数据;
第一计算单元543,用于根据所述平滑参数的不同取值,计算所述训练数据中的各SKU的第一销量数据;
第二获取单元545,用于根据每个SKU的第一销量数据、预测模型以及每个预测模型的权重,获取每个平滑参数取值对应的各SKU的第三时间段的预测销量;
第二计算单元547,用于根据各SKU的所述第三时间段的预测销量以及所述第三时间段内各SKU的实际销量,计算出每个平滑参数对应的平均绝对百分误差MAPD;
第三获取单元549,用于获取所述MAPD最小值时的平滑参数的取值,以获取目标平滑参数。
根据一些实施例,所述第二处理模块520,配置为筛选出SKU在所述第一时间段内的销量之和大于0的第一销量数据,作为第二销量数据。
根据一些实施例,所述计算模块530,包括:
归类单元532,用于对所述第二销量数据中的各SKU按品类维度归类,获取每种品类中的各SKU的第二销量数据;
获取单元534,用于根据每种品类中的所有SKU的总第二销量数据以及各SKU的第二销量数据,获取到每种畅销级别中的SKU。
本发明上述实施例中,通过对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;对所述第一销量数据做数据筛选处理,以获取筛选出的各SKU的第二销量数据;对所述第二销量数据中的各 SKU按品类维度归类,能够计算出每种品类的畅销品名单,而且,通过对销量数据做平滑处理,可以计算出的畅销品名单更加准确。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备可以执行:对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据;对所述第一销量数据做数据筛选处理,以获取筛选出的各SKU的第二销量数据;对所述第二销量数据中的各SKU按品类维度归类,计算每种品类的畅销品名单。
图6是根据一示例性实施例示出的一种电子设备的结构示意图。需要说明的是,图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图 6 所示,电子设备包括中央处理单元 (CPU)601 ,其可以根据存储在只读存储器 (ROM)602 中的程序或者从储存部分 608 加载到随机访问存储器 (RAM)603 中的程序而执行各种适当的动作和处理。在 RAM 603 中,还存储有电子设备操作所需的各种程序和数据。 CPU 601 、 ROM 602 以及 RAM 603 通过总线 604 彼此相连。输入 / 输出 (I/O) 接口 605 也连接至总线 604 。
以下部件连接至 I/O 接口 605 :包括键盘、鼠标等的输入部分 606 ;包括诸如阴极射线管 (CRT) 、液晶显示器 (LCD) 等以及扬声器等的输出部分 607 ;包括硬盘等的储存部分 608 ;以及包括诸如 LAN 卡、调制解调器等 的网络接口卡的通信部分 609 。通信部分 609 经由诸如因特网的网络执行 通信处理。驱动器 610 也根据需要连接至 I/O接口 605 。可拆卸介质 611 ,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器 610 上,以便于从其上读出的计算机程序根据需要被安装入储存部分 608 。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的终端中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一处理模块、第二处理模块和计算模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
以上具体示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims (13)

1.一种销量数据的处理方法,其特征在于,所述方法包括:
处理器对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据,包括:
计算各SKU的MAPD,获取所述MAPD最小值时的平滑参数的取值,所述取值即为目标平滑参数;
Figure FDA0003047106000000011
其中,salesi表示SKU在第i天的销量数据,μ表示所述SKU在所述第一时间段内每天的销量平均值,σ表示所述SKU在所述第一时间段内每天的标准差,C表示销量常数,α表示目标平滑参数;
处理器从所述第一时间段内的第一销量数据提取第二时间段内的第一销量数据,并对所述第二时间段内的第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内的各SKU的第二销量数据;
处理器从所述第二时间段内的第二销量数据提取第三时间段内的第二销量数据,并对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单;
其中,所述第一时间段包括所述第二时间段,所述第二时间段包括所述第三时间段。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:处理器获取所述目标平滑参数;
所述获取所述目标平滑参数,包括:
处理器获取训练数据;
处理器根据平滑参数的不同取值,计算所述训练数据中的各SKU的第一销量数据;
处理器根据每个SKU的第一销量数据、预测模型以及每个预测模型的权重,获取每个平滑参数取值对应的各SKU的第四时间段的预测销量;
处理器根据各SKU的所述第四时间段的预测销量以及所述第四时间段内各SKU的实际销量,计算出每个平滑参数对应的平均绝对百分误差MAPD;
处理器获取所述MAPD最小值时的平滑参数的取值,以获取目标平滑参数。
3.如权利要求2所述的方法,其特征在于,获取目标平滑参数之后,所述方法还包括:
处理器精确所述目标平滑参数;
处理器所述精确所述目标平滑参数,包括:
处理器按照精度由低到高的顺序,依次获取所述MAPD最小值时的平滑参数的取值,以精确所述目标平滑参数。
4.如权利要求2所述的方法,其特征在于,所述方法包括:处理器通过以下公式,根据各SKU的所述第四时间段的预测销量以及所述第四时间段内各SKU的实际销量,计算出每个平滑参数对应的MAPD:
Figure FDA0003047106000000021
其中,N表示SKU的总数,j表示第j个SKU,forecast_daily_avg_salej表示第j个SKU在第四时间段的日均预测销量,real_daily_avg_salej表示第j个SKU在第四时间段的日均真实销量。
5.如权利要求1所述的方法,其特征在于,处理器对所述第二时间段内的第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内各SKU的第二销量数据,包括:
处理器筛选出在所述第二时间段内SKU的销量之和大于0的第一销量数据,作为第二销量数据。
6.如权利要求1所述的方法,其特征在于,处理器对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单,包括:
处理器对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,获取每种品类中的各SKU的第二销量数据;
处理器根据每种品类中的所有SKU的总第二销量数据以及各SKU的第二销量数据,获取到所述第三时间段内的每种畅销级别中的SKU。
7.如权利要求1所述的方法,其特征在于,处理器计算所述第三时间段内的每种品类的畅销品名单之后,所述方法还包括
处理器根据所述畅销品名单获取各仓库中的SKU的名单。
8.一种销量数据的处理***,其特征在于,所述***包括:
第一处理模块,用于对第一时间段内的各SKU的销量数据做平滑处理,以获取各SKU的第一销量数据,包括:
计算各SKU的MAPD,获取所述MAPD最小值时的平滑参数的取值,所述取值即为目标平滑参数;
Figure FDA0003047106000000031
其中,salesi表示SKU在第i天的销量数据,μ表示所述SKU在所述第一时间段内每天的销量平均值,σ表示所述SKU在所述第一时间段内每天的标准差,C表示销量常数,α表示目标平滑参数;
第二处理模块,用于从所述第一时间段内的第一销量数据提取第二时间段内的第一销量数据,并对所述第二时间段内的对所述第一销量数据做数据筛选处理,以获取筛选出的所述第二时间段内的各SKU的第二销量数据;
计算模块,用于从所述第二时间段内的第二销量数据提取第三时间段内的第二销量数据,并对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,计算所述第三时间段内的每种品类的畅销品名单;
其中,所述第一时间段包括所述第二时间段,所述第二时间段包括所述第三时间段。
9.如权利要求8所述的***,其特征在于,所述***还包括:获取模块,用于获取所述目标平滑参数;
所述获取模块,包括:
第一获取单元,用于获取训练数据;
第一计算单元,用于根据平滑参数的不同取值,计算所述训练数据中的各SKU的第一销量数据;
第二获取单元,用于根据每个SKU的第一销量数据、预测模型以及每个预测模型的权重,获取每个平滑参数取值对应的各SKU的第四时间段的预测销量;
第二计算单元,用于根据各SKU的所述第四时间段的预测销量以及所述第四时间段内各SKU的实际销量,计算出每个平滑参数对应的平均绝对百分误差MAPD;
第三获取单元,用于获取所述MAPD最小值时的平滑参数的取值,以获取目标平滑参数。
10.如权利要求8所述的***,其特征在于,所述第二处理模块,配置为筛选出在所述第二时间段内SKU的销量之和大于0的第一销量数据,作为第二销量数据。
11.如权利要求8所述的***,其特征在于,所述计算模块,包括:
归类单元,用于对所述第三时间段内的第二销量数据中的各SKU按品类维度归类,获取每种品类中的各SKU的第二销量数据;
获取单元,用于根据每种品类中的所有SKU的总第二销量数据以及各SKU的第二销量数据,获取到所述第三时间段内的每种畅销级别中的SKU。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述的方法步骤。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法步骤。
CN201711346746.8A 2017-12-15 2017-12-15 销量数据的处理方法、***、存储介质及电子设备 Active CN109934604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711346746.8A CN109934604B (zh) 2017-12-15 2017-12-15 销量数据的处理方法、***、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711346746.8A CN109934604B (zh) 2017-12-15 2017-12-15 销量数据的处理方法、***、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN109934604A CN109934604A (zh) 2019-06-25
CN109934604B true CN109934604B (zh) 2021-09-07

Family

ID=66979511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711346746.8A Active CN109934604B (zh) 2017-12-15 2017-12-15 销量数据的处理方法、***、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN109934604B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378769A (zh) * 2019-07-22 2019-10-25 上海一站通网络科技服务有限公司 一种基于互联网的电商资源整合方法和***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083111A (ja) * 2000-06-20 2002-03-22 Nichimen Corp 商品管理システム
CN102938124A (zh) * 2012-10-29 2013-02-20 北京京东世纪贸易有限公司 确定节日热销商品的方法和装置
CN102968670A (zh) * 2012-10-23 2013-03-13 北京京东世纪贸易有限公司 预测数据的方法和装置
CN104517224A (zh) * 2014-12-22 2015-04-15 浙江工业大学 一种网络热销商品的预测方法及***
CN105321089A (zh) * 2014-07-16 2016-02-10 苏宁云商集团股份有限公司 基于多算法融合的电子商务推荐方法和***
CN106485542A (zh) * 2016-09-28 2017-03-08 网易无尾熊(杭州)科技有限公司 一种信息展示方法及装置
CN106971348A (zh) * 2016-01-14 2017-07-21 阿里巴巴集团控股有限公司 一种基于时间序列的数据预测方法和装置
CN107274231A (zh) * 2017-06-29 2017-10-20 北京京东尚科信息技术有限公司 数据预测方法及装置
CN107403345A (zh) * 2017-09-22 2017-11-28 北京京东尚科信息技术有限公司 畅销商品预测方法及***、存储介质及电子终端
CN107463675A (zh) * 2017-08-03 2017-12-12 北京京东尚科信息技术有限公司 数据处理方法及其***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083111A (ja) * 2000-06-20 2002-03-22 Nichimen Corp 商品管理システム
CN102968670A (zh) * 2012-10-23 2013-03-13 北京京东世纪贸易有限公司 预测数据的方法和装置
CN102938124A (zh) * 2012-10-29 2013-02-20 北京京东世纪贸易有限公司 确定节日热销商品的方法和装置
CN105321089A (zh) * 2014-07-16 2016-02-10 苏宁云商集团股份有限公司 基于多算法融合的电子商务推荐方法和***
CN104517224A (zh) * 2014-12-22 2015-04-15 浙江工业大学 一种网络热销商品的预测方法及***
CN106971348A (zh) * 2016-01-14 2017-07-21 阿里巴巴集团控股有限公司 一种基于时间序列的数据预测方法和装置
CN106485542A (zh) * 2016-09-28 2017-03-08 网易无尾熊(杭州)科技有限公司 一种信息展示方法及装置
CN107274231A (zh) * 2017-06-29 2017-10-20 北京京东尚科信息技术有限公司 数据预测方法及装置
CN107463675A (zh) * 2017-08-03 2017-12-12 北京京东尚科信息技术有限公司 数据处理方法及其***
CN107403345A (zh) * 2017-09-22 2017-11-28 北京京东尚科信息技术有限公司 畅销商品预测方法及***、存储介质及电子终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于时间序列连续预测的供需平衡***研究》;高朝发;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;20140815(第8期);全文 *

Also Published As

Publication number Publication date
CN109934604A (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
US20160285672A1 (en) Method and system for processing network media information
CN109685537B (zh) 用户行为的分析方法、装置、介质和电子设备
CN110689070B (zh) 一种业务预测模型的训练方法及装置
CN107886241B (zh) 资源分析方法、装置、介质和电子设备
CN113159355A (zh) 数据预测方法、装置、物流货量预测方法、介质、设备
CN109740036B (zh) Ota平台酒店排序方法及装置
CN112598472A (zh) 产品推荐方法、装置、***、介质和程序产品
CN110689395A (zh) 用于推送信息的方法和装置
CN111582394B (zh) 一种群体评估方法、装置、设备及介质
CN115907926A (zh) 商品的推荐方法、装置、电子设备及存储介质
CN115170244A (zh) 新产品的冷启动推荐方法、装置、电子设备和介质
CN115797005A (zh) 预测模型的训练、商品推荐方法、装置、电子设备及介质
US20180150754A1 (en) Data analysis method, system and non-transitory computer readable medium
CN114663015A (zh) 补货方法和装置
CN113191806B (zh) 确定流量调控目标的方法及装置
CN114048927A (zh) 需求量预测方法、装置、电子设备和存储介质
CN109934604B (zh) 销量数据的处理方法、***、存储介质及电子设备
CN110599281A (zh) 一种确定目标店铺的方法和装置
CN113554307B (zh) 一种基于rfm模型的用户分组方法、装置及可读介质
CN111833085A (zh) 一种计算物品价格的方法和装置
CN116029794A (zh) 商品价格确定方法、装置、电子设备及存储介质
CN110689032A (zh) 数据处理方法及***、计算机***和计算机可读存储介质
CN115062687A (zh) 企业信用监控方法、装置、设备及存储介质
CN112051843B (zh) 基于订单预估的路径规划方法、装置、机器人和存储介质
CN108109002B (zh) 数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant