CN110544118B - 销量预测方法、装置、介质和计算设备 - Google Patents

销量预测方法、装置、介质和计算设备 Download PDF

Info

Publication number
CN110544118B
CN110544118B CN201910787851.8A CN201910787851A CN110544118B CN 110544118 B CN110544118 B CN 110544118B CN 201910787851 A CN201910787851 A CN 201910787851A CN 110544118 B CN110544118 B CN 110544118B
Authority
CN
China
Prior art keywords
sales
category
stage
product
stages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910787851.8A
Other languages
English (en)
Other versions
CN110544118A (zh
Inventor
王珺
郭训力
吕韬
王文豹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201910787851.8A priority Critical patent/CN110544118B/zh
Publication of CN110544118A publication Critical patent/CN110544118A/zh
Application granted granted Critical
Publication of CN110544118B publication Critical patent/CN110544118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的实施方式提供了一种销量预测方法。该方法包括:对至少一部分产品进行聚类,得到至少一个类别;确定第一产品在所述至少一个类别中所属的第一类别;基于所述第一类别中的长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数;计算所述第一类别的M个类别时间提升因子,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量。本发明的方法可以解决新产品历史销量数据不足导致的需求预测不准确的问题。本发明的实施方式还提供了一种销量预测装置、介质及计算设备。

Description

销量预测方法、装置、介质和计算设备
技术领域
本发明的实施方式涉及互联网技术领域,更具体地,本发明的实施方式涉及一种销量预测方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网+的发展,线上采购活动日益频繁。线上采购平台的运行中可以积累大量的供销数据。通过挖掘这些供销数据中的信息,可以优化线上采购平台的运营,例如可以实现库存成本和运转效率最优化。
然而,对于线上采购平台新上市销售的产品(以下简称新品),其历史供销数据往往不充分,如何在不充分的数据基础上最大限度地挖掘有价值的信息,以科学合理地预测新品的销量,更合理地安排新品的库存情况,是一个亟待解决的问题。
发明内容
在本上下文中,本发明的实施方式期望提供一种销量预测方法和装置,可以通过对线上采购平台中的长期产品的销量数据,来预测新品的未来销量,从而对于新品也能够通过较为科学合理预测其未来销量。
在本发明实施方式的第一方面中,提供了一种销量预测方法。所述方法包括:对至少一部分产品进行聚类,得到至少一个类别;确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品;基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数;计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征;以及基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
在本发明的一个实施例中,所述计算所述第一类别的M个类别时间提升因子包括:统计所述长期产品的与所述M个阶段一一对应的M个阶段历史销量;通过所述销量趋势函数计算所述长期产品的与所述M个阶段一一对应的M个阶段趋势销量;基于所述M个阶段历史销量与所述M个阶段趋势销量中对应于同一阶段的阶段历史销量和阶段趋势销量的比值,得到M个类别去趋势销量;以及对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子。
在本发明的一个实施例中,所述对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子包括:计算所述M个类别去趋势销量的平均值,得到类别平均去趋势销量;以及将所述M个类别去趋势销量分别除以所述类别平均去趋势销量,得到所述M个类别时间提升因子。
在本发明的一个实施例中,所述对至少一部分产品进行聚类,得到至少一个类别包括:基于所述至少一部分产品的静态特征和动态特征进行层次聚类,其中,所述静态特征用于描述所述至少一部分产品的静态属性,所述动态特征用于描述所述至少一部分产品在流通环节基于用户的交互行为而产生的动态属性,所述层次聚类包括具有父子关系的多级类别。
在本发明的一个实施例中,所述计算所述第一类别的M个类别时间提升因子还包括:当所述M个类别时间提升因子中存在不满足稳定性条件的类别时间提升因子时,获取所述不满足稳定性条件的类别时间提升因子对应的阶段,得到提升因子待定阶段;以及将所述第一类别的父类中与所述提升因子待定阶段对应的满足所述稳定性条件的类别时间提升因子确定为所述第一类别的与所述提升因子待定阶段对应的类别时间提升因子。在本发明的一个实施例中,所述稳定性条件被设置为预定的数值范围。
在本发明的一个实施例中,所述基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,包括:计算所述距离当前最近的S个阶段的历史销量的总和;从所述M个类别时间提升因子选择与所述S个阶段一一对应的S个类别时间提升因子;计算所述S个类别时间提升因子的总和,得到所述第一产品在所述S个阶段的提升因子总和;通过所述距离当前最近的S个阶段的历史销量的总和除以所述提升因子总和,得到所述第一产品在所述距离当前最近的S个阶段中的每个阶段参考销量;确定所述待预测阶段对应于M个阶段中的第一阶段,并将第一阶段对应的类别时间提升因子确定为所述待预测阶段对应的类别时间提升因子;以及根据所述参考销量和所述待预测阶段对应的类别时间提升因子确定所述第一产品在所述待预测阶段的预测销量。
在本发明的一个实施例中,所述基本计时单位被设置为月份,以及所述N个阶段被设置为N个连续的月份。
在本发明实施方式的第二方面中,提供了一种销量预测装置。所述装置包括聚类模块、类别确定模块、趋势函数获取模块、类别时间提升因子计算模块、以及预测模块。所述聚类模块用于对至少一部分产品进行聚类,得到至少一个类别。所述类别确定模块用于确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品。所述趋势函数获取模块用于基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数。所述类别时间提升因子计算模块用于计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征。所述预测模块用于基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
在本发明的一个实施例中,所述类别时间提升因子计算模块包括统计子模块、趋势销量计算子模块、类别去趋势销量计算子模块以及类别时间提升因子计算子模块。所述统计子模块用于统计所述长期产品的与所述M个阶段一一对应的M个阶段历史销量。所述趋势销量计算子模块用于通过所述销量趋势函数计算所述长期产品的与所述M个阶段一一对应的M个阶段趋势销量。所述类别去趋势销量计算子模块用于基于所述M个阶段历史销量与所述M个阶段趋势销量中对应于同一阶段的阶段历史销量和阶段趋势销量的比值,得到M个类别去趋势销量。所述类别时间提升因子计算子模块,用于对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子。
在本发明的一个实施例中,所述类别时间提升因子计算子模块,具体用于计算所述M个类别去趋势销量的平均值,得到类别平均去趋势销量,以及将所述M个类别去趋势销量分别除以所述类别平均去趋势销量,得到所述M个类别时间提升因子。
在本发明的一个实施例中,所述聚类模块,具体用于基于所述至少一部分产品的静态特征和动态特征进行层次聚类,其中,所述静态特征用于描述所述至少一部分产品的静态属性,所述动态特征用于描述所述至少一部分产品在流通环节基于用户的交互行为而产生的动态属性,所述层次聚类包括具有父子关系的多级类别。
在本发明的一个实施例中,所述类别时间提升因子计算模块还包括追溯子模块。所述追溯子模块用于当所述M个类别时间提升因子中存在不满足稳定性条件的类别时间提升因子时,获取所述不满足稳定性条件的类别时间提升因子对应的阶段,得到提升因子待定阶段,以及将所述第一类别的父类中与所述提升因子待定阶段对应的满足所述稳定性条件的类别时间提升因子确定为所述第一类别的与所述提升因子待定阶段对应的类别时间提升因子。在本发明的一个实施例中,所述稳定性条件被设置为预定的数值范围。
在本发明的一个实施例中,所述预测模块包括预测用销量总和计算子模块、类别时间提升因子选择子模块、预测用提升因子总和计算模块、参考销量确定子模块、待预测阶段类别时间提升因子确定模块以及预测销量确定子模块。所述预测用销量总和计算子模块用于计算所述距离当前最近的S个阶段的历史销量的总和。所述类别时间提升因子选择子模块用于从所述M个类别时间提升因子选择与所述S个阶段一一对应的S个类别时间提升因子。所述预测用提升因子总和计算模块用于计算所述S个类别时间提升因子的总和,得到所述第一产品在所述S个阶段的提升因子总和。所述参考销量确定子模块用于通过所述距离当前最近的S个阶段的历史销量的总和除以所述提升因子总和,得到所述第一产品在所述距离当前最近的S个阶段中的每个阶段参考销量。所述待预测阶段类别时间提升因子确定模块,用于确定所述待预测阶段对应于M个阶段中的第一阶段,并将第一阶段对应的类别时间提升因子确定为所述待预测阶段对应的类别时间提升因子。所述预测销量确定子模块,用于根据所述参考销量和所述待预测阶段对应的类别时间提升因子确定所述第一产品在所述待预测阶段的预测销量。
在本发明的一个实施例中,所述基本计时单位被设置为月份,以及所述N个阶段被设置为N个连续的月份。
在本发明实施方式的第三方面中,提供了一种计算设备。所述计算设备包括一个或多个存储单元、以及一个或多个处理单元。所述一个或多个存储单元存储有可执行指令。所述一个或多个处理单元执行所述可执行指令,用以实现如上所述的方法。
在本发明实施方式的第四方面中,提供了一种计算机可读存储介质,其上存储有可执行指令,所述指令在被处理器执行时使处理器执行如上所述的方法。
根据本发明实施方式的方法、装置、介质和计算设备,一定程度上解决了新品历史销量数据不足导致的销量预测不准确的问题,可以提升新品销量预测的准确率,从而能够帮助制定更为科学合理地销售计划,规避高库存或缺货带来的风险,为线上采购平台的运营服务提供了有效地支持。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式的销量预测方法和装置的应用场景;
图2示意性地示出了根据本发明实施例的销量预测方法的流程图;
图3示意性地示出了根据本发明实施例的销量预测方法中层次聚类的聚类结果的结构示意图;
图4示意性地示出了根据本发明一实施例的销量预测方法中计算第一类别的M个类别时间提升因子的方法流程图;
图5示意性地示出了根据本发明一实施例对M个类别去趋势销量进行归一化处理的方法流程图;
图6示意性地示出了根据本发明一实施例的销量预测方法中预测销量的方法流程图;
图7示意性地示出了根据本发明实施例的销量预测装置的方框图;
图8示意性地示出了根据本发明一实施例图7中的类别时间提升因子计算模块的方框图;
图9示意性地示出了根据本发明一实施例图7中的预测模块的方框图;
图10示意性示出了适于实现根据本发明实施例的销量预测方法的程序产品的示意图;
图11示意性示出了适于实现根据本发明实施例的销量预测方法的计算设备的方框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种销量预测方法、装置、介质和计算设备。
在本文中,需要理解的是,所涉及的术语:
类别时间提升因子:用于表征一个阶段内由于短期季节性因素对类别中的产品的销量带来的影响,可以体现为在类别中的长期产品在该阶段的历史销量与根据销量趋势函数计算得到的趋势销量的比值。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,产品在每个阶段(例如,每月或每个季度)的销量受长期的趋势性因素和短期季节性因素两方面影响。例如,某个产品在从长期趋势来看销量是逐月增加的,但是在某一个或几个月有可能会有波动。
其中,趋势性因素可以通过对产品的历史销量数据回归得到的销量趋势函数来体现。其中回归的意义在于找到产品的销量随时间变化的趋势性。短期季节性因素例如可以通过与趋势性因素的相对状态(例如,短期季节性因素指数)来体现,例如可以体现为某一阶段的历史销量与在该阶段中根据回归趋势函数计算得到的趋势销量的比值。
这样,在进行产品销量预测时如果能够获得该产品的销量趋势函数、以及待预测阶段的短期季节性因素指数,就可以预测出该待预测阶段中产品的销量。
例如,如果一个产品(例如,长期产品)的销售时间足够长,数据量较大,此时该长期产品的销售量趋势性明显。那么在预测该长期产品的销量时,可以先根据该长期产品的销售趋势函数得到该长期产品在待预测阶段的趋势销量,然后使用该趋势销量乘以待预测阶段对应的短期季节性因素指数来预测该长期产品的销量。
或者例如,如果一个产品(例如,新品)的销售时间过短,可以进行回归的数据量过少,趋势性不明显,在这种情况下可以认为在短期内该产品的销量基本保持当前的销售水平,几乎不存在上升或下降的变化趋势。这样,在预测时可以结合短期季节性因素的影响,预测该新品的销量为在当前销量水平上乘以待预测阶段对应的短期季节性因素指数。
然而,由于新品的历史销售量数据较少,其短期季节性因素指数的获得也会成为一个问题。对此,发明人认为可以使用与新品的短期销量规律波动具有一定相似性的其他长期产品的短期季节性因素指数来替代。更进一步的,基于统计学原理以及大数据分析,可以对在线采购平台中的大量产品基于销量特征等进行聚类,然后以该新品所属的类别的短期季节性因素指数来替代该新品的短期季节性因素指数。基于这样的思路,就可以将寻找新品的短期季节性因素指数转换为首先对大量产品聚类,然后寻找该新品所属的类别中的产品的短期季节性因素指数(即,本文中的类别时间提升因子)的问题。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
首先参考图1。
图1示意性地示出了根据本发明实施方式的销量预测方法和装置的应用场景。
如图1所示,该应用场景包括终端设备11和服务器(集群)12。终端设备11和服务器(集群)12通过网络连接。该网络可以为局域网、广域网、移动互联网等,可以包括各种连接类型,例如有线、无线通信链路等等。
终端设备11可以是但不限于便携设备(例如:手机、平板、笔记本电脑等),也可以为个人电脑(PC,Personal Computer)。用户可以使用终端设备11通过网络与服务器(集群)12交互,以接收或发送消息等。终端设备11上可以安装有各种客户端应用,例如购物类应用、网页浏览器应用等(仅为示例)。用户可以终端设备11中安装的客户端应用进行下单操作等,来进行线上的产品采购活动。
服务器(集群)12可以是提供各种服务的服务器(集群),例如对用户利用终端设备11所使用的购物类应用等提供支持的后台服务器(仅为示例)。该后台服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果反馈给终端设备。例如,服务器(集群)12可以对用户利用终端设备11进行下单操作而产生的订单信息(例如订单中的产品、产品的属性、和产品的销量等)进行处理。
根据本发明的实施例,服务器(集群)12还可以存储、以及处理用户利用终端设备11进行线上采购而产生的各种数据,并利用这些数据通过根据本公开实施例的方法来预测各个产品的未来销量等。
需要说明的是,本发明实施例所提供的销量预测的方法可以由服务器(集群)12执行。相应地,本发明实施例所提供的销售预测装置、介质或计算设备一般可以设置于服务器(集群)12中。或者,本发明实施例所提供的销售预测方法也可以由不同于服务器(集群)12且能够与终端设备11和/或服务器(集群)12通信的其他服务器或服务器集群执行。相应地,本发明实施例所提供的销售预测装置、介质或计算设备也可以设置于不同于服务器(集群)12且能够与终端设备11和/或服务器(集群)12通信的其他服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
示例性方法
下面结合图1的应用场景,参考图2~6来描述根据本发明示例性实施方式的销量预测方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
图2示意性地示出了根据本发明实施例的销量预测方法的流程图。
如图2所示,该销量预测方法可以包括操作S210~操作S250。
在操作S210,对至少一部分产品进行聚类,得到至少一个类别。例如,该至少一部分产品例如可以是服务器(集群)12提供服务支持的在线采购平台(以下简称平台)中销售的产品。在操作S210中对至少一部分产品进行聚类时所使用的聚类方法可以是任意一种聚类方法,例如K-means聚类、高斯混合聚类、或者层次聚类等。
根据本发明的一个实施例,操作S210中可以使用层次聚类。
图3示意性地示出了根据本发明实施例的销量预测方法中层次聚类的聚类结果300的结构示意图。
如图3所示,层次聚类的聚类结果300包括具有父子关系的多级类别。层次聚类可以分为凝聚(agglomerative)层次聚类和***(divsive)层次聚类。***层次聚类采用的就是″自顶而下″的思想,先将所有的样本都看作是同一个类,然后通过迭代将类划分为更小的类,直到每个样本中只有一个样本为止。凝聚层次聚类采用的是″自底向上″的思想,先将每一个样本都看成是一个不同的类,通过重复迭代将最接近的两类或若干个类合并成一个新类,直到最后所有的样本都属于同一个类为止。
在本发明的一个实施例中,可以采用凝聚层次聚类。例如可以是先将聚类的至少一部分产品中每个产品各自看成一类,然后确定类与类之间的相似统计量,并选择最接近的两类或若干个类合并成一个新类,计算新类与其他各类之间的相似性统计量,再选择最接近的两类或若干类合并成一个新类,直到所有参与聚类的对象都合并成一个总类(例如,图3中的一级类别1)为止。在层次聚类结束后,可以根据需要从中选择若干层,作为聚类结果。例如,图3的聚类结果300包括总类在内的3级具有父子关系的类别。
在本发明的一个实施例中,对该平台中的至少一部分产品进行层次聚类的过程可以是,基于平台中的至少一部分产品的静态特征和动态特征进行层次聚类。其中,所述静态特征用于描述所述至少一部分产品的静态属性,所述动态特征用于描述所述至少一部分产品在流通环节基于用户的交互行为而产生的动态属性。例如,可以首先收集平台中的至少一部分产品(例如,在售的全部产品)中每个产品的静态特征和动态特征。在收集到产品的静态特征和动态特征后,对平台中在售的全部产品进行层次聚类。
产品的静态特征例如可以包括产品的标题、所属的各级类目名称、品牌、原产国、季节性标签、产品针对的使用者性别、产品的价格在所处的末级类目的价格等级、适用年龄等。
产品的动态特征可以包括从一个用户对产品的访问数据中提取的特征,例如一个用户在过去的一个或多个历史阶段访问产品详情页的次数、该用户访问产品评论页的次数、该用户分享产品详情页给微信好友的次数、该用户查看产品详情页中产品详情模块的次数、该用户从搜索结果页直接到达产品详情页的次数、该用户从购物车页直接到达产品详情页的次数、该用户将产品加入购物车的次数、或者该用户收藏产品的次数等。或者,产品的动态特征还可以包括从大量用户访问该产品而形成的统计数据特征,例如在过去的一个或多个历史阶段中对该产品的购买人数、购买订单数、购买个数、平均实付单价、或者平均折扣率等。
图3示意的聚类结果300包括3个层级仅是一种示意。在另一些实施例中,如果在线采购平台中的产品种类较多时,可以聚成4层、5层、甚至更多层。其中,最末层为聚类粒度最细的层级。
在操作S220,确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品。
该长期产品的销售时间所满足的预定条件可以根据平台的运行、或者数据总量的大小来确定。例如,在一个实施例中,可以将平台中现在在售且始售时间在两年前的产品确定为长期产品。
在一个实施例中,操作S210中进行聚类时的该至少一部分产品中包括该第一产品,从而操作S220中确定的该第一类别可以是该第一产品被聚类后所在的类别。在另一个实施例中,在操作S210中进行聚类时的该至少一部分产品中也可能不包括该第一产品。例如,第一产品为新品,在对平台中的产品进行聚类时该第一产品尚未开始销售。对于这种情况,操作S220中确定第一类别时可以提取该第一产品的特征(例如,静态特征和动态特征),然后根据该第一产品的特征将该第一产品归类到一个类别中。
该第一类别为包括长期产品的类别。根据本发明实施例,如果第一产品被归类后的类别不包含长期产品时,在层次聚类得到的类别结果中,可以通过查找该类别的父类来找到包含长期产品的类别,作为第一类别。在通过其他聚类方式得到的类别结果中,可以通过将相近类别的合并,来得到包含长期产品的类别,作为第一类别。
当然,在经过层级聚类得到的例如在图3示意的聚类结果300中,该第一类别可能不是唯一的。如果第一产品在最细粒度的分类中被归类到三级312时,并且三级类别312包含长期产品时,可以优先选择三级类别312作为第一类别;或者如果三级类别312不含长期产品,但是二级类别11中包含长期产品时,可以选择二级类别11作为该第一类别。下文为描述清晰起见,以第一类别为三级类别312为例进行描述。
在操作S230,基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数。该基本计时单位可以是小时、日、周、月份、季度或者年度等,具体根据实际分析需要来定。
根据本发明的一个实施例,所述基本计时单位被设置为月份,以及所述N个阶段被设置为N个连续的月份。例如,N取值12时,N个阶段即是连续的12个月,恰好为一年。N取24时,N个阶段就是连续的24个月,恰好为两个年度。
以平台中现在在售且始售时间在两年前的产品为长期产品,以过去的24个月为例说明长期产品的销量趋势函数的一个计算实例。
首先寻找平台中现在在售且始售时间在两年前的至少一部分产品(例如,所有产品),从而找到平台中的全部长期产品。接着,筛查聚类结果300中的各个类别中是否包含有长期产品。对于具有长期产品的类别例如可以标记为1,表征后续会针对该类别作计算。而对于不含长期产品的类别,例如可以标记为0,表征后续不会针对此类别作计算。
然后获取平台内的全部长期产品在过去的24个月(例如,可以对应两个完整年度)中按天计量的历史销量。例如,可以逐月统计前述标记为1的各个类别内的所有长期产品的月总销量,得到类别月总销量。
例如,假设聚类结果300中的三级类别312中有A、B、C和D四种产品,其中A、B、C为长期产品。三级类别312的类别月总销量为三级类别312中A、B、C三种产品各自的月总销量之和,可以通过如下等式计算:
三级类别312的类别月总销量=类别日均销*当月天数。
其中,类别日均销为A、B、C三种产品的日平均销量的总和。
在实际应用中,在计算产品的日平均销量时可以预先消除缺货和促销等随机因素对产品的销量趋势的影响。以计算A的日平均销量为例,可以以首先统计得到某个月中A的月度历史销量;其中如果该月份有缺货或者大促,则从A的月度历史销量中剔除掉A商品缺货、或者大促期间的销量,得到A的保留下来的月销量。然后,用于A的保留下来的月销量除以从该月的天数中剔除掉大促或缺货的天数后的剩余天数,这样就得到了产品A的日平均销量。
接下来计算三级类别312中的长期产品A、B、C整体的销量趋势函数。在获得了三级类别312在过去24个月逐月的类别月总销量后,可以通过趋势线拟合,获得三级类别312中的长期产品A、B、C整体的销量趋势函数。趋势线拟合是通过一条趋势线代表着时间序列数据的长期走势,可以反映出一组特定数据在一段时期内的变化趋势(例如,增长、下降或保持不变)。
在一个实施例中,可以利用线性回归来计算三级类别312中的长期产品A、B、C整体的销量趋势函数。线性回归是利用线性回归方程对一个或多个自变量和因变量之间关系进行建模的一种回归分析。例如,可以对过去两年内的24个月按时间顺序进行编号,编号为1至24,利用逐月计算得到的三级类别312的类别月总销量对月度编号做线性回归。例如得到销量趋势函数y=ax+b,其中,x为月份编号,y为三级类别312的类别月总销量。可以理解,线性回归只是一种拟合示例,为了寻找出销量与月份之间的关系。在其他实施例中,还可以使用其他拟合方法,对此不再赘述。
在操作S240,计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应。所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征。
在一个实施例中,N取24,M取12。即,可以利用过去两年的数据来拟合得到三级类别312的中的长期产品的销量趋势函数,而计算类别时间提升因子时考虑到时间的周期性,可以仅计算一年中12个月份中每个月对应的类别时间提升因子,得到参考如下表1的类别时间提升因子表。
表1
Figure BDA0002177681110000141
表1中每个阶段对应的类别时间提升因子,用于表征三级类别312中的产品的短期季节性因素指数。下文为描述清晰起见,以N取24,M取12为例进行示例性描述。
根据本发明的实施例,操作S240中所述计算所述第一类别(即,三级类别312)的M个类别时间提升因子,还可以包括当所述M个类别时间提升因子中存在不满足稳定性条件的类别时间提升因子时,获取所述不满足稳定性条件的类别时间提升因子对应的阶段,得到提升因子待定阶段;将所述第一类别312的父类中与所述提升因子待定阶段对应的满足所述稳定性条件的类别时间提升因子确定为所述第一类别312的与所述提升因子待定阶段对应的类别时间提升因子。
在一个实施例中,所述稳定性条件被设置为预定的数值范围。该预定的数值范围可以是根据业务经验设定的(例如,0.4~4)。当类别时间提升因子超过这个数值范围时,可以认为计算出的月度因子非常不稳定,在这种情况下可以从该第一类别312的父类中查找满足所述稳定性条件的类别时间提升因子。
假设计算得到的三级类别312某个月(例如,2月份)的类别时间提升因子A2=0.1,则A2<0.4,不满足稳定性条件。此时,可以查看三级类别312的父类(即,二级类别11)的2月份的类别时间提升因子是否满足稳定性条件;如果满足,则将二级类别11的2月份的类别时间提升因子的值赋给A2;如果不满足,则追溯至二级类别11的父类一级类别1的2月份的类别时间提升因子是否满足稳定性条件。如果类别结果有多个层级时,以此类推逐级追溯,直到找到满足所述稳定性条件的类别时间提升因子。
在操作S250,基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
例如,该第一产品为新品时,可以进行回归的数据量过少。在这种情况下可以认为趋势性因素对该产品在未来一段时间的销量变化的影响较小(可以认为在短期内该产品的销量不存在上升或下降的趋势性)。这样,在预测时可以根据距离当前时间点最近的S个阶段的历史销量情况计算出第一产品的当前销量水平作为参考销量,然后通过该参考销量乘以待预测阶段对应的类别时间提升因子来预测该第一产品在待预测阶段的销量。
图4示意性地示出了根据本发明一实施例的销量预测方法中操作S240计算第一类别的M个类别时间提升因子的方法流程图。
如图4所示,操作S240可以包括操作S241~操作S244。
在操作S241,统计所述长期产品的与所述M个阶段一一对应的M个阶段历史销量。例如,统计三级类别312中的长期产品A、B、C整体在过去的12个月中每个月份的历史销量(即,前述的三级类别312的类别月总销量)。
在操作S242,通过所述销量趋势函数计算所述长期产品的与所述M个阶段一一对应的M个阶段趋势销量。例如,通过销量趋势函数y=ax+b计算三级类别312中的长期产品A、B、C整体在过去的12个月中每个月份的趋势销量。
在操作S243,基于所述M个阶段历史销量与所述M个阶段趋势销量中对应于同一阶段的阶段历史销量和阶段趋势销量的比值,得到M个类别去趋势销量。例如,三级类别312在过去的12个月中每个月份的类别去趋势销量=操作S241统计得到的每个月份的历史销量/操作S242统计得到的每个月份的趋势销量。
在操作S244,对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子。归一化处理的一个实施例,可以参考图5的示意。
图5示意性地示出了根据本发明一实施例的操作S244中对M个类别去趋势销量进行归一化处理的方法流程图。
如图5所示,操作S244可以包括操作S501和操作S502。
其中,在操作S501,计算所述M个类别去趋势销量的平均值,得到类别平均去趋势销量。在操作S502,将所述M个类别去趋势销量分别除以所述类别平均去趋势销量,得到所述M个类别时间提升因子。
例如M为12,类别平均去趋势销量=最近一年12个月的类别去趋势销量之和/12;
每个月的类别时间提升因子=最近一年每个月的类别去趋势销量/类别平均去趋势销量。
图6示意性地示出了根据本发明一实施例的销量预测方法中操作S250预测销量的方法流程图。
如图6所示,根据本发明的实施例操作S250可以包括操作S251~操作S256。
首先在操作S251,计算所述距离当前最近的S个阶段的历史销量的总和。例如,假设S取值为3,计算三级类别312最近三个月的历史销量总和Total Sales。假设当前是8月份,那么最近的三个月就是5、6、7三个月。
然后在操作S252,从所述M个类别时间提升因子选择与所述S个阶段一一对应的S个类别时间提升因子。例如,可以从表1中选择出5、6、7三个月的类别时间提升因子A5、A6、A7。
接着在操作S253,计算所述S个类别时间提升因子的总和,得到所述第一产品在所述S个阶段的提升因子总和。例如计算5、6、7三个月的提升因子综合SUM(5,6,7)=A5+A6+A7。
然后在操作S254,通过所述距离当前最近的S个阶段的历史销量的总和除以所述提升因子总和,得到所述第一产品在所述距离当前最近的S个阶段中的每个阶段参考销量。例如,Reference sales=Total Sales/SUM(5,6,7)。
之后在操作S255,确定所述待预测阶段对应于M个阶段中的第一阶段,并将第一阶段对应的类别时间提升因子确定为所述待预测阶段对应的类别时间提升因子。
然后在操作S256,根据所述参考销量和所述待预测阶段对应的类别时间提升因子确定所述第一产品在所述待预测阶段的预测销量。该待预测阶段可以是M个阶段中的一个阶段、或者多个阶段。例如,该待预测阶段可以是8月份一个月,或者该待预测阶段可以是第三季度(包括了8、9、10三个月)。
若该待预测阶段是8月份一个月时,根据表1可以确定出8月份的类别时间提升因子为A8。从而在操作S256中预测8月份第一产品的销量=Reference sales*A8。
若该待预测阶段是第三季度,包括8、9、10三个月时。根据表1可以确定出8、9、10三个月的类别时间提升因子分别是A8、A9、A10。可以利用参考销量及类别时间提升因子A8、A9、A10计算出8、9、10三个月每个月的预测销量,然后再将8、9、10三个月每个月的预测销量加和得到第三季度的预测销量。
根据本发明实施例的销量预测方法,可以大幅度提升新品销量预测的准确率,一定程度上解决了新品历史销量数据不足导致的需求预测不准确的问题。从而能辅助运营合理制定销售计划,规避高库存带来的风险。
根据本发明实施例的销量预测方法,自动化实现全流程,人工干预小,极大程度地降低了制定销售计划所需的人力成本,且规避了以往根据人工经验计算产生失误所带来的风险。
根据本发明实施例的销量预测方法,可自动对所有的产品进行销量预测,从而能填补未被运营关注的产品的销量预测的空白,辅助销售计划,库存计划的科学制定。
示例性装置
在介绍了本发明示例性实施方式的方法之后,接下来,参考图7~9对本发明示例性实施方式的销量预测装置进行说明。
图7示意性地示出了根据本发明实施例的销量预测装置700的方框图。
如图7所示,该销量预测装置700可以包括聚类模块710、类别确定模块720、趋势函数获取模块730、类别时间提升因子计算模块740以及预测模块750。
聚类模块710例如可以执行操作S210,用于对至少一部分产品进行聚类,得到至少一个类别。根据本发明的一个实施例,所述聚类模块710具体可以用于基于所述至少一部分产品的静态特征和动态特征进行层次聚类,其中,所述静态特征用于描述所述至少一部分产品的静态属性,所述动态特征用于描述所述至少一部分产品在流通环节基于用户的交互行为而产生的动态属性,所述层次聚类包括具有父子关系的多级类别。
类别确定模块720例如可以执行操作S220,用于确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品。
趋势函数获取模块730例如可以执行操作S230,用于基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数。根据本发明的实施例,所述基本计时单位被设置为月份,以及所述N个阶段被设置为N个连续的月份,例如24个连续的月份。
类别时间提升因子计算模块740例如可以执行操作S240,用于计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征。例如,N=24,M=12,N个阶段可以是两年时间里的24个月,M个阶段可以是一年时间里的12个月。
预测模块750例如可以执行操作S250,用于基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
图8示意性地示出了根据本发明一实施例图7中的类别时间提升因子计算模块740的方框图。
如图8所示,该类别时间提升因子计算模块740可以包括统计子模块741、趋势销量计算子模块742、类别去趋势销量计算子模块743以及类别时间提升因子计算子模块744。
统计子模块741例如可以执行操作S241,用于统计所述长期产品的与所述M个阶段一一对应的M个阶段历史销量。
趋势销量计算子模块742例如可以执行操作S242,用于通过所述销量趋势函数计算所述长期产品的与所述M个阶段一一对应的M个阶段趋势销量;
类别去趋势销量计算子模块743例如可以执行操作S243,用于基于所述M个阶段历史销量与所述M个阶段趋势销量中对应于同一阶段的阶段历史销量和阶段趋势销量的比值,得到M个类别去趋势销量;以及
类别时间提升因子计算子模块744例如可以执行操作S244,用于对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子。根据本发明的一个实施例,所述类别时间提升因子计算子模块744具体可以执行操作S501和操作S502,用于计算所述M个类别去趋势销量的平均值,得到类别平均去趋势销量,以及将所述M个类别去趋势销量分别除以所述类别平均去趋势销量,得到所述M个类别时间提升因子。
根据本发明的另一实施例,所述类别时间提升因子计算模块740还包括追溯子模块745。追溯子模块745用于当所述M个类别时间提升因子中存在不满足稳定性条件的类别时间提升因子时,获取所述不满足稳定性条件的类别时间提升因子对应的阶段,得到提升因子待定阶段,以及将所述第一类别的父类中与所述提升因子待定阶段对应的满足所述稳定性条件的类别时间提升因子确定为所述第一类别的与所述提升因子待定阶段对应的类别时间提升因子。根据本发明的一个实施例,所述稳定性条件被设置为预定的数值范围。
图9示意性地示出了根据本发明一实施例图7中的预测模块750的方框图。
如图9所示,该预测模块750可以包括预测用销量总和计算子模块751、类别时间提升因子选择子模块752、预测用提升因子总和计算模块753、参考销量确定子模块754、待预测阶段类别时间提升因子确定模块755以及预测销量确定子模块756.
预测用销量总和计算子模块751例如可以执行操作S251,用于计算所述距离当前最近的S个阶段的历史销量的总和。
类别时间提升因子选择子模块752例如可以执行操作S252,用于从所述M个类别时间提升因子选择与所述S个阶段一一对应的S个类别时间提升因子。
预测用提升因子总和计算模块753例如可以执行操作S253,用于计算所述S个类别时间提升因子的总和,得到所述第一产品在所述S个阶段的提升因子总和。
参考销量确定子模块754例如可以执行操作S254,用于通过所述距离当前最近的S个阶段的历史销量的总和除以所述提升因子总和,得到所述第一产品在所述距离当前最近的S个阶段中的每个阶段参考销量。
待预测阶段类别时间提升因子确定模块755例如可以执行操作S255,用于确定所述待预测阶段对应于M个阶段中的第一阶段,并将第一阶段对应的类别时间提升因子确定为所述待预测阶段对应的类别时间提升因子。
预测销量确定子模块756例如可以执行操作S256,用于根据所述参考销量和所述待预测阶段对应的类别时间提升因子确定所述第一产品在所述待预测阶段的预测销量。
示例性介质
在介绍了本发明示例性实施方式的方法和装置之后,接下来,参考图10对适于实现本发明示例性实施方式的销量预测方法的介质进行介绍。
本公开的实施方式还提供了一种计算机可读存储介质,其上存储有可执行指令,所述指令在被处理器执行时使处理器执行参考图2~图6所描述的销量预测方法。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算设备上运行时,所述程序代码用于使所述计算设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的销量预测方法中的操作,例如,所述计算设备可以执行如图2中所示的操作S210,对至少一部分产品进行聚类,得到至少一个类别;操作S220,确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品;操作S230,基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数;操作S240,计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征;以及操作S250,基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图10所示,描述了适于实现根据本发明实施例的销量预测方法的程序产品1000,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言——诸如Java,C++等,还包括常规的过程式程序设计语言——诸如“C”,语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性计算设备
在介绍了本发明示例性实施方式的方法、装置和介质之后,接下来,参考图11对适于实现本发明示例性实施方式的销量预测方法的计算设备进行介绍。
本发明的实施方式还提供了一种计算设备。所述计算设备包括一个或多个存储单元、以及一个或多个处理单元。所述一个或多个存储单元存储有可执行指令。所述一个或多个处理单元执行所述可执行指令,用以实现参考图2~图6所描述的销量预测方法
本发明实施例还提供了一种计算设备。所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
在一些可能的实施方式中,根据本发明的计算设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的销量预测方法中的操作。例如,所述处理单元可以执行如图2中所示的操作S210,对至少一部分产品进行聚类,得到至少一个类别;操作S220,确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品;操作S230,基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数;操作S240,计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征;以及操作S250,基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
下面参照图11来描述适于实现根据本发明实施例的销量预测方法的计算设1100。如图11所示的计算设备1100仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,计算设备1100以通用计算设备的形式表现。计算设备1100的组件可以包括但不限于:上述至少一个处理单元1110、上述至少一个存储单元1120、连接不同***组件(包括存储单元1120和处理单元1110)的总线1130。
总线1130包括数据总线、控制总线和地址总线。
存储单元1120可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1121和/或高速缓存存储器1122,还可以进一步包括只读存储器(ROM)1123。
存储单元1120还可以包括具有一组(至少一个)程序模块1124的程序/实用工具1125,这样的程序模块1124包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备1100也可以与一个或多个外部设备1140(例如键盘、指向设备、蓝牙设备等)通信。这种通信可以通过输入/输出(I/0)接口1150进行。并且,计算设备1100还可以通过网络适配器1160与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1160通过总线1130与计算设备1100的其它模块通信。应当明白,尽管图中未示出,可以结合计算设备1100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
应当注意,尽管在上文详细描述中提及了装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种销量预测方法,包括:
对至少一部分产品进行聚类,得到至少一个类别;
确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品;
基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数;
计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征;
基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
2.根据权利要求1所述的方法,其中,所述计算所述第一类别的M个类别时间提升因子包括:
统计所述长期产品的与所述M个阶段一一对应的M个阶段历史销量;
通过所述销量趋势函数计算所述长期产品的与所述M个阶段一一对应的M个阶段趋势销量;
基于所述M个阶段历史销量与所述M个阶段趋势销量中对应于同一阶段的阶段历史销量和阶段趋势销量的比值,得到M个类别去趋势销量;以及
对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子。
3.根据权利要求2所述的方法,其中,所述对所述M个类别去趋势销量进行归一化处理,得到所述M个类别时间提升因子包括:
计算所述M个类别去趋势销量的平均值,得到类别平均去趋势销量;
将所述M个类别去趋势销量分别除以所述类别平均去趋势销量,得到所述M个类别时间提升因子。
4.根据权利要求1所述的方法,其中,所述对至少一部分产品进行聚类,得到至少一个类别包括:
基于所述至少一部分产品的静态特征和动态特征进行层次聚类,其中,所述静态特征用于描述所述至少一部分产品的静态属性,所述动态特征用于描述所述至少一部分产品在流通环节基于用户的交互行为而产生的动态属性,所述层次聚类包括具有父子关系的多级类别。
5.根据权利要求4所述的方法,其中,所述计算所述第一类别的M个类别时间提升因子还包括:
当所述M个类别时间提升因子中存在不满足稳定性条件的类别时间提升因子时,获取所述不满足稳定性条件的类别时间提升因子对应的阶段,得到提升因子待定阶段;
将所述第一类别的父类中与所述提升因子待定阶段对应的满足所述稳定性条件的类别时间提升因子确定为所述第一类别的与所述提升因子待定阶段对应的类别时间提升因子。
6.根据权利要求1所述的方法,其中,所述基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,包括:
计算所述距离当前最近的S个阶段的历史销量的总和;
从所述M个类别时间提升因子选择与所述S个阶段一一对应的S个类别时间提升因子;
计算所述S个类别时间提升因子的总和,得到所述第一产品在所述S个阶段的提升因子总和;
通过所述距离当前最近的S个阶段的历史销量的总和除以所述提升因子总和,得到所述第一产品在所述距离当前最近的S个阶段中的每个阶段参考销量;
确定所述待预测阶段对应于M个阶段中的第一阶段,并将第一阶段对应的类别时间提升因子确定为所述待预测阶段对应的类别时间提升因子;以及
根据所述参考销量和所述待预测阶段对应的类别时间提升因子确定所述第一产品在所述待预测阶段的预测销量。
7.根据权利要求1所述的方法,其中,所述基本计时单位被设置为月份,以及所述N个阶段被设置为N个连续的月份。
8.一种销量预测装置,包括:
聚类模块,用于对至少一部分产品进行聚类,得到至少一个类别;
类别确定模块,用于确定第一产品在所述至少一个类别中所属的第一类别,其中所述第一类别包括长期产品,所述长期产品为销售时间满足预定条件的一个或多个产品;
趋势函数获取模块,用于基于所述长期产品在N个阶段的历史销量变化趋势,获取所述长期产品的销量趋势函数,其中,所述N个阶段包括N个时间上相继的基本计时单位,其中,N为大于等于2的整数;
类别时间提升因子计算模块,用于计算所述第一类别的M个类别时间提升因子,其中M为小于等于N的正整数,所述M个类别时间提升因子与所述N个阶段中的M个阶段一一对应;所述M个类别时间提升因子中的每一个类别时间提升因子通过在对应阶段内所述长期产品的历史销量与利用所述销量趋势函数计算得到的趋势销量之间的对应关系来表征;
预测模块,用于基于所述第一产品在距离当前最近的S个阶段的历史销量以及待预测阶段对应的类别时间提升因子,计算所述第一产品在所述待预测阶段的预测销量,其中S为小于等于M的正整数,所述M个阶段包括所述S个阶段,所述待预测阶段为未来阶段中对应于所述M个阶段的任意一个或多个阶段。
9.一种计算设备,包括:
一个或多个存储单元,存储有可执行指令;
一个或多个处理单元,执行所述可执行指令,用以实现根据权利要求1~7任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行指令,所述指令在被处理器执行时使处理器执行根据权利要求1~7任意一项所述的方法。
CN201910787851.8A 2019-08-23 2019-08-23 销量预测方法、装置、介质和计算设备 Active CN110544118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910787851.8A CN110544118B (zh) 2019-08-23 2019-08-23 销量预测方法、装置、介质和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910787851.8A CN110544118B (zh) 2019-08-23 2019-08-23 销量预测方法、装置、介质和计算设备

Publications (2)

Publication Number Publication Date
CN110544118A CN110544118A (zh) 2019-12-06
CN110544118B true CN110544118B (zh) 2023-07-14

Family

ID=68712001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910787851.8A Active CN110544118B (zh) 2019-08-23 2019-08-23 销量预测方法、装置、介质和计算设备

Country Status (1)

Country Link
CN (1) CN110544118B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429365A (zh) * 2022-01-12 2022-05-03 北京京东振世信息技术有限公司 物品销量信息生成方法、装置、电子设备和计算机介质
CN114677174A (zh) * 2022-03-25 2022-06-28 北京京东尚科信息技术有限公司 一种计算未上架物品销量的方法和装置
CN114757700A (zh) * 2022-04-12 2022-07-15 北京京东尚科信息技术有限公司 物品销量预测模型训练方法、物品销量预测方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041121A (ja) * 2013-08-20 2015-03-02 株式会社日立製作所 販売予測システム及び販売予測方法
CN104700152A (zh) * 2014-10-22 2015-06-10 浙江中烟工业有限责任公司 一种融合季节销售信息与搜索行为信息的烟草销量预测方法
CN108133391A (zh) * 2017-12-22 2018-06-08 联想(北京)有限公司 销量预测方法以及服务器
CN108764646A (zh) * 2018-04-27 2018-11-06 车智互联(北京)科技有限公司 一种销量预测方法及计算设备
CN110135876A (zh) * 2018-02-09 2019-08-16 北京京东尚科信息技术有限公司 销量预测的方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10311455B2 (en) * 2004-07-08 2019-06-04 One Network Enterprises, Inc. Computer program product and method for sales forecasting and adjusting a sales forecast
US20080147486A1 (en) * 2006-12-18 2008-06-19 Lehigh University Prediction method and system
US20090216611A1 (en) * 2008-02-25 2009-08-27 Leonard Michael J Computer-Implemented Systems And Methods Of Product Forecasting For New Products
US20100138273A1 (en) * 2008-12-01 2010-06-03 Arash Bateni Repeatability index to enhance seasonal product forecasting
US20170278113A1 (en) * 2016-03-23 2017-09-28 Dell Products, Lp System for Forecasting Product Sales Using Clustering in Conjunction with Bayesian Modeling
US20180300738A1 (en) * 2017-03-22 2018-10-18 National Taiwan Normal University Method and system for forecasting product sales on model-free prediction basis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041121A (ja) * 2013-08-20 2015-03-02 株式会社日立製作所 販売予測システム及び販売予測方法
CN104700152A (zh) * 2014-10-22 2015-06-10 浙江中烟工业有限责任公司 一种融合季节销售信息与搜索行为信息的烟草销量预测方法
CN108133391A (zh) * 2017-12-22 2018-06-08 联想(北京)有限公司 销量预测方法以及服务器
CN110135876A (zh) * 2018-02-09 2019-08-16 北京京东尚科信息技术有限公司 销量预测的方法及装置
CN108764646A (zh) * 2018-04-27 2018-11-06 车智互联(北京)科技有限公司 一种销量预测方法及计算设备

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A clustering-based sales forecasting scheme using support vector regression for computer server;Wenseng Dai;《ScienceDirect》;全文 *
A neural clustering and classification system for sales forecasting of new apparel items;Se´bastien Thomassey;ScienceDirect;全文 *
基于R语言的煤炭产品销售预测实证研究;黄宇达;王换换;王迤冉;;计算机与数字工程(01);全文 *
基于可拓聚类的服装需求预测方法;何海洪;余军合;许立波;李兴森;;计算机应用与软件(05);全文 *
短生命周期产品的销量预测模型研究;赵学斌;李大学;谢名亮;;计算机工程与设计(11);全文 *
销售预测分析***的研究与应用;赵改平;刘丽兰;程功勋;树志松;;现代制造工程(03);全文 *

Also Published As

Publication number Publication date
CN110544118A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
Suppa mpitb: A toolbox for multidimensional poverty indices
CN110795509B (zh) 一种数据仓库的指标血缘关系图的构建方法、装置和电子设备
US10504120B2 (en) Determining a temporary transaction limit
US7475062B2 (en) Apparatus and method for selecting a subset of report templates based on specified criteria
US8631040B2 (en) Computer-implemented systems and methods for flexible definition of time intervals
CN110544118B (zh) 销量预测方法、装置、介质和计算设备
Bjeladinovic A fresh approach for hybrid SQL/NoSQL database design based on data structuredness
JP2007141247A (ja) 電子ビジネス通信におけるデータ要素の使用の追跡
CN111914282B (zh) 一种文件管理分析方法和***
CN110795478A (zh) 一种应用于金融业务的数据仓库更新方法、装置和电子设备
CN111666304A (zh) 数据处理装置、数据处理方法、存储介质与电子设备
CN110807016A (zh) 一种应用于金融业务的数据仓库构建方法、装置和电子设备
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
CN111598360A (zh) 服务策略确定方法、装置及电子设备
CN111260142B (zh) 商品指标数据预测方法、装置、存储介质及电子设备
CN111414410A (zh) 数据处理方法、装置、设备和存储介质
US8494895B1 (en) Platform maturity analysis system
CN110598108A (zh) 一种搜索词推荐方法、装置、设备及存储介质
CN111861004B (zh) 日收入产量的自动佣金预测方法、***、设备及存储介质
CN112348658A (zh) 资源分配方法、装置及电子设备
CN116820767A (zh) 一种云资源管理方法、装置、电子设备及存储介质
KR102340179B1 (ko) 머신러닝 기반 수요예측을 이용한 피킹 로케이션 보충 서비스 제공 방법
CN112256566B (zh) 一种测试案例的保鲜方法和装置
US9208224B2 (en) Business content hierarchy
CN114092265B (zh) 提高保单新业务价值确定效率的方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant