CN112884189A - 订单量预测模型的训练方法、装置以及设备 - Google Patents

订单量预测模型的训练方法、装置以及设备 Download PDF

Info

Publication number
CN112884189A
CN112884189A CN201911202706.5A CN201911202706A CN112884189A CN 112884189 A CN112884189 A CN 112884189A CN 201911202706 A CN201911202706 A CN 201911202706A CN 112884189 A CN112884189 A CN 112884189A
Authority
CN
China
Prior art keywords
order quantity
model
training
quantity prediction
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911202706.5A
Other languages
English (en)
Inventor
王飞
魏昊卿
丁宇
曾文烨
闵炎华
湛长兰
刘子恒
汤芬斯蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
SF Tech Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN201911202706.5A priority Critical patent/CN112884189A/zh
Publication of CN112884189A publication Critical patent/CN112884189A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供的订单量预测模型的训练方法、装置以及设备,可以提高订单量预测模型的精确度。其中,订单量预测模型的训练方法包括:获取用于训练模型的第一训练集以及第二训练集,其中,第一训练集包括不同业务的时序特征,第二训练集包括不同业务的运营环境特征;通过第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;通过第一订单量预测模型以及第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。

Description

订单量预测模型的训练方法、装置以及设备
技术领域
本申请涉及预测领域,具体涉及订单量预测模型的训练方法、装置以及设备。
背景技术
随着近几年电商行业的蓬勃发展,也带动了物流行业的爆发,物流的订单量增长迅速,也因此,在物流公司有限的物流资源下,订单量的预测起到一个重要的数据支持,以供物流公司部署相对应的物流资源,服务这些物流订单。
现有的物流订单的订单量预测,主要通过两种方式实现,一种是传统的人工预测的方式,基于历史的物流订单数据,以及从业经验,进行人工判断,该方式不仅人力成本大、预测效率以及预测精度也不稳定;另一种则是通过历史的物流订单数据,建立订单量预测模型,通过模型自动预测物流订单的订单量。
然而在实际应用中发现,尽管基于历史的物流订单数据建模得到的订单量预测模型可预测物流订单的订单量,可精确度较低,不能为物流公司提供有效的数据支持。
发明内容
本申请实施例提供的订单量预测模型的训练方法、装置以及设备,可以提高订单量预测模型的精确度。
第一方面,本申请实施例提供了订单量预测模型的训练方法,包括:
获取用于训练模型的第一训练集以及第二训练集,其中,第一训练集包括不同业务的时序特征,第二训练集包括不同业务的运营环境特征;
通过第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;
通过第一订单量预测模型以及第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。
在一些示例性的实施例中,方法还包括:
获取待预测订单量的目标业务的业务信息;
根据目标业务的业务信息以及第二订单量预测模型,预测目标业务的订单量。
在一些示例性的实施例中,根据目标业务的业务信息以及第二订单量预测模型,预测目标业务的订单量包括:
将目标业务的业务信息输入第一订单量预测模型;
获取第一订单量预测模型输出的初始订单量预测结果;
将初始订单量预测结果以及目标业务的业务信息输入第二订单量预测模型,预测目标业务的订单量。
在一些示例性的实施例中,目标业务为物流业务,根据目标业务的业务信息以及第二订单量预测模型,预测目标业务的订单量包括:
根据物流业务的业务信息以及第二订单量预测模型,预测物流业务在预测时间点或者预测时间段的物流件量。
在一些示例性的实施例中,通过第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型包括:
配置待训练的第一时间段;
根据第一时间段的时间长度,将第一时间段分成多个第二时间段;
分别通过多个第二时间段以及第一训练集,对第一初始模型进行训练,将训练完后的模型作为第一订单量预测模型。
在一些示例性的实施例中,通过第一订单量预测模型以及第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型包括:
依次将第一训练集中的不同时序特征输入第一订单量预测模型;
依次将第一订单量训练模型输出的第一订单量预测结果以及第二训练集中的不同运营环境特征输入第二初始模型,进行正向传播;
依次根据第二初始模型输出的第二订单量预测结果计算预测评价指标,并作为损失函数;
依次根据损失函数进行反向传播以优化模型的预测结果,直至训练完成,将训练完成后的模型作为第二订单量预测模型。
在一些示例性的实施例中,运营环境特征包括不同业务的扩展时序特征、经济条件特征、地理位置特征、天气条件特征以及电商活动特征中的至少一种。
第二方面,本申请实施例提供了订单量预测模型的训练装置,包括:
获取单元,用于获取用于训练模型的第一训练集以及第二训练集,其中,第一训练集包括不同业务的时序特征,第二训练集包括不同业务的运营环境特征;
第一训练单元,用于通过第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;
第二训练单元,用于通过第一订单量预测模型以及第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。
在一些示例性的实施例中,装置还包括预测单元,用于:
获取待预测订单量的目标业务的业务信息;
根据目标业务的业务信息以及第二订单量预测模型,预测目标业务的订单量。
在一些示例性的实施例中,预测单元,具体用于:
将目标业务的业务信息输入第一订单量预测模型;
获取第一订单量预测模型输出的初始订单量预测结果;
将初始订单量预测结果以及目标业务的业务信息输入第二订单量预测模型,预测目标业务的订单量。
在一些示例性的实施例中,目标业务为物流业务,预测单元,具体用于:
根据物流业务的业务信息以及第二订单量预测模型,预测物流业务在预测时间点或者预测时间段的物流件量。
在一些示例性的实施例中,第一训练单元,具体用于:
配置待训练的第一时间段;
根据第一时间段的时间长度,将第一时间段分成多个第二时间段;
分别通过多个第二时间段以及第一训练集,对第一初始模型进行训练,将训练完后的模型作为第一订单量预测模型。
在一些示例性的实施例中,第二训练单元,具体用于:
依次将第一训练集中的不同时序特征输入第一订单量预测模型;
依次将第一订单量训练模型输出的第一订单量预测结果以及第二训练集中的不同运营环境特征输入第二初始模型,进行正向传播;
依次根据第二初始模型输出的第二订单量预测结果计算预测评价指标,并作为损失函数;
依次根据损失函数进行反向传播以优化模型的预测结果,直至训练完成,将训练完成后的模型作为第二订单量预测模型。
在一些示例性的实施例中,运营环境特征包括不同业务的扩展时序特征、经济条件特征、地理位置特征、天气条件特征以及电商活动特征中的至少一种。
第三方面,本申请实施例还提供了一种订单量预测模型的训练设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行本申请实施例提供的任一种订单量预测模型的训练方法中的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例提供的任一种订单量预测模型的训练方法中的步骤。
从以上内容可得出,本申请实施例具有以下的有益效果:
一方面,在历史的不同业务本身的时序特征的基础上,又引入了历史的不同业务外部的运营环境特征,从而在训练订单量预测模型的过程中,可引导模型关注业务外部的运营环境特征,由此完成训练的第二订单量预测模型对于业务外部的运营环境特征具有较高的针对性,可得到精确度更高的订单量预测结果。
另一方面,先通过不同业务的时序特征训练得到第一订单量预测模型,再通过第一订单量预测模型以及业务外部的运营环境特征训练得到第二订单量预测模型,由此将模型的训练分成了两个部分,不仅便于模型的训练、提高训练效率,且两个模型还便于模型的维护以及更新。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例订单量预测模型的训练方法的一种场景示意图;
图2是本申请实施例订单量预测模型的训练装置的一种流程示意图;
图3是本申请实施例训练第一订单量预测模型的一种流程示意图;
图4是本申请实施例训练第二订单量预测模型的一种流程示意图;
图5是本申请实施例通过完成训练的订单量预测模型预测订单量的一种流程示意图;
图6是本申请实施例通过完成训练的订单量预测模型预测订单量的又一种流程示意图;
图7是本申请实施例订单量预测模型的训练装置的一种结构示意图;
图8是本申请实施例订单量预测模型的训练设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在以下的说明中,本发明的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存***中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实***置,其具有由该数据格式所定义的特定特性。但是,本发明原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本发明的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本发明的运算***、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器***、微电脑为主的***、主架构型计算机、及分布式运算环境,其中包括了任何的上述***或装置。
本发明中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。
首先,在介绍本申请实施例之前,先介绍下本申请实施例关于应用背景的相关内容。
在物流领域中关于订单量预测的相关技术中,由于其仅依赖历史物流业务的订单数据进行订单量预测模型的训练,而没有考虑历史物流业务中未出现的特殊情况,例如电商平台的特殊节日、临时店铺活动等突发条件,导致在投入实际应用时,精确度较低。
基于现有的相关技术存在的上述缺陷,本申请实施例提供了订单量预测模型的训练方法,至少在一定程度上克服现有的相关技术所存在的缺陷。
本申请实施例订单量预测模型的训练方法的执行主体可以为本申请实施例提供的订单量预测模型的训练装置,或者集成了该订单量预测模型的训练装置的服务器设备、物理主机或者用户设备(User Equipment,UE)等不同类型的订单量预测模型的训练设备,其中,订单量预测模型的训练装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(Personal DigitalAssistant,PDA)等终端设备。
该订单量预测模型的训练设备可以采用单独运行的工作方式,或者也可以采用设备集群的工作方式,如图1示出的本申请订单量预测模型的训练方法的一种场景示意图,通过应用本申请实施例提供的订单量预测模型的训练方法,在训练订单量预测模型的过程中,在历史的不同业务本身的时序特征的基础上,又引入了历史的不同业务外部的运营环境特征,可得到精确度更高的订单量预测结果,且将模型的训练分成了两个部分,不仅便于模型的训练、提高训练效率,且两个模型还便于模型的维护以及更新。
举例而言,不仅模型的训练可分成两个部分,基于两个部分的训练内容,训练模型的设备也可分成两个部分,例如可在云服务器结合不同业务本身的时序特征训练第一订单量预测模型,本地设备从云服务器下载该第一订单量预测模型,结合设备本地存储的不同业务的运营环境特征,训练第二订单量预测模型。
其中,对业务的订单量预测可用于预测物流业务在预测时间点或者预测时间段的物流件量,典型的如预测未来一周时间快递的快件量,还可以用于预测电商业务等业务在预测时间点或者预测时间段的成交量,典型的如预测某商品未来3天时间的成交量。
下面,开始介绍本申请实施例提供的订单量预测模型的训练方法。
在上述图1所示应用场景的基础上,参照图2示出的本申请实施例订单量预测模型的训练方法的一种流程示意图,该实施例提供的订单量预测模型的训练方法的训练方法,包括:
步骤S201,获取用于训练模型的第一训练集以及第二训练集,其中,第一训练集包括不同业务的时序特征,第二训练集包括不同业务的运营环境特征;
步骤S202,通过第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;
步骤S203,通过第一订单量预测模型以及第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。
在图2所示实施例提出的技术方案中,一方面,在历史的不同业务本身的时序特征的基础上,又引入了历史的不同业务外部的运营环境特征,从而在训练订单量预测模型的过程中,可引导模型关注业务外部的运营环境特征,由此完成训练的第二订单量预测模型对于业务外部的运营环境特征具有较高的针对性,可得到精确度更高的订单量预测结果。
另一方面,先通过不同业务的时序特征训练得到第一订单量预测模型,再通过第一订单量预测模型以及业务外部的运营环境特征训练得到第二订单量预测模型,由此将模型的训练分成了两个部分,不仅便于模型的训练、提高训练效率,且两个模型还便于模型的维护以及更新。
以下对图2所示实施例的各个步骤的具体实施方式进行详细阐述:
在示例性的实施例中,对于需要预测订单量的业务,可以为物流业务,对应的,不同业务的时序特征以及运营环境特征为不同物流业务的时序特征以及运营环境特征。
其中,不同业务的时序特征以及运营环境特征,是基于业务得到的,既可以是确定用于训练模型的历史业务集后,从历史业务集从提取出来的,也可以是工作人员在历史业务集的基础上确定得到的,还可以是监测公司的业务,并持续从最新的业务中提取出来的,具体在此不做限定。
时序特征为业务的订单量在至少一种时序上的特征信息,示例性的,时序为分钟、小时、营业时间、周末、季节、业务季度、公共假期或者闰年等时间点或者时间周期,业务的订单量在时序上的特征信息用于指示业务的订单量在时序上的变动,例如增长幅度、增长比例或者增长趋势等变动指数。
运营环境特征为业务的订单量在不同运营环境下的特征信息,实例性的,运营环境可以归类为扩展时序、经济条件、地理位置、天气条件、电商活动等环境条件,业务的订单量在运营环境下的特征信息用于指示业务的订单量。
扩展时序,可以理解的,为在原来历史业务的基础上人为扩展得到的时序,工作人员可以通过预测方式或者根据提前知晓的方式,配置出原时序以外的时序,或者,也可以为其他业务类别或者其他数据中存在的时序,例如图书业务中可大幅增长图书在线成交量的4月23日世界读书日、某服饰品牌的优惠产品的更新周期或者新产品的上架周期等时序;经济条件,为最低工资标准最大值、年最低工资标准最小值、年最低工资标准中位数、年最低工资标准平均数、月度百度指数、年度GDP,年度第一产业占比、年度第二产业占比、年度第一产业GDP等经济量化指标;地理位置,为国家、省份、城市、地区等行政划分区域,或者为平原、盆地、丘陵、沿海等地形,或者为高低维度、高低经度、高低海拔等地理参考因素;天气条件,为晴天、雨天、阴天、空气质量恶化、热浪、寒潮、暴雨、暴雪、冰雹、沙尘暴、飓风、***、洪水或者干旱等天气因素;电商活动,为电商平台或者线上店铺对消费者提供的活动,例如电商节日、促销节日、清仓日、秒杀、买赠或者满减等活动因素。
在示例性的实施例中,参阅图3示出的本申请实施例训练第一订单量预测模型的一种流程示意图,作为图2对应实施例步骤S202的具体实现方式,可包括如下步骤S301至步骤S303:
步骤S301,配置待训练的第一时间段;
在训练第一订单量预测模型时,可配置第一订单量预测模型可进行预测或者需要预测的时间段作为训练的目标之一,并将该时间段作为第一时间段。
第一时间段可以为小时、日、周、月、季或者年等时间单位的时间段,例如未来2周、2015年1至6月、过去1.5年。
步骤S302,根据第一时间段的时间长度,将第一时间段分成多个第二时间段;
在确定第一时间段后,可根据第一时间段所采用的时间单位,或者该时间单位次一级的时间单位,进行时间段的划分。
例如,可将2015年1至6月划分成2015年1月、2015年2月、2015年3月、2015年4月、2015年5月以及2015年6月共6个第二时间段;或者可将过去1.5年划分成过去18个月、过去17个月…过去1个月共18个第二时间段。
第一时间段划分得到的多个第二时间段,在时间长度上可以一样,也可以不一样,还是以将2015年1至6月为例,可以划分为将2015年1月、2015年2至3月以及2015年4至6月共3个第二时间段。
步骤S303,分别通过多个第二时间段以及第一训练集,对第一初始模型进行训练,将训练完后的模型作为第一订单量预测模型。
在确定第二时间段后,即可根据第二时间段的时间划分,依次从第一训练集中筛选出相对应时间段的不同业务的时序特征,并依次输入初始化的第一初始模型进行正向传播,再依次根据预设的损失函数进行反向传播,以此调整模型的参数,优化模型的预测结果,当满足损失函数或者其他目标要求时即可完成模型的训练。
应当理解的是,模型输出的订单量预测结果,不仅可包括想要预测的预测时间点或者预测时间段的订单量,还可包括该订单量的置信区间等信息。
示例性的,第一初始模型可以是Prophet模型,Prophet模型是FaceBook开源的时序框架,是一种针对时序的集成解决方案,在时序上的预测具有准确度高的特点,因此适合训练为本申请实施例中的第一订单量预测模型。其中,Prophet模型可分析各种时间序列特征(包含周期性、趋势性以及部分异常值)。在趋势方面,它支持加入变化点,实现分段线性拟合,在周期方面,使用傅里叶级数来建立周期模型。
示例性的,参阅图4示出的本申请实施例训练第二订单量预测模型的一种流程示意图,作为图2对应实施例步骤S203的具体实现方式,可包括如下步骤S401至步骤S404:
步骤S401,依次将第一训练集中的不同时序特征输入第一订单量预测模型;
在结合第一订单量预测模型以及第二训练集训练第二初始化模型时,首先,与训练第一订单量预测模型类似的,依次将第一训练集中的不同时序特征输入第一订单量预测模型,并可提取模型依次输出的第一订单量预测结果。
步骤S402,依次将第一订单量训练模型输出的第一订单量预测结果以及第二训练集中的不同运营环境特征输入第二初始模型,进行正向传播;
在得到第一订单量训练模型输出的第一订单量预测结果的同时或者之后,可将其同第二训练集中的不同运营环境特征输入第二初始模型,从输入、处理到输出进行正向传播,输出第二订单量预测结果。
步骤S403,依次根据第二初始模型输出的第二订单量预测结果计算预测评价指标,并作为损失函数;
在得到第二初始模型输出的第二订单量预测结果后,即可根据该预测结果,计算损失函数。
示例性的,可以采用指数损失函数、交叉熵损失函数、平方损失函数、均方误差损失函数等类型的损失函数。
或者,也可采用预测评价指标作为损失函数,例如对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,SMAPE),其计算公式为:
Figure BDA0002296249730000101
Figure BDA0002296249730000102
表示订单量的预测值,y表示订单量的实际值。
SMAPE越小,代表预测越准确,SMAPE越大,代表预测越不准。
值得注意的是,预测评价指标除了可作为损失函数,也可存在于模型输出的对于订单量的预测结果中。
步骤S404,依次根据损失函数进行反向传播以优化模型的预测结果,直至训练完成,将训练完成后的模型作为第二订单量预测模型。
计算损失函数后,即可基于该损失函数,进行反向传播,修正模型中的参数,进而优化模型的预测结果。
示例性的,当通过正向传播得到由任意一组第一订单量预测结果以及运营环境特征计算得到的第二订单量预测结果后,可以利用损失函数相对于每个参数的梯度来进行修正,通过不停的正向-反向传播的过程,直到模型的预测能力满足模型计算精度的预期。
示例性的,第二初始模型可以是梯度提升树(Gradient Boosting DecisionTree,GBDT)模型,GBDT算法底层基于分类决策树(Classification And Regression Tree,CRT)和函数空间的梯度降算法,除了具有树模型的可解释性强、有效处理混合类型的特征、伸缩不变性、对缺失值鲁棒等优点,还具有预测能力强、稳定性好等优势。
其中,优选的可采用LightGBM模型,LightGBM模型是一种基于GBDT的梯度Boosting框架,使用基于学习算法的决策树。LightGBM模型提出基于梯度的one-side采样(Gradient-based One-Side Sampling,GOSS)和互斥的特征捆绑(Exclusive FeatureBundling,EFB),原理上采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。LightGBM模型具有分布式、高效、高训练效率、低内存使用等特点,LightGBM模型与传统的GBDT模型在达到相同的精确度时,可以快20倍。
在示例性的实施例中,对于完成训练的订单量模型,可用于预测目标业务在预测时间点或者预测时间段内的订单量。示例性的,参阅图5示出的本申请实施例通过完成训练的订单量预测模型预测订单量的一种流程示意图,通过完成训练的订单量预测模型预测订单量可包括:
步骤S501,获取待预测订单量的目标业务的业务信息;
预测目标业务的订单量,需要先确定该目标业务的业务信息,该业务信息包括业务类型、预测时间点或者预测时间段。
此外,与模型的训练对应的,在目标业务的业务信息中,还包括目标业务的运营环境信息。
以快递业务为例,第一订单量预测模型以及第二订单量预测模型是在不同快递业务的时序特征以及运营环境特征的基础上训练得到的,而在后续将完成训练的模型投入应用时,若以预测未来一周的快递件量,可在需要输入模型的当前快递业务的业务信息中,在标识位填充“快递业务标志(Identification,ID)”以及“+7day或者+1week”标识,供业务类型以及预测时间点或者预测时间段的确认,此外,还可在标识位填充包括扩展时序、经济条件、地理位置、天气条件、电商活动等运营环境信息,例如“夏季,新产品的上架期,经济发达地区,城市中心区,晴天,秒杀”。
步骤S502,根据目标业务的业务信息以及第二订单量预测模型,预测目标业务的订单量。
将目标业务的业务信息输入第二订单量预测模型,第二订单量预测模型即可结合目标业务的时序以及运营环境两方面,对目标业务在预测时间点或者预测时间段的订单量进行预测,由于在时序的基础上又考虑到运营环境,因此本次对于目标业务订单量的预测结果具有较高的精确度。
在示例性的实施例中,还可结合第一订单量预测模型以及第二订单量预测模型,预测目标业务在预测时间点或者预测时间段的订单量,示例性的,参阅图6示出的本申请实施例通过完成训练的订单量预测模型预测订单量的又一种流程示意图,作为图5对应实施例步骤S502的具体实现方式,可包括如下步骤S601至步骤S603:
步骤S601,将目标业务的业务信息输入第一订单量预测模型;
步骤S602,获取第一订单量预测模型输出的初始订单量预测结果;
步骤S603,将初始订单量预测结果以及目标业务的业务信息输入第二订单量预测模型,预测目标业务的订单量。
示例性的,在通过第二订单量预测模型预测目标业务在预测时间点或者预测时间段的订单量时,还可先将目标业务的业务信息输入第一订单量预测模型,可以理解,第一订单量预测模型为不同业务的时序特征训练得到的模型,由此对于时序具有更高的针对性,可先通过第一订单量预测模型得到目标业务的初始订单量预测结果。
接着,再将初始订单量模型以及目标业务的业务信息输入第二订单量预测模型,第二订单量预测模型即可结合目标业务的时序以及运营环境两方面,在辅以初始订单量预测结果作微调,输出具有更高精确度的目标业务的订单量预测结果。
为便于更好的实施本申请实施例提供的订单量预测模型的训练方法,本申请实施例还提供了订单量预测模型的训练装置。
请参阅图7,图7为本申请实施例订单量预测模型的训练装置的一种结构示意图,其中该订单量预测模型的训练装置700具体可包括如下结构:
获取单元701,用于获取用于训练模型的第一训练集以及第二训练集,其中,第一训练集包括不同业务的时序特征,第二训练集包括不同业务的运营环境特征;
第一训练单元702,用于通过第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;
第二训练单元703,用于通过第一订单量预测模型以及第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。
在一些示例性的实施例中,装置还包括预测单元704,用于:
获取待预测订单量的目标业务的业务信息;
根据目标业务的业务信息以及第二订单量预测模型,预测目标业务的订单量。
在一些示例性的实施例中,预测单元704,具体用于:
将目标业务的业务信息输入第一订单量预测模型;
获取第一订单量预测模型输出的初始订单量预测结果;
将初始订单量预测结果以及目标业务的业务信息输入第二订单量预测模型,预测目标业务的订单量。
在一些示例性的实施例中,目标业务为物流业务,预测单元704,具体用于:
根据物流业务的业务信息以及第二订单量预测模型,预测物流业务在预测时间点或者预测时间段的物流件量。
在一些示例性的实施例中,第一训练单元702,具体用于:
配置待训练的第一时间段;
根据第一时间段的时间长度,将第一时间段分成多个第二时间段;
分别通过多个第二时间段以及第一训练集,对第一初始模型进行训练,将训练完后的模型作为第一订单量预测模型。
在一些示例性的实施例中,第二训练单元703,具体用于:
依次将第一训练集中的不同时序特征输入第一订单量预测模型;
依次将第一订单量训练模型输出的第一订单量预测结果以及第二训练集中的不同运营环境特征输入第二初始模型,进行正向传播;
依次根据第二初始模型输出的第二订单量预测结果计算预测评价指标,并作为损失函数;
依次根据损失函数进行反向传播以优化模型的预测结果,直至训练完成,将训练完成后的模型作为第二订单量预测模型。
在一些示例性的实施例中,运营环境特征包括不同业务的扩展时序特征、经济条件特征、地理位置特征、天气条件特征以及电商活动特征中的至少一种。
本申请实施例还提供了订单量预测模型的训练设备,参阅图8,图8示出了本申请实施例订单量预测模型的训练设备的一种结构示意图,具体的,本申请实施例提供的订单量预测模型的训练设备包括处理器801,处理器801用于执行存储器802中存储的计算机程序时实现如图2至图6对应任意实施例中订单量预测模型的训练方法的各步骤;或者,处理器801用于执行存储器802中存储的计算机程序时实现如图7对应实施例中各单元的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器802中,并由处理器801执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
订单量预测模型的训练设备可包括,但不仅限于处理器801、存储器802。本领域技术人员可以理解,示意仅仅是订单量预测模型的训练设备的示例,并不构成对订单量预测模型的训练设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如订单量预测模型的训练设备还可以包括输入输出设备、网络接入设备、总线等,处理器801、存储器802、输入输出设备以及网络接入设备等通过总线相连。
处理器801可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是订单量预测模型的训练设备的控制中心,利用各种接口和线路连接整个订单量预测模型的训练设备的各个部分。
存储器802可用于存储计算机程序和/或模块,处理器801通过运行或执行存储在存储器802内的计算机程序和/或模块,以及调用存储在存储器802内的数据,实现计算机装置的各种功能。存储器802可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据订单量预测模型的训练设备的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的订单量预测模型的训练装置、设备及其相应单元的具体工作过程,可以参考如图2至图6对应任意实施例中订单量预测模型的训练方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图2至图6对应任意实施例中订单量预测模型的训练方法中的步骤,具体操作可参考如图2至图6对应任意实施例中订单量预测模型的训练方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图2至图6对应任意实施例中订单量预测模型的训练方法中的步骤,因此,可以实现本申请如图2至图6对应任意实施例中订单量预测模型的训练方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请实施例提供的订单量预测模型的训练方法、装置、设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想;同时,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请实施例的限制。

Claims (10)

1.一种订单量预测模型的训练方法,其特征在于,包括:
获取用于训练模型的第一训练集以及第二训练集,其中,所述第一训练集包括不同业务的时序特征,所述第二训练集包括不同业务的运营环境特征;
通过所述第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;
通过所述第一订单量预测模型以及所述第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待预测订单量的目标业务的业务信息;
根据所述目标业务的业务信息以及所述第二订单量预测模型,预测所述目标业务的订单量。
3.根据权利要求2所述的方法,其特征在于,根据所述目标业务的业务信息以及所述第二订单量预测模型,预测所述目标业务的订单量包括:
将所述目标业务的业务信息输入所述第一订单量预测模型;
获取所述第一订单量预测模型输出的初始订单量预测结果;
将所述初始订单量预测结果以及所述目标业务的业务信息输入所述第二订单量预测模型,预测所述目标业务的订单量。
4.根据权利要求2所述的方法,其特征在于,所述目标业务为物流业务,所述根据所述目标业务的业务信息以及所述第二订单量预测模型,预测所述目标业务的订单量包括:
根据所述物流业务的业务信息以及所述第二订单量预测模型,预测所述物流业务在预测时间点或者预测时间段的物流件量。
5.根据权利要求1所述的方法,其特征在于,通过所述第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型包括:
配置待训练的第一时间段;
根据所述第一时间段的时间长度,将所述第一时间段分成多个第二时间段;
分别通过所述多个第二时间段以及所述第一训练集,对所述第一初始模型进行训练,将训练完后的模型作为所述第一订单量预测模型。
6.根据权利要求1所述的方法,其特征在于,所述通过所述第一订单量预测模型以及所述第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型包括:
依次将所述第一训练集中的不同时序特征输入所述第一订单量预测模型;
依次将所述第一订单量训练模型输出的第一订单量预测结果以及所述第二训练集中的不同运营环境特征输入所述第二初始模型,进行正向传播;
依次根据所述第二初始模型输出的第二订单量预测结果计算预测评价指标,并作为损失函数;
依次根据所述损失函数进行反向传播以优化模型的预测结果,直至训练完成,将训练完成后的模型作为所述第二订单量预测模型。
7.根据权利要求1所述的方法,其特征在于,所述运营环境特征包括不同业务的扩展时序特征、经济条件特征、地理位置特征、天气条件特征以及电商活动特征中的至少一种。
8.一种订单量预测模型的训练装置,其特征在于,包括:
获取单元,用于获取用于训练模型的第一训练集以及第二训练集,其中,所述第一训练集包括不同业务的时序特征,所述第二训练集包括不同业务的运营环境特征;
第一训练单元,用于通过所述第一训练集对第一初始模型进行训练,将训练完成后的模型作为第一订单量预测模型;
第二训练单元,用于通过所述第一订单量预测模型以及所述第二训练集对第二初始模型进行训练,将训练完成后的模型作为第二订单量预测模型。
9.一种订单量预测模型的训练设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的订单量预测模型的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的订单量预测模型的训练方法。
CN201911202706.5A 2019-11-29 2019-11-29 订单量预测模型的训练方法、装置以及设备 Pending CN112884189A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911202706.5A CN112884189A (zh) 2019-11-29 2019-11-29 订单量预测模型的训练方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911202706.5A CN112884189A (zh) 2019-11-29 2019-11-29 订单量预测模型的训练方法、装置以及设备

Publications (1)

Publication Number Publication Date
CN112884189A true CN112884189A (zh) 2021-06-01

Family

ID=76039063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911202706.5A Pending CN112884189A (zh) 2019-11-29 2019-11-29 订单量预测模型的训练方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN112884189A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780939A (zh) * 2021-08-26 2021-12-10 杭州拼便宜网络科技有限公司 仓储空间配置方法、装置、设备和存储介质
CN114022057A (zh) * 2022-01-06 2022-02-08 国家***邮政业安全中心 基于电商寄递业务量的产业结构分析方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130899A1 (en) * 2002-01-08 2003-07-10 Bruce Ferguson System and method for historical database training of non-linear models for use in electronic commerce
CN109117973A (zh) * 2017-06-26 2019-01-01 北京嘀嘀无限科技发展有限公司 一种网约车订单量预测方法及装置
CN109583625A (zh) * 2018-10-19 2019-04-05 顺丰科技有限公司 一种揽件量预测方法、***、设备及存储介质
CN109902861A (zh) * 2019-01-31 2019-06-18 南京航空航天大学 一种基于双层迁移学习的订单生产进度实时预测方法
CN110046788A (zh) * 2019-01-17 2019-07-23 阿里巴巴集团控股有限公司 车辆需求量预测方法及装置、车辆供给量预测方法及装置
CN110084438A (zh) * 2019-05-09 2019-08-02 上汽安吉物流股份有限公司 订单的预测方法及装置、物流***以及计算机可读介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130899A1 (en) * 2002-01-08 2003-07-10 Bruce Ferguson System and method for historical database training of non-linear models for use in electronic commerce
CN109117973A (zh) * 2017-06-26 2019-01-01 北京嘀嘀无限科技发展有限公司 一种网约车订单量预测方法及装置
CN109583625A (zh) * 2018-10-19 2019-04-05 顺丰科技有限公司 一种揽件量预测方法、***、设备及存储介质
CN110046788A (zh) * 2019-01-17 2019-07-23 阿里巴巴集团控股有限公司 车辆需求量预测方法及装置、车辆供给量预测方法及装置
CN109902861A (zh) * 2019-01-31 2019-06-18 南京航空航天大学 一种基于双层迁移学习的订单生产进度实时预测方法
CN110084438A (zh) * 2019-05-09 2019-08-02 上汽安吉物流股份有限公司 订单的预测方法及装置、物流***以及计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780939A (zh) * 2021-08-26 2021-12-10 杭州拼便宜网络科技有限公司 仓储空间配置方法、装置、设备和存储介质
CN114022057A (zh) * 2022-01-06 2022-02-08 国家***邮政业安全中心 基于电商寄递业务量的产业结构分析方法、装置及设备

Similar Documents

Publication Publication Date Title
CN109495318B (zh) 一种移动通信网络流量预测方法、装置及可读存储介质
CN110493333B (zh) 一种目标位置点的确定方法、装置、设备及存储介质
CN110956202B (zh) 基于分布式学习的图像训练方法、***、介质及智能设备
CN110046755A (zh) 调拨仓库的确定方法及设备
EP3961384A1 (en) Automatic derivation of software engineering artifact attributes from product or service development concepts
CN110162292A (zh) 语音播报方法及装置
CN112508118A (zh) 针对数据偏移的目标对象行为预测方法及其相关设备
CN112884189A (zh) 订单量预测模型的训练方法、装置以及设备
CN111353620A (zh) 构建网点件量预测模型的方法、装置、设备及存储介质
CN112288572A (zh) 业务数据处理方法及计算机设备
CN109933610A (zh) 数据处理方法、装置、计算机设备及存储介质
US10318558B2 (en) Automating weather model configurations
CN114049162A (zh) 模型训练方法、需求量预测方法、装置、设备和存储介质
CN116030617A (zh) 一种基于公路od数据进行车流量预测的方法及装置
CN107908735A (zh) 信息展示方法和装置以及计算设备
CN110413579A (zh) 基于缓存价值的图片缓存方法、设备、存储介质及装置
CN113723712B (zh) 风电功率预测方法、***、设备及介质
CN111950753A (zh) 一种景区客流预测的方法及装置
CN114092162A (zh) 推荐质量确定方法、推荐质量确定模型的训练方法及装置
CN111415075B (zh) 一种车辆调度方法及装置
CN112202585B (zh) 无线网络流量预测方法、装置及电子设备
CN116030616A (zh) 一种利用大数据进行交通量预测的方法及装置
CN112085497A (zh) 用户账户数据的处理方法及装置
CN113822609A (zh) 物流线路的生成方法、装置以及服务器
CN112836965B (zh) 压力调控方案的选取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination