CN113420902A - 件量预测模型训练方法、件量预测方法及相关设备 - Google Patents

件量预测模型训练方法、件量预测方法及相关设备 Download PDF

Info

Publication number
CN113420902A
CN113420902A CN202011431052.6A CN202011431052A CN113420902A CN 113420902 A CN113420902 A CN 113420902A CN 202011431052 A CN202011431052 A CN 202011431052A CN 113420902 A CN113420902 A CN 113420902A
Authority
CN
China
Prior art keywords
service data
prediction model
training
target
component prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011431052.6A
Other languages
English (en)
Inventor
陈玉芬
夏扬
李斯
李培吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongpu Software Co Ltd
Original Assignee
Dongpu Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongpu Software Co Ltd filed Critical Dongpu Software Co Ltd
Priority to CN202011431052.6A priority Critical patent/CN113420902A/zh
Publication of CN113420902A publication Critical patent/CN113420902A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本案涉及人工智能领域,应用于快递件量预测,提供一种件量预测模型训练方法、装置、设备及存储介质。本方法包括:获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本发明通过训练得到的件量预测模型能打通数据,方便后续统筹资源、降低成本提高效率。

Description

件量预测模型训练方法、件量预测方法及相关设备
技术领域
本发明涉及人工智能领域,应用于件量预测,尤其涉及一种件量预测模型训练方法、件量预测方法及相关设备。
背景技术
随着社会的进步和大数据的发展,人工智能越来越普遍,快递行业运作对快递件量预测需求较大,亟需搭建件量预测平台,以便于更全面、更智能地服务于总部、分拨、网点、快递员。
同时,由于现有的架构平台无法充分地利用历史数据对未来的揽派件量进行预测,无法实现统筹资源,路由规划,快递定价,个性化运营,实现智能化管理,运转效率低。
发明内容
本发明的主要目的在于通过训练得到的件量预测模型打通数据,方便后续统筹资源、降低成本提高效率。解决了无法利用对件量进行预测,实现智能化管理的技术问题。
本发明第一方面提供了一种件量预测模型训练方法,包括:
获取目标网点在特定时间段内的历史业务数据,并对所述历史业务数据进行预处理,得到原始业务数据,其中,所述特定时间段为下一个业务数据更新时间点之前的若干个数据更新周期的总和,所述原始业务数据包括:历史每日件量的实际值,所述件量为快件揽派的数量;
对所述原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型。
可选地,在本发明第一方面的第一种实现方式中,所述根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型包括:
根据所述目标周期前第一预定数量个周期的每日件量数据,构建时间序列;
判断所述时间序列是否为平稳的时间序列;
若所述时间序列为平稳的时间序列,则确定所述时间序列的自相关系数和偏相关系数;
根据所述自相关系数和所述偏相关系数,确定时间序列分析模型的阶数;
根据所述时间序列分析模型的阶数以及所述时间序列,利用所述时间序列分析模型,生成原始件量预测模型。
可选地,在本发明第一方面的第二种实现方式中,所述更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型包括:
通过所述原始件量预测模型对所述更新后的训练业务数据进行预测,确定所述原始件量预测模型的准确率及覆盖率是否达到第一预设阈值;
若否,则根据所述第一预测结果,计算模型损失值;
将所述模型损失值反向输入所述原始件量预测模型,并判断所述模型损失值是否达到预设损失值;
若否,则采用反向传播算法根据所述模型损失值更新所述原始件量预测模型的参数;
通过参数更新后的原始件量预测模型对所述更新后的训练业务数据进行处理,得到第二预测结果;
基于所述第二预测结果,重新计算所述原始件量预测模型的准确率及覆盖率;
若所述原始件量预测模型的准确率及覆盖率达到预设阈值,则确认模型收敛,并将所述参数更新后的原始件量预测模型作为最终训练得到的目标件量预测模型。
可选的,在本发明第一方面的第三种实现方式中,所述通过所述原始件量预测模型对所述更新后的训练业务数据进行预测,确定所述原始件量预测模型的准确率及覆盖率是否达到第一预设阈值包括:
根据所述更新后的训练业务数据,计算在所述目标周期前多个日期中各个日期的件量的预测值对件量的实际值的覆盖率,其中,所述更新后的训练业务数据包括:在所述目标周期前多个日期的件量的实际值;
根据在所述目标周期前多个日期中各个日期的件量的预测值和所述件量的实际值,计算采用所述原始件量预测模型进行件量预测的准确率。
本发明在第二方面提供了一种件量预测方法,包括:
获取实时业务数据;
将所述实时业务数据输入预置件量预测模型;
确定所述实时业务数据的数据类型,并根据所述数据类型确定所述实时业务数据对应的目标机构,其中,所述目标机构包括总部、分拨中心、网点及快递员;
从所述预置件量预测模型中调用与所述目标机构对应的目标件量预测子模型;
通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量预测信息。
可选的,在本发明第二方面的第一种实现方式中,在所述通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量的预测值之后,还包括:
将所述件量预测信息同步至数据平台,并生成数据报表;
对所述数据报表进行评估,获取各任务的件量预测时序信息;
结合任务时效,以时间段为单位分解所述件量预测时序信息,得到每个时段各任务的任务量;
根据评估结果分析各目标机构在各时段的任务负荷量;
根据所述每个时段各任务的任务量、各目标机构在各时段的任务负荷量及预设约束条件,生成任务排班结果并输出。
本发明第三方面提供了一种件量预测模型训练装置,包括:
第一获取模块,用于获取目标网点在特定时间段内的历史业务数据,并对所述历史业务数据进行预处理,得到原始业务数据,其中,所述特定时间段为下一个业务数据更新时间点之前的若干个数据更新周期的总和,所述原始业务数据包括:历史每日件量的实际值,所述件量为快件揽派的数量;
特征提取模块,用于对所述原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
第一生成模块,用于根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
训练模块,用于更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型。
可选地,在本发明第三方面的第一种实现方式中,所述第一生成模块具体用于:
根据所述目标周期前第一预定数量个周期的每日件量数据,构建时间序列;
判断所述时间序列是否为平稳的时间序列;
当所述时间序列为平稳的时间序列时,确定所述时间序列的自相关系数和偏相关系数;根据所述自相关系数和所述偏相关系数,确定时间序列分析模型的阶数;
根据所述时间序列分析模型的阶数以及所述时间序列,利用所述时间序列分析模型,生成原始件量预测模型。
可选的,在本发明第三方面的第二种实现方式中,所述训练模块包括:
预测单元,用于通过所述原始件量预测模型对所述更新后的训练业务数据进行预测,确定所述原始件量预测模型的准确率及覆盖率是否达到第一预设阈值;若否,则根据所述第一预测结果,计算模型损失值;
判断单元,用于将所述模型损失值反向输入所述原始件量预测模型,并判断所述模型损失值是否达到预设损失值;若否,则采用反向传播算法根据所述模型损失值更新所述原始件量预测模型的参数;
处理单元,用于通过参数更新后的原始件量预测模型对所述更新后的训练业务数据进行处理,得到第二预测结果;
计算单元,用于基于所述第二预测结果,重新计算所述原始件量预测模型的准确率及覆盖率;若所述原始件量预测模型的准确率及覆盖率达到预设阈值,则确认模型收敛,并将所述参数更新后的原始件量预测模型作为最终训练得到的目标件量预测模型。
可选的,在本发明第三方面的第三种实现方式中,所述预测单元具体用于:
根据所述更新后的训练业务数据,计算在所述目标周期前多个日期中各个日期的件量的预测值对件量的实际值的覆盖率,其中,所述更新后的训练业务数据包括:在所述目标周期前多个日期的件量的实际值;
根据在所述目标周期前多个日期中各个日期的件量的预测值和所述件量的实际值,计算采用所述原始件量预测模型进行件量预测的准确率。
本发明第四方面提供了一种件量预测装置,包括:
第二获取模块,用于获取实时业务数据;
输入模块,用于将所述实时业务数据输入预置件量预测模型;
确定模块,用于确定所述实时业务数据的数据类型,并根据所述数据类型确定所述实时业务数据对应的目标机构,其中,所述目标机构包括总部、分拨中心、网点及快递员;
调用模块,用于从所述预置件量预测模型中调用与所述目标机构对应的目标件量预测子模型;
预测模块,用于通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量预测信息。
可选的,在本发明第四方面的第一种实现方式中,所述件量预测装置还包括:
第二生成模块,用于将所述件量预测信息同步至数据平台,并生成数据报表;
评估模块,用于对所述数据报表进行评估,获取各任务的件量预测时序信息;
分解模块,用于结合任务时效,以时间段为单位分解所述件量预测时序信息,得到每个时段各任务的任务量;
分析模块,用于根据评估结果分析各目标机构在各时段的任务负荷量;
第三生成模块根据所述每个时段各任务的任务量、各目标机构在各时段的任务负荷量及预设约束条件,生成任务排班结果并输出。
本发明第五方面提供了一种计算机设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行上述的件量预测模型训练方法。
本发明的第六方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的件量预测模型训练方法。
本发明提供的技术方案中,通过获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本发明通过训练得到的件量预测模型能打通数据,方便后续统筹资源、降低成本提高效率。本方案属于人工智能领域,通过训练得到的件量预测模型能打通数据,方便后续统筹资源、降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,统筹资源,实现智能化管理。
附图说明
图1为本发明件量预测模型训练方法的第一个实施例示意图;
图2为本发明件量预测模型训练方法的第二个实施例示意图;
图3为本发明件量预测模型训练方法的第三个实施例示意图;
图4为本发明件量预测模型训练方法的第四个实施例示意图;
图5为本发明件量预测方法的一个实施例示意图;
图6为本发明件量预测模型训练装置的第一个实施例示意图;
图7为本发明件量预测模型训练装置的第二个实施例示意图;
图8为本发明件量预测装置的一个实施例示意图;
图9为本发明计算机设备的一个实施例示意图。
具体实施方式
本发明实施例涉及人工智能,提供了一种件量预测模型训练方法、件量预测方法及相关设备,本发明的技术方案中,获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本发明通过训练得到的件量预测模型能打通数据,方便后续统筹资源、降低成本提高效率。本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明件量预测模型训练方法的第一个实施例包括:
101、获取目标网点在特定时间段内的历史业务数据,并对历史业务数据进行预处理,得到原始业务数据;
本实施例中,考虑到快递公司的各个网点所处的地理位置、每天办理业务的人员流量、寄出快件的业务量、收到快件的业务量、网点大小等网点特性各不相同,因此,本申请中可以针对性的对目标网点建立件量预测模型,可以理解的是,由于各个网点的特性具有一定的差异,因此可以针对不同的网点使用件量预测模型,从而可以根据网点自身的特性对目标网点的目标周期内的快件揽派量进行预测,提高了快件揽派量预测的准确度,进而节约公司运营成本提高工作效率。
为了使得对快递公司目标网点的每日快件揽派量有可靠的数据支持,可以预先获取目标网点在希望预测的目标周期前第一预定数量个周期的每日快件揽派量数据,其中,上述第一预定数量可以为大于等于1的正整数,上述第一预定数量的具体数值可以根据实际需求和情况确定,本申请对此不作限定。上述周期可以选择为一个星期、一个月等具有一定规律的时间范围,本申请对此不作限定。在实际应用中,获取的目标网点的每日快件揽派数据中还可以包括目标网点处的每日快件揽派(每日派送快件和基础快件的总和) 量数据。
其中,每日快件揽派量数据中还可以包括但不限于以下至少之一:目标网点在目标周期前第一预定数量个周期中对应的星期、日期、当前日期的前一日是否营业、当前日期是否营业以及当前日期的下一日是否营业等数据信息。
102、对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
本实施例中,对原始业务数据进行特征提取,此处的特征提取是指文字特征提取,包括很多机器学习问题涉及自然语言处理(NLP),必然要处理文字信息。文字必须转换成可以量化的特征向量。比如,最常用的文字表示方法:词库模型(Bag-of-words model)。
词库模型是文字模型化的最常用方法。对于一个文档(document),忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文档中每个词的出现都是独立的,不依赖于其他词是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择的。词库模型可以看成是独热编码的一种扩展,它为每个单词设值一个特征值。词库模型依据是用类似单词的文章意思也差不多。词库模型可以通过有限的编码信息实现有效的文档分类和检索。
103、根据训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
本实施例中,使用时间序列分析算法进行模型训练的特点是应用过去数据,推测事物的发展趋势;使用多元线性回归进行模型训练及结果预测的特点是结合多维特征,考虑影响目标网点每日快件揽派量的多项因素,训练模型,使得预测结果更加真实可靠。因此,可以根据每日快件揽派数据,利用时间序列分析模型建立预测模型。其中时间序列分析的基本思想是根据***的有限长度的运行记录(观察数据),建立能够比较精确地反映序列中所包含的动态依存关系的数学模型。借以对***的未来进行预报。其基本原理,一是承认事物发展的延续性,应用历史数据,推测事物的发展趋势。二是考虑事物发展的随机性,任何事物发展都可能受偶然因素影响,利用统计分析中加权平均法对历史数据进行处理。
在一个实施例中,可以预先获取的目标网点在目标周期前第一预定数量个周期的每日快件揽派数据,对这些数据进行预处理和特征提取之后,随机将得到的原始训练业务数据按照一定的比例分为训练数据集和测试数据集,例如:按照4:1的比例将该些数据分为训练数据集和测试数据集,可以理解的是,具体的比例也可以根据实际情况和需求确定,本申请对此不作限定。在根据目标网点在目标周期前第一预定数量个周期的每日快件揽派数据得到训练数据集之后,可以根据训练数据集中的数据构建时间序列,即将目标网点的每日快件揽派量在不同时间上的各个数值,按时间先后顺序排列而形成时间序列,删除每日总的快件揽派量外不必要的属性值,并丢弃空缺值。
进一步的,为了确定原始数据序列中有没有随机趋势或确定趋势,因此,可以对构建的时间序列进行平稳性检测,确定是否为平稳的时间序列。平稳性检测的方法可以包括但不限于以下至少之一:绘制时序图、计算自相关系数和偏相关系数、单位根检验。在确定上述时间序列为平稳的时间序列的情况下,确定时间序列的自相关系数和偏相关系数,根据上述自相关系数PACF 和偏相关系数ACF,确定时间序列分析模型的阶数。上述时间序列分析模型可以包括但不限于以下至少之一:AR模型、MR模型、ARMA模型以及ARIMA 模型。ARMA模型是针对平稳时间序列建立的模型,而ARIMA模型是针对非平稳时间序列建模,非平稳时间序列要建立ARMA模型,首先需要经过差分转化为平稳时间序列。
其中,自相关系数可以部分的刻画一个随机过程的形式,它表明序列的邻近数据之间存在多大程度的相关性;偏自相关系数是在给定的条件下,之间的条件相关性。其相关程度用偏自相关系数度量。如果自相关是拖尾,偏相关截尾,则用AR算法;如果自相关截尾,偏相关拖尾,则用MA算法;如果自相关和偏相关都是拖尾,则用ARMA算法。具体的,AR(p)模型的偏自相关系数是p阶截尾的,即AR(p)模型的偏自相关函数PACF在p阶之后应为零;MA(q)模型的自相关系数在q阶以后是截尾的,MA(q)模型的偏自相关系数一定呈现出拖尾的衰减形式;ARMA(p,q)模型是AR(p)模型和MA(q)模型的组合模型,因此ARMA(p,q)的自相关系数是AR(p)自相关系数和MA(q) 的自相关系数的混合物,当p=0时,它具有截尾性质;当q=0时,它具有拖尾性质;当p和q都不为0,它具有拖尾性质。
可以根据时间序列的自相关系数和偏相关系数确定采用的时间序列分析模型,并确定的时间序列分析模型的阶数。从而根据时间序列分析模型的阶数以及上述时间序列,利用确定的时间序列分析模型,建立预测模型。在确定上述时间序列为不平稳的时间序列的情况下,可以对时间序列进行k阶差分运算,其中,k为使时间序列满足平稳性要求的最小差分运算次数。
104、更新训练业务数据,并将更新后的训练业务数据输入至原始件量预测模型进行迭代训练,得到目标件量预测模型。
本实施例中,将更新后的训练业务数据输入预先建立的原始件量预测模型得到预测结果后,依据预测结果,可以采用反向传播算法实现参数更新。具体过程可以包括:依据预测结果计算预测结果的准确率和覆盖率,并根据预测结果和预测结果的准确率和覆盖率,获取损失函数,计算损失函数的梯度,并依据损失函数的梯度更新原始件量预测模型的参数。由于损失函数是用于衡量原始件量预测模型得到的预测值与真实值的不一致程度的函数,损失函数越小,则表明件量预测模型的性能越好,因此,可以通过计算损失函数的梯度来优化损失函数,直至损失函数达到最小值。最后,判断损失函数是否满足预设收敛条件,若满足,则停止参数更新,得到训练后的目标件量预测模型。
本发明实施例中,首先获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本方案属于人工智能领域,通过本方案能够推动社会进步和发展,能够更充分地利用预测结果来智能排班,统筹资源,实现智能化管理。
请参阅图2,本发明件量预测模型训练方法的第二个实施例包括:
201、获取目标网点在特定时间段内的历史业务数据,并对历史业务数据进行预处理,得到原始业务数据;
202、对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
203、根据目标周期前第一预定数量个周期的每日件量数据,构建时间序列;
本实施例中,获取快递公司总部、各目标网点及分拨中心的过去1年的揽派件量数据,并对获取的历史揽派件量数据进行数据清洗、分析以及特征提取。可以对快递公司总部、各目标网点的过去1年的揽派件量数据进行数据清洗和分析,将过去1年的揽派件量数据中的重复数据清洗掉,例如:分拨中心揽派量、快递员上门派件量等,从而可以得到快递公司总部、各目标网点的过去1年中每日的快件揽派数据。
204、确定时间序列是否为平稳的时间序列;
本实施例中,使用时间序列分析算法进行模型训练的特点是应用过去数据,推测事物的发展趋势;使用多元线性回归进行模型训练及结果预测的特点是结合多维特征,考虑影响目标网点每日快件揽派量的多项因素,训练模型,使得预测结果更加真实可靠。因此,可以根据每日快件揽派数据,利用时间序列分析模型建立预测模型。其中时间序列分析的基本思想是根据***的有限长度的运行记录(观察数据),建立能够比较精确地反映序列中所包含的动态依存关系的数学模型。借以对***的未来进行预报。其基本原理,一是承认事物发展的延续性,应用历史数据,推测事物的发展趋势。二是考虑事物发展的随机性,任何事物发展都可能受偶然因素影响,利用统计分析中加权平均法对历史数据进行处理。
进一步的,为了确定原始数据序列中有没有随机趋势或确定趋势,因此,可以对构建的时间序列进行平稳性检测,确定是否为平稳的时间序列。平稳性检测的方法可以包括但不限于以下至少之一:绘制时序图、计算自相关系数和偏相关系数、单位根检验。
205、若是,则确定时间序列的自相关系数和偏相关系数;
本实施例中,在确定上述时间序列为平稳的时间序列的情况下,确定时间序列的自相关系数和偏相关系数,根据上述自相关系数PACF和偏相关系数ACF,确定时间序列分析模型的阶数。上述时间序列分析模型可以包括但不限于以下至少之一:AR模型、MR模型、ARMA模型以及ARIMA模型。 ARMA模型是针对平稳时间序列建立的模型,而ARIMA模型是针对非平稳时间序列建模,非平稳时间序列要建立ARMA模型,首先需要经过差分转化为平稳时间序列。
206、根据自相关系数和偏相关系数,确定时间序列分析模型的阶数;
本实施例中,自相关系数可以部分的刻画一个随机过程的形式,它表明序列的邻近数据之间存在多大程度的相关性;偏自相关系数是在给定的条件下,之间的条件相关性。其相关程度用偏自相关系数度量。如果自相关是拖尾,偏相关截尾,则用AR算法;如果自相关截尾,偏相关拖尾,则用MA 算法;如果自相关和偏相关都是拖尾,则用ARMA算法。具体的,AR(p)模型的偏自相关系数是p阶截尾的,即AR(p)模型的偏自相关函数PACF在p阶之后应为零;MA(q)模型的自相关系数在q阶以后是截尾的,MA(q)模型的偏自相关系数一定呈现出拖尾的衰减形式;ARMA(p,q)模型是AR(p)模型和 MA(q)模型的组合模型,因此ARMA(p,q)的自相关系数是AR(p)自相关系数和MA(q)的自相关系数的混合物,当p=0时,它具有截尾性质;当q=0时,它具有拖尾性质;当p和q都不为0,它具有拖尾性质。
可以根据时间序列的自相关系数和偏相关系数确定采用的时间序列分析模型,并确定的时间序列分析模型的阶数。从而根据时间序列分析模型的阶数以及上述时间序列,利用确定的时间序列分析模型,建立预测模型。在确定上述时间序列为不平稳的时间序列的情况下,可以对时间序列进行k阶差分运算,其中,k为使时间序列满足平稳性要求的最小差分运算次数。
207、根据时间序列分析模型的阶数以及时间序列,利用时间序列分析模型,生成原始件量预测模型;
本实施例中,可以根据时间序列的自相关系数和偏相关系数确定采用的时间序列分析模型,并确定的时间序列分析模型的阶数。从而根据时间序列分析模型的阶数以及上述时间序列,利用确定的时间序列分析模型,建立预测模型。在确定上述时间序列为不平稳的时间序列的情况下,可以对时间序列进行k阶差分运算,其中,k为使时间序列满足平稳性要求的最小差分运算次数。
在采用时间序列分析模型进行原始件量预测模型训练的过程中,如果原始件量预测模型的覆盖率以及准确率未均达到第一预设阈值,可以调整训练业务数据中训练集和测试集的比例,根据更新调整后的训练业务数据集重复上述步骤重新进行训练,得到的预测模型的覆盖率以及准确率是否达到第一预设阈值,在未均达到第一预设阈值的情况下,可以再次调整训练数据集和测试数据集的比例,并重新进行训练,直至预测模型的覆盖率以及准确率均达到第一预设阈值。其中,上述第一预设阈值可以为:覆盖率等于0.7、准确率等于0.8,具体的可以根据快递网点对快件揽派量预测的实际要求确定,本申请对此不作限定。
208、更新训练业务数据,并将更新后的训练业务数据输入至原始件量预测模型进行迭代训练,得到目标件量预测模型。
本实施例中步骤201-202、208与第一实施例中的步骤101-102、104类似,此处不再赘述。
本发明实施例中,通过获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本方案属于人工智能领域,通过训练得到的件量预测模型能打通数据,降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,统筹资源,实现智能化管理。
请参阅图3,本发明件量预测模型训练方法的第三个实施例包括:
301、获取目标网点在特定时间段内的历史业务数据,并对历史业务数据进行预处理,得到原始业务数据;
302、对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
303、根据训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
304、通过原始件量预测模型对更新后的训练业务数据进行预测,确定原始件量预测模型的准确率及覆盖率是否达到第一预设阈值;
本实施例中,获取新的历史样本数据进行预处理和特征提取之后加载至原有的训练业务数据中对训练业务数据进行更新,并将更新后的训练业务数据作为测试数据集,通过训练好的原始件量预测模型对更新后的训练业务数据中多个日期中各个日期的快件揽派量进行预测,得到快件揽派量的预测值。考虑到快递公司总部及各目标网点需要保证对外派件,即件量预测模型对快递公司总部及各目标网点每日的快件揽派量的预测应该大于等于实际的快件揽派量,因此,可以计算在目标周期前多个日期中各个日期的快件揽派量的预测值对快件揽派量的实际值的覆盖率,其中,上述覆盖率可以按照下述公式进行计算:
F[i]=Nnm(predict[i]>test[i])/N
其中,F[i]为多个日期中第i天的快件揽派量的预测值对快件揽派量的实际值的覆盖率;predict[i]为多个日期中第i天的快件揽派量的预测值;test[i] 为多个日期中第i天的快件揽派量的实际值;N为多个日期的总天数;i为大于等于1小于等于N的正整数。
可以根据在目标周期前多个日期中各个日期的快件揽派量的预测值和快件揽派量的实际值,计算采用件量预测模型进行快件揽派量预测的准确率,其中,上述准确率可以按照下述公式进行计算:
Figure RE-GDA0003204757190000101
其中,tmp[i]为多个日期中第i天的快件揽派量预测的准确率;predict[i] 为多个日期中第i天的快件揽派量的预测值;test[i]为多个日期中第i天的快件揽派量的实际值;i为大于等于1小于等于多个日期的总天数的正整数。进一步的,可以将计算得到的预测模型的覆盖率以及准确率与第一预设阈值进行对比,确定预测模型的覆盖率以及准确率是否均达到第一预设阈值。
305、若否,则根据第一预测结果,计算模型损失值;
本实施例中,根据第一预测结果,获取对应的损失函数,根据损失函数对应的损失值,计算模型损失值。其中,损失函数(loss function)或代价函数(cost function)是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。
306、将模型损失值反向输入原始件量预测模型,并判断模型损失值是否达到预设损失值;
本实施例中,将模型损失值反向输入原始件量预测模型,判断模型损失值是否达到预设损失值,根据模型损失值的大小对模型对应的参数进行更新,得到优化之后的新模型。
307、若否,则采用反向传播算法根据模型损失值更新原始件量预测模型的参数;
本实施例中,若模型损失值未达到预设的损失值,则采用反向传播算法,根据模型损失值更新对应第一序列化标注模型的对应参数。
反向传播算法是一种监督学习算法,(即BP算法)适合于多层神经元网络的一种学习算法,它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系:一个n输入m输出的BP神经网络所完成的功能是从n 维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力。
308、通过参数更新后的原始件量预测模型对更新后的训练业务数据进行处理,得到第二预测结果;
本实施例中,通过参数更新后的原始件量预测模型对更新后的训练业务数据进行处理,得到各个训练业务数据对应的第二预测结果。
得到第二预测结果后,按照梯度下降算法对原始件量预测模型进行参数更新,得到训练后的目标件量预测模型。
在本实施例中,可以通过梯度下降法来计算损失函数的梯度,确定是否需要更新目标件量预测模型中第一循环神经网络层的参数W和b、注意力层的参数Wa、以及CRF层的概率转移矩阵A=[Aij],如果目标件量预测模型包括第二循环神经网络层,则需要更新的参数还包括二循环神经网络层的参数 W和b;若需要更新第一意图角色标注模型中各个网络层的参数,则循环获取预测结果并计算损失函数,直到损失函数达到最小值。最后,当所述损失函数满足预设收敛条件时,停止参数更新,得到训练后的第一意图角色标注模型。
309、基于第二预测结果,重新计算原始件量预测模型的准确率及覆盖率;
本实施例中,根据目标周期前多个日期中各个日期的快件揽派量的预测值对快件揽派量的实际值的覆盖率,其中,上述覆盖率可以按照下述公式进行计算:
F[i]=Nnm(predict[i]>test[i])/N
其中,F[i]为多个日期中第i天的快件揽派量的预测值对快件揽派量的实际值的覆盖率;predict[i]为多个日期中第i天的快件揽派量的预测值;test[i] 为多个日期中第i天的快件揽派量的实际值;N为多个日期的总天数;i为大于等于1小于等于N的正整数。
可以根据在目标周期前多个日期中各个日期的快件揽派量的预测值和快件揽派量的实际值,计算采用件量预测模型进行快件揽派量预测的准确率,其中,上述准确率可以按照下述公式进行计算:
Figure RE-GDA0003204757190000121
其中,tmp[i]为多个日期中第i天的快件揽派量预测的准确率;predict[i] 为多个日期中第i天的快件揽派量的预测值;test[i]为多个日期中第i天的快件揽派量的实际值;i为大于等于1小于等于多个日期的总天数的正整数。
310、当原始件量预测模型的准确率及覆盖率达到预设阈值时,确认模型收敛,并将参数更新后的原始件量预测模型作为最终训练得到的目标件量预测模型。
本实施例中,当原始件量预测模型的准确率及覆盖率达到预设阈值时,确认模型收敛,并将参数更新的原始件量预测模型作为最终得到的目标件量预测模型。需要说明的是,参数的更新算法可基于实际情况进行设置,本申请对此不作具体限定,可选地,基于反向传播算法更新原始件量预测模型的参数。
收敛条件是指损失函数达到最小值,具体地,预设收敛条件可以是根据经验设定的预设次数或者预设值。也即,当模型的迭代次数达到预设次数、或者损失函数达到预设值时,停止模型的参数更新,得到训练后的目标件量预测模型。
本发明实施例中,通过获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本方案属于人工智能领域,通过训练得到的件量预测模型能打通数据,降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,统筹资源,实现智能化管理。
本实施例中步骤301-303与第一实施例中的步骤101-103类似,此处不再赘述。
请参阅图4,本发明件量预测模型训练方法的第四个实施例包括:
401、获取目标网点在特定时间段内的历史业务数据,并对历史业务数据进行预处理,得到原始业务数据;
402、对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
403、根据训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
404、根据更新后的训练业务数据,计算在目标周期前多个日期中各个日期的件量的预测值对件量的实际值的覆盖率,其中,更新后的训练业务数据包括:在目标周期前多个日期的件量的实际值;
本实施例中,考虑到多元线性回归中包括两个或两个以上的影响因素作为自变量来解释因变量的变化,因此,可以确定每日快件揽派数据的多个维度,上述每日快件揽派数据的多个维度可以为可能影响每日快件揽派数据预测的影响因素。进一步的,可以确定每日快件揽派数据各个维度与需要预测的快件揽派量之间的相关性,并将相关性值大于第二预设阈值对应的维度上的数据作为特征数据,将得到的特征数据作为自变量,将需要预测的现金需求量作为因变量,利用多元线性回归模型,建立原始件量预测模型,预测目标周期中多个日期中各个日期的件量的预测值。进一步地,计算预测值对件量的实际值的覆盖率。
405、根据在目标周期前多个日期中各个日期的件量的预测值和件量的实际值,计算采用原始件量预测模型进行件量预测的准确率;
本实施例中,为了对得到的目标件量预测模型进行评估,可以在得到目标件量预测模型之后,获取上述更新后的业务训练数据,根据更新后的业务训练数据将预测值与真实值进行对比,计算目标件量预测模型预测的覆盖率和准确率,评估指标覆盖率和准确率来评估目标件量预测模型训练的好坏。如果覆盖率和准确率达到要求,则模型适用,如果不能达到要求,则对预测模型进行调整,例如模型参数的调整,特征数据的取舍等,直至预测模型预测的覆盖率和准确率均满足要求。在得到最终的目标件量预测模型后,可以在目标件量预测模型中输入希望预测的日期的前一周目标网点的每日总快件揽派,从而可以得到希望预测的日期的总快件揽派量的预测值,将该预测值传送至目标网点,作为目标网点在希望预测的日期的总快件揽派量的参考。
406、若否,则根据第一预测结果,计算模型损失值;
407、将模型损失值反向输入原始件量预测模型,并判断模型损失值是否达到预设损失值;
408、若否,则采用反向传播算法根据模型损失值更新原始件量预测模型的参数;
409、通过参数更新后的原始件量预测模型对更新后的训练业务数据进行处理,得到第二预测结果;
410、基于第二预测结果,重新计算原始件量预测模型的准确率及覆盖率;
411、若原始件量预测模型的准确率及覆盖率达到预设阈值,则确认模型收敛,并将参数更新后的原始件量预测模型作为最终训练得到的目标件量预测模型。
本实施例中步骤406-411与第三实施例中的步骤305-310类似,步骤401-403与第一实施例中的101-103类似,此处不再赘述。
本发明实施例中,通过获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本方案属于人工智能领域,通过训练得到的件量预测模型能打通数据,降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,统筹资源,实现智能化管理。
请参阅图5,本发明件量预测方法的一个实施例包括:
501、获取实时业务数据,并将实时业务数据输入预置件量预测模型;
本实施例中,考虑到快递公司的各个目标机构(总部、分拨中心、网点、快递员)特性各不相同,因此,本申请中可以针对性的对快递公司的各个目标机构建立预测子模型,可以理解的是,由于各个目标机构的特性具有一定的差异,因此可以针对不同的目标机构使用预测模型,从而可以根据目标机构自身的特性对目标网点的快件揽派量进行预测,进而提高了快件揽派量预测的准确度。
为了使得对快递公司各个目标机构的每日快递揽派量有可靠的数据支持,可以预先获取目标网点在希望预测的目标周期前第一预定数量个周期的实时(每日快件揽派)数据,并将收集到的数据输入至预置件量预测模型。其中,上述第一预定数量可以为大于等于1的正整数,上述第一预定数量的具体数值可以根据实际需求和情况确定,本申请对此不作限定。上述周期可以选择为一个星期、一个月等具有一定规律的时间范围,本申请对此不作限定。
502、确定实时业务数据的数据类型,并根据数据类型确定实时业务数据对应的目标机构,其中,目标机构包括总部、分拨中心、网点及快递员;
本实施例中,对数据进行分析,判断数据是属于公司总部、分拨中心、派送网点或快递员个人的派送数据信息,根据判断结果确定实时业务数据的数据类型,进一步地确定与数据对应的目标机构。
503、从预置件量预测模型中调用与目标机构对应的目标件量预测子模型;
本实施例中,根据实时业务数据的数据类型,从件量预测模型中选择件量预测子模块,预测目标机构每日揽派件量。比如,获取的实时业务数据是某分拨中心每日向各个派件网点的派件数量(或某分拨中心每日从各个派件网点揽收的快件数量),将该业务数据输入至件量预测模型,根据该业务数据的数据类型,从件量预测模型中调用件量预测子模块来预测目标时间段内 (指定时间段)该分拨中心每日的快件揽派的件量。
504、通过目标件量预测子模型,对目标机构在目标周期中每日的件量进行预测,得到目标机构在预设目标周期中每日的件量预测信息;
本实施例中,件量预测模型中主要包括分别根据业务数据(对应目标机构)不同的四个目标件量预测子模型,分别是针对公司总部、分拨中心、派件网点、快递员这四个目标机构。比如,获取的实时业务数据是某派件网点每日向各个快递员分派出去的快件数量(或某派件网点每日通过各个快递员揽收的快件数量),将该业务数据输入至件量预测模型,根据该业务数据的数据类型,从件量预测模型中调用件量预测子模块来预测目标时间段内(指定时间段)该派件网点每日的快件揽派的件量。
505、将件量预测信息同步至数据平台,并生成数据报表;
本实施例中,将件量预测信息同步至数据平台进行展示,并生成数据报表。工作人员可以更充分地利用数据报表中的预测结果来智能排班,统筹资源,路由规划,快递定价,个性化运营,实现智能化管理。
506、对数据报表进行评估,获取各任务的件量预测时序信息;
本实施例中,在本实施例中,各任务的预测量信息是指通过电脑对所获取的各目标机构对应任务的任务量随时间变化的数据进行分析预测去除数据中的异常点,整合处理得到的各任务的任务量随时间变化的曲线。
最后通过某公司自由研发编程的算法,根据具体任务场景,即在某个时间段内,根据各目标机构对应任务的预测业务量,对各个目标机构进行智能排班,安排能够满足该预测业务量的一个或几个员工完成该时间段内的任务。
507、结合任务时效,以时间段为单位分解件量预测时序信息,得到每个时段各任务的任务量;
本实施例中,任务时效是指对于不同目标机构对应的任务,各任务依据各个目标机构自主制定的业务标准所规定的派送或收取时效。
比如,某派件网点收派件时效标准为,收件任务需要在客户下单后1小时内上门取件,即收件任务的任务时效为1小时;派件任务需要在出仓后2 小时内完成派送,即派送任务的任务时效为2小时,如果有客户催件的情况,派件任务需要在1小时内完成派送,即催件派送任务的任务时效为1小时。由此可见收件任务或催件派送任务的任务时效优先于派送任务,即在当前1 个小时内,应优先安排收件任务或催件派送任务,在完成收件或催件派送任务之后员工的任务量没有饱和的情况下,再为该员工安排派送任务;如果员工的任务量在当前1个小时已经饱和,则可以将派件任务安排给其他员工。
508、根据评估结果分析各目标机构在各时段的任务负荷量;
本实施例中,根据评估结果分析各个目标机构在各个时间段内的任务负荷量,比如,某分拨中心A的收派件时效标准为,每小时内分拨出去3000件快递包裹,每小时录入揽收2000件快递包裹。在完成收件或分拨派送任务之后分拨中心的任务量没有饱和的情况下,再为该分拨中心安排分拨派送任务;如果分拨中心的任务量在当前1个小时已经饱和,则可以将分拨派件任务安排给其他分拨中心。
509、根据每个时段各任务的任务量、各目标机构在各时段的任务负荷量及预设约束条件,生成任务排班结果并输出。
本实施例中,每个时段各任务的任务量是指根据业务需求对目标机构安排的对应的任务量;各目标机构在各时段的任务负荷量是指每个时间段对应目标机构可以完成工作的工作量,比如,某分拨中心A每小时内分拨出去3000 件快递包裹,每小时录入揽收2000件快递包裹。
本实施例中,根据具体目标机构对应的任务场景,即在某个时间段内,根据各任务的预测业务量,对各个目标机构进行排班,安排能够满足该预测业务量的一个或几个目标机构完成该时间段内的任务,生成排班结果并输出。
本发明实施例中,通过获取实时业务数据,并将实时业务数据输入预置件量预测模型;确定实时业务数据的数据类型,并根据数据类型确定该数据对应的目标机构;从预置件量预测模型中调用与目标机构对应的目标件量预测子模型对目标机构在目标周期中每日的件量进行预测,得到对应的件量预测信息。本方案属于人工智能领域,通过对应的件量预测信息更智能地服务于各个目标机构,方便后续统筹资源、降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,实现智能化管理。
上面对本发明实施例中件量预测模型训练方法进行了描述,下面对本发明实施例中件量预测模型训练装置进行描述,请参阅图6,本发明件量预测模型训练装置的第一个实施例包括:
第一获取模块601,用于获取目标网点在特定时间段内的历史业务数据,并对所述历史业务数据进行预处理,得到原始业务数据,其中,所述特定时间段为下一个业务数据更新时间点之前的若干个数据更新周期的总和,所述原始业务数据包括:历史每日件量的实际值,所述件量为快件揽派的数量;
特征提取模块602,用于对所述原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
第一生成模块603,用于根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
训练模块604,用于更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型。
本发明实施例中,通过获取目标网点在特定时间段内的历史业务数据,并对其进行预处理,得到原始业务数据,并对其进行预处理,得到原始业务数据;对原始业务数据进行特征提取,得到携带特征向量的训练业务数据;通过预置时间序列分析模型对训练业务数据进行训练,生成原始件量预测模型;将更新后的训练业务数据作为新的训练样本集,输入原始件量预测模型进行迭代训练,得到目标件量预测模型。本方案属于人工智能领域,通过训练得到的件量预测模型能打通数据,方便后续统筹资源、降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,统筹资源,实现智能化管理。
请参阅图7,本发明件量预测模型训练装置的第二个实施例包括:
第一获取模块601,用于获取目标网点在目标周期前第一预定数量个周期的历史业务数据,并对所述历史业务数据进行预处理,得到原始业务数据,其中,所述原始业务数据包括:历史件量的实际值,所述件量为快件揽派的数量;
特征提取模块602,用于对所述原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
生成模块603,用于根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
训练模块604,用于更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型。
可选地,所述生成模块603具体用于:
根据所述目标周期前第一预定数量个周期的每日件量数据,构建时间序列;
判断所述时间序列是否为平稳的时间序列;
当所述时间序列为平稳的时间序列时,确定所述时间序列的自相关系数和偏相关系数;根据所述自相关系数和所述偏相关系数,确定时间序列分析模型的阶数;
根据所述时间序列分析模型的阶数以及所述时间序列,利用所述时间序列分析模型,生成原始件量预测模型。
可选地,所述训练模块604包括:
预测单元6041,用于通过所述原始件量预测模型对所述更新后的训练业务数据进行预测,确定所述原始件量预测模型的准确率及覆盖率是否达到第一预设阈值;若否,则根据所述第一预测结果,计算模型损失值;
判断单元6042,用于将所述模型损失值反向输入所述原始件量预测模型,并判断所述模型损失值是否达到预设损失值;若否,则采用反向传播算法根据所述模型损失值更新所述原始件量预测模型的参数;
处理单元6043,用于通过参数更新后的原始件量预测模型对所述更新后的训练业务数据进行处理,得到第二预测结果;
计算单元6044,用于基于所述第二预测结果,重新计算所述原始件量预测模型的准确率及覆盖率;若所述原始件量预测模型的准确率及覆盖率达到预设阈值,则确认模型收敛,并将所述参数更新后的原始件量预测模型作为最终训练得到的目标件量预测模型。
可选地,所述预测单元6041具体用于:
根据所述更新后的训练业务数据,计算在所述目标周期前多个日期中各个日期的件量的预测值对件量的实际值的覆盖率,其中,所述更新后的训练业务数据包括:在所述目标周期前多个日期的件量的实际值;
根据在所述目标周期前多个日期中各个日期的件量的预测值和所述件量的实际值,计算采用所述原始件量预测模型进行件量预测的准确率。
请参阅图8,本发明件量预测装置的一个实施例包括:
第二获取模块701,用于获取实时业务数据;
输入模块702,用于将所述实时业务数据输入预置件量预测模型;
确定模块703,用于确定所述实时业务数据的数据类型,并根据所述数据类型确定所述实时业务数据对应的目标机构,其中,所述目标机构包括总部、分拨中心、网点及快递员;
调用模块704,用于从所述预置件量预测模型中调用与所述目标机构对应的目标件量预测子模型;
预测模块705,用于通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量预测信息。
可选地,所述件量预测装置还包括:
第二生成模块706,用于将所述件量预测信息同步至数据平台,并生成数据报表;
评估模块707,用于对所述数据报表进行评估,获取各任务的件量预测时序信息;
分解模块708,用于结合任务时效,以时间段为单位分解所述件量预测时序信息,得到每个时段各任务的任务量;
分析模块709,用于根据评估结果分析各目标机构在各时段的任务负荷量;
第三生成模块710,用于根据所述每个时段各任务的任务量、各目标机构在各时段的任务负荷量及预设约束条件,生成任务排班结果并输出。
本发明实施例中,通过获取实时业务数据,并将实时业务数据输入预置件量预测模型;确定实时业务数据的数据类型,并根据数据类型确定该数据对应的目标机构;从预置件量预测模型中调用与目标机构对应的目标件量预测子模型对目标机构在目标周期中每日的件量进行预测,得到对应的件量预测信息。本方案属于人工智能领域,通过对应的件量预测信息更智能地服务于各个目标机构,方便后续统筹资源、降低成本提高效率。同时,能够更充分地利用预测结果来智能排班,实现智能化管理。
上面图6、图7和图8从模块化功能实体的角度对本发明实施例中的件量预测模型训练装置和件量预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中计算机设备进行详细描述。
图9是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)810(例如,一个或一个以上处理器) 和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830 (例如一个或一个以上海量存储设备)。其中,存储器820和存储介质830 可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在计算机设备800上执行存储介质830中的一系列指令操作。
计算机设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作***831,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD 等等。本领域技术人员可以理解,图8示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述件量预测模型训练方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种件量预测模型训练方法,应用于件量预测平台,其特征在于,所述件量预测模型训练方法包括:
获取目标网点在特定时间段内的历史业务数据,并对所述历史业务数据进行预处理,得到原始业务数据,其中,所述特定时间段为下一个业务数据更新时间点之前的若干个数据更新周期的总和,所述原始业务数据包括:历史每日件量的实际值,所述件量为快件揽派的数量;
对所述原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型。
2.根据权利要求1所述的件量预测模型训练方法,其特征在于,所述根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型包括:
根据所述目标周期前第一预定数量个周期的每日件量数据,构建时间序列;
判断所述时间序列是否为平稳的时间序列;
若所述时间序列为平稳的时间序列,则确定所述时间序列的自相关系数和偏相关系数;
根据所述自相关系数和所述偏相关系数,确定时间序列分析模型的阶数;
根据所述时间序列分析模型的阶数以及所述时间序列,利用所述时间序列分析模型,生成原始件量预测模型。
3.根据权利要求1所述的件量预测模型训练方法,其特征在于,所述更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型包括:
通过所述原始件量预测模型对所述更新后的训练业务数据进行预测,确定所述原始件量预测模型的准确率及覆盖率是否达到第一预设阈值;
若否,则根据所述第一预测结果,计算模型损失值;
将所述模型损失值反向输入所述原始件量预测模型,并判断所述模型损失值是否达到预设损失值;
若否,则采用反向传播算法根据所述模型损失值更新所述原始件量预测模型的参数;
通过参数更新后的原始件量预测模型对所述更新后的训练业务数据进行处理,得到第二预测结果;
基于所述第二预测结果,重新计算所述原始件量预测模型的准确率及覆盖率;
若所述原始件量预测模型的准确率及覆盖率达到预设阈值,则确认模型收敛,并将所述参数更新后的原始件量预测模型作为最终训练得到的目标件量预测模型。
4.根据权利要求3所述的件量预测模型训练方法,其特征在于,所述通过所述原始件量预测模型对所述更新后的训练业务数据进行预测,确定所述原始件量预测模型的准确率及覆盖率是否达到第一预设阈值包括:
根据所述更新后的训练业务数据,计算在所述目标周期前多个日期中各个日期的件量的预测值对件量的实际值的覆盖率,其中,所述更新后的训练业务数据包括:在所述目标周期前多个日期的件量的实际值;
根据在所述目标周期前多个日期中各个日期的件量的预测值和所述件量的实际值,计算采用所述原始件量预测模型进行件量预测的准确率。
5.一种件量预测方法,其特征在于,所述件量预测方法包括:
获取实时业务数据,并将所述实时业务数据输入预置件量预测模型;
确定所述实时业务数据的数据类型,并根据所述数据类型确定所述实时业务数据对应的目标机构,其中,所述目标机构包括总部、分拨中心、网点及快递员;
从所述预置件量预测模型中调用与所述目标机构对应的目标件量预测子模型;
通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量预测信息。
6.根据权利要求5所述的件量预测方法,其特征在于,在所述通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量的预测值之后,还包括:
将所述件量预测信息同步至数据平台,并生成数据报表;
对所述数据报表进行评估,获取各任务的件量预测时序信息;
结合任务时效,以时间段为单位分解所述件量预测时序信息,得到每个时段各任务的任务量;
根据评估结果分析各目标机构在各时段的任务负荷量;
根据所述每个时段各任务的任务量、各目标机构在各时段的任务负荷量及预设约束条件,生成任务排班结果并输出。
7.一种件量预测模型训练装置,其特征在于,所述件量预测模型训练装置包括:
第一获取模块,用于获取目标网点在特定时间段内的历史业务数据,并对所述历史业务数据进行预处理,得到原始业务数据,其中,所述特定时间段为下一个业务数据更新时间点之前的若干个数据更新周期的总和,所述原始业务数据包括:历史每日件量的实际值,所述件量为快件揽派的数量;
特征提取模块,用于对所述原始业务数据进行特征提取,得到携带特征向量的训练业务数据;
第一生成模块,用于根据所述训练业务数据,利用预置时间序列分析模型,生成原始件量预测模型;
训练模块,用于更新所述训练业务数据,并将更新后的训练业务数据输入至所述原始件量预测模型进行迭代训练,得到目标件量预测模型。
8.一种件量预测装置,其特征在于,所述件量预测装置包括:
第二获取模块,用于获取实时业务数据;
输入模块,用于将所述实时业务数据输入预置件量预测模型;
确定模块,用于确定所述实时业务数据的数据类型,并根据所述数据类型确定所述实时业务数据对应的目标机构,其中,所述目标机构包括总部、分拨中心、网点及快递员;
调用模块,用于从所述预置件量预测模型中调用与所述目标机构对应的目标件量预测子模型;
预测模块,用于通过所述目标件量预测子模型,对所述目标机构在所述目标周期中每日的件量进行预测,得到所述目标机构在预设目标周期中每日的件量预测信息。
9.一种计算机设备,其特征在于,所述计算机设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行如权利要求1-4中任意一项所述的件量预测模型训练方法的步骤,或者,执行如权利要求5-6所述的件量预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-4中任意一项所述件量预测模型训练方法的步骤,或者,执行如权利要求5-6所述的件量预测方法的步骤。
CN202011431052.6A 2020-12-09 2020-12-09 件量预测模型训练方法、件量预测方法及相关设备 Pending CN113420902A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011431052.6A CN113420902A (zh) 2020-12-09 2020-12-09 件量预测模型训练方法、件量预测方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011431052.6A CN113420902A (zh) 2020-12-09 2020-12-09 件量预测模型训练方法、件量预测方法及相关设备

Publications (1)

Publication Number Publication Date
CN113420902A true CN113420902A (zh) 2021-09-21

Family

ID=77711699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011431052.6A Pending CN113420902A (zh) 2020-12-09 2020-12-09 件量预测模型训练方法、件量预测方法及相关设备

Country Status (1)

Country Link
CN (1) CN113420902A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579643A (zh) * 2022-05-05 2022-06-03 国家***邮政业安全中心 快递业务量预测方法、装置及电子设备
CN114819830A (zh) * 2022-04-27 2022-07-29 上海东普信息科技有限公司 网点数智化管理方法及相关装置
CN117540827A (zh) * 2024-01-08 2024-02-09 杭州吉利汽车数字科技有限公司 模型热更新方法、装置、设备及计算机可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762299B1 (en) * 2011-06-27 2014-06-24 Google Inc. Customized predictive analytical model training
CN106886846A (zh) * 2017-04-26 2017-06-23 中南大学 一种基于长短期记忆循环神经网络的银行网点备付金预测方法
CN107633254A (zh) * 2017-07-25 2018-01-26 平安科技(深圳)有限公司 建立预测模型的装置、方法及计算机可读存储介质
CN107730087A (zh) * 2017-09-20 2018-02-23 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN109978293A (zh) * 2017-12-27 2019-07-05 顺丰科技有限公司 一种多任务智能排班方法、装置、设备和存储介质
US10402733B1 (en) * 2015-06-17 2019-09-03 EMC IP Holding Company LLC Adaptive ensemble workload prediction model based on machine learning algorithms
CN110245782A (zh) * 2019-05-20 2019-09-17 中国银行股份有限公司 预测模型训练方法、装置和设备
JP2020009124A (ja) * 2018-07-06 2020-01-16 日本電信電話株式会社 時系列学習装置、時系列学習方法、時系列予測装置、時系列予測方法、及びプログラム
CN110781929A (zh) * 2019-10-12 2020-02-11 腾讯科技(深圳)有限公司 信用预测模型的训练方法、预测方法及装置、介质和设备
CN111523673A (zh) * 2019-02-01 2020-08-11 阿里巴巴集团控股有限公司 模型训练方法、装置及***
CN111754336A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种网点排班方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762299B1 (en) * 2011-06-27 2014-06-24 Google Inc. Customized predictive analytical model training
US10402733B1 (en) * 2015-06-17 2019-09-03 EMC IP Holding Company LLC Adaptive ensemble workload prediction model based on machine learning algorithms
CN106886846A (zh) * 2017-04-26 2017-06-23 中南大学 一种基于长短期记忆循环神经网络的银行网点备付金预测方法
CN107633254A (zh) * 2017-07-25 2018-01-26 平安科技(深圳)有限公司 建立预测模型的装置、方法及计算机可读存储介质
CN107730087A (zh) * 2017-09-20 2018-02-23 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN109978293A (zh) * 2017-12-27 2019-07-05 顺丰科技有限公司 一种多任务智能排班方法、装置、设备和存储介质
JP2020009124A (ja) * 2018-07-06 2020-01-16 日本電信電話株式会社 時系列学習装置、時系列学習方法、時系列予測装置、時系列予測方法、及びプログラム
CN111523673A (zh) * 2019-02-01 2020-08-11 阿里巴巴集团控股有限公司 模型训练方法、装置及***
CN110245782A (zh) * 2019-05-20 2019-09-17 中国银行股份有限公司 预测模型训练方法、装置和设备
CN110781929A (zh) * 2019-10-12 2020-02-11 腾讯科技(深圳)有限公司 信用预测模型的训练方法、预测方法及装置、介质和设备
CN111754336A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种网点排班方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819830A (zh) * 2022-04-27 2022-07-29 上海东普信息科技有限公司 网点数智化管理方法及相关装置
CN114579643A (zh) * 2022-05-05 2022-06-03 国家***邮政业安全中心 快递业务量预测方法、装置及电子设备
CN117540827A (zh) * 2024-01-08 2024-02-09 杭州吉利汽车数字科技有限公司 模型热更新方法、装置、设备及计算机可读存储介质
CN117540827B (zh) * 2024-01-08 2024-04-09 杭州吉利汽车数字科技有限公司 模型热更新方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
Song et al. Environmental performance evaluation with big data: Theories and methods
CN113420902A (zh) 件量预测模型训练方法、件量预测方法及相关设备
CN109961248B (zh) 运单投诉预测方法、装置、设备及其存储介质
CN112614011B (zh) 电力配网物资需求预测方法和装置、存储介质及电子设备
CN111260151B (zh) 多频次派件时长预测方法、装置、设备及存储介质
Popovics et al. Generic data structure and validation methodology for simulation of manufacturing systems
CN106780273A (zh) 旅客航班需求分析方法和***
Hamada et al. Neural network estimation model to optimize timing and schedule of software projects
CN110516714A (zh) 一种特征预测方法、***及引擎
Zuting et al. A synchronized strategy to minimize vehicle dispatching time: a real example of steel industry
CN110619400A (zh) 用于生成订单信息的方法和装置
CN111144677B (zh) 效率评估方法和效率评估***
US11334790B1 (en) System and method for recurrent neural networks for forecasting of consumer goods' sales and inventory
Bhulai Nearest neighbour algorithms for forecasting call arrivals in call centers
CN111435472A (zh) 件量预测方法、装置、设备及存储介质
CN106779245B (zh) 基于事件的民航需求预测方法和装置
CN112199395A (zh) 一种人工智能分析方法及***
CN104239413B (zh) 一种电网数据在线分析处理方法
CN115345551A (zh) 货量预测方法、装置、设备及存储介质
Friederich et al. Predictive Process Monitoring for Prediction of Remaining Cycle Time in Automated Manufacturing: A Case Study
CN114819653A (zh) 航空物流信息监控方法、装置、设备及存储介质
Hariharasubramanian Improving application infrastructure provisioning using resource usage predictions from cloud metric data analysis
Hadad et al. A revised method for allocating the optimum number of similar machines to operators
Patikarnmonthon et al. Production scheduling with capacity-lot size and sequence consideration
Eddins et al. Using modeling and simulation in the analysis and design of information systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination