CN111275229B - 资源模型训练方法、资源缺口预测方法、装置及电子设备 - Google Patents
资源模型训练方法、资源缺口预测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111275229B CN111275229B CN201811474770.4A CN201811474770A CN111275229B CN 111275229 B CN111275229 B CN 111275229B CN 201811474770 A CN201811474770 A CN 201811474770A CN 111275229 B CN111275229 B CN 111275229B
- Authority
- CN
- China
- Prior art keywords
- model
- resource
- trained
- taking
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 152
- 238000000034 method Methods 0.000 title claims abstract description 141
- 230000007812 deficiency Effects 0.000 claims abstract description 139
- 230000004044 response Effects 0.000 claims description 76
- 238000012360 testing method Methods 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 21
- 238000011478 gradient descent method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 9
- 230000003203 everyday effect Effects 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 230000003190 augmentative effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000002950 deficient Effects 0.000 description 4
- 230000006735 deficit Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- -1 commodities Substances 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种资源模型训练方法、资源缺口预测方法、装置及电子设备,其中,所述资源模型训练方法包括:获取一区域的训练数据,所述训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数;将所述训练数据按照设定的时间段长度分成多段子数据;根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数;将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型。通过所述资源预测模型可以预测得到资源缺乏系数据,可以使相关人员能够了解到资源供应情况。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种资源模型训练方法、资源缺口预测方法、装置及电子设备。
背景技术
在线请求、线下服务的相关服务(例如,网约车、外卖等)出现的最初诉求是更好更快地满足用户的需求。影响这一诉求的重要指标包括发送服务请求的数量与成功响应请求的数量的相关数据。而现有的多数是根据当前的数据状态分配相关服务资源,但是往往根据当前的数据。
发明内容
有鉴于此,本申请实施例的目的在于提供一种资源模型训练方法、资源缺口预测方法、装置及电子设备,能够通过得到一资源预测模型解决现有技术中存在的对一区域的资源情况不了解的问题,达到方便相关人员使用资源预测模型对一区域的资源情况进行预测的效果。
根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:
获取一区域的训练数据,所述训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数;
将所述训练数据按照设定的时间段长度分成多段子数据;
根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数,所述资源缺乏系数用于表征下单量与可供应资源数的差异;
将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型,所述资源预测模型表示出所述资源缺乏系数与所述资源使用数据中各数据之间的关系。
本申请实施例提供的资源模型训练方法,采用历史数据对模型进行训练可以得到资源缺乏系数与所述资源供应数之间的关系,与现有技术中仅仅能够对以及发生的事件才能够得到资源是否缺乏的问题,则可以在需要得知一些区域是否存在资源缺乏的情况下就能够通过资源预测模型进行预测。
在一些实施例中,所述资源使用数据还包括:响应资源请求的时间长度;所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述响应资源请求的时间长度的第一关系模型,将所述第一关系模型作为资源预测模型。
在一些实施例中,所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第一初步模型;
根据所述初步模型计算得到响应资源请求的时间长度的预测值;
将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第一初步模型作为资源预测模型。
由于响应资源请求的时间长度直接能够体现出是否满足用户的需求,通过建立响应资源请求的时间长度与资源缺乏系数的关系模型,可以根据响应资源请求的时间长度可以得到资源缺乏系数,使相关人员能够更好地通过模型了解到资源缺乏系数,从而可以有针对性的采取措施。
在一些实施例中,将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值的步骤,包括:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
在一些实施例中,所述将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数的步骤,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
在一些实施例中,所述资源使用数据还包括:资源成单率,所述资源成单率表示资源请求数与实际接收请求数的比例;所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述资源成单率的第二关系模型,将所述第二关系模型作为资源预测模型。
在一些实施例中,所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第二初步模型;
根据所述初步模型计算得到资源成单率的预测值;
将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第二初步模型作为资源预测模型。
由于资源成单率直接能够体现出是否满足用户的需求,通过建立资源成单率与资源缺乏系数的关系模型,可以根据资源成单率可以得到资源缺乏系数,使相关人员能够更好地通过模型了解到资源缺乏系数,从而可以有针对性的采取措施。
在一些实施例中,将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值的步骤,包括:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
在一些实施例中,所述将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数的步骤,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
在一些实施例中,所述待训练模型包括:线性回归模型、多项式回归模型、指数回归模型、正则项回归模型中的至少一种。
可以根据不同的城市选择不同的训练模型,另外,也可以使用多个模型的组合,可以使待训练模型的适应性更强,更好的满足不同城市区域的模型训练。
在一些实施例中,所述设定的时间段长度包括一小时,所述将所述训练数据按照设定的时间段长度分成多段子数据的步骤,包括:
将所述训练数据中每天对应小时时间段的数据形成一子数据,形成二十四组子数据;
所述将每段所述子数据及该段所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型的步骤,包括:
将所述二十四组子数据及每组所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到二十四个的资源预测模型。
由于每个小时的资源的需求不一样,例如,在网约车领域,上下班时间点需要的网约车资源相对比较多,例如,在外卖领域,就餐时间段需要的外卖资源相对比较多,因此,每个小时对应训练一个模型可以使模型能够更好地适应每个小时的资源预测。
在一些实施例中,所述获取一区域的训练数据的步骤,包括:
获取一城市的训练数据;或者,
获取限定区域内的训练数据;或者,
获取携带的属性相同的区域的训练数据,所述属性包括:地理位置属性、居住人群类型。
由于不同的城市,或者设定区域,再或者属性不同的区域所需要的资源量也是不同的,因此针对合适的区域进行训练得到局部区域的订单,可以更好地对局部区域中的资源需求进行预估。在需要预测哪个区域时,在对该区域进行训练预测,从而有针对性的预测可以使训练得到的资源预测模型更有针对性。
根据本申请的另一方面,本申请实施例还提供一种资源缺口预测方法,包括:
将一目标区域中的历史数据输入订单量预测模型中对待预测时间段的订单量进行预测,得到订单预测量;
将所述订单预测量输入上述的资源模型训练方法训练得到的资源预测模型进行计算,得到所述目标区域的资源缺乏系数,所述资源缺乏系数用于表征下单量与可供应资源数的差异;
根据所述资源缺乏系数和所述订单预测量计算所述目标区域的资源缺口,所述资源缺口表示该目标区域需要增加的资源数量。
本申请实施例提供的资源缺口预测方法,通过资源预测模型进行预测,得到目标区域可能的资源缺乏系数,以进一步地得到资源缺口,方便为目标区域补充合适量的资源,不造成浪费,也能更好地满足资源请求。
根据本申请的另一方面,本申请实施例还提供一种资源模型训练装置,包括:
获取模块,用于获取一区域的训练数据,所述训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数;
划分模块,用于将所述训练数据按照设定的时间段长度分成多段子数据;
计算模块,用于根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数,所述资源缺乏系数用于表征下单量与可供应资源数的差异;
训练模块,用于将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型。
在一些实施例中,所述资源使用数据还包括:响应资源请求的时间长度;所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述响应资源请求的时间长度的第一关系模型,将所述第一关系模型作为资源预测模型。
在一些实施例中,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第一初步模型;
根据所述初步模型计算得到响应资源请求的时间长度的预测值;
将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第一初步模型作为资源预测模型。
在一些实施例中,所述训练模块,还用于:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
在一些实施例中,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
在一些实施例中,所述资源使用数据还包括:资源成单率,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述资源成单率的第二关系模型,将所述第二关系模型作为资源预测模型。
在一些实施例中,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第二初步模型;
根据所述初步模型计算得到资源成单率的预测值;
将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第二初步模型作为资源预测模型。
在一些实施例中,所述训练模块,还用于:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
在一些实施例中,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
在一些实施例中,所述待训练模型包括:线性回归模型、多项式回归模型、指数回归模型、正则项回归模型中的至少一种。
在一些实施例中,所述划分模块,用于:
将所述训练数据中每天对应小时时间段的数据形成一子数据,形成二十四组子数据;
所述训练模块,还用于:
将所述二十四组子数据及每组所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到二十四个的资源预测模型。
在一些实施例中,所述获取模块,还用于:
获取一城市的训练数据;或者,
获取限定区域内的训练数据;或者,
获取携带的属性相同的区域的训练数据,所述属性包括:地理位置属性、居住人群类型。
根据本申请的另一方面,本申请实施例还提供一种资源缺口预测装置,包括:
预测模块,用于将一目标区域中的历史数据输入订单量预测模型中对待预测时间段的订单量进行预测,得到订单预测量;
第一计算模块,用于将所述订单预测量输入上述的资源模型训练方法训练得到的资源预测模型进行计算,得到所述目标区域的资源缺乏系数;
第二计算模块,用于根据所述资源缺乏系数和所述订单预测量计算所述目标区域的资源缺口,所述资源缺口表示该目标区域需要增加的资源数量。
根据本申请的另一方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述的资源模型训练方法或资源缺口预测方法,或方法中任一种可能的实施方式中资源模型训练方法或资源缺口预测方法的步骤。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种资源处理***的结构框图;
图2示出了本申请实施例所提供的一种电子设备的结构示意图
图3示出了本申请实施例所提供的一种资源模型训练方法的流程图;
图4示出了本申请实施例所提供的一个实例中的一城市的资源状况散点示意图;
图5示出了本申请实施例所提供的一个实例中的一城市的另一资源状况散点示意图;
图6示出了本申请实施例所提供的一种资源缺口预测方法的流程图;
图7示出了本申请实施例所提供的一种资源模型训练装置的结构示意图;
图8示出了本申请实施例所提供的一种资源缺口预测装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
对于网上请求,线下服务(例如,网约车)的业务急速发展,上述的服务的出现可以让生活更方便,即更好更快地满足用户的各类需求。下面以网约车为例来进行描述,发明人研究发现:衡量网上请求,线下服务的美好需求满足情况的一个重要指标是呼叫订单的平台成单率(成交订单数/呼叫订单数),另一个重要指标是单均应答时长(从乘客下单到有司机接单的时间间隔)。减少平台呼单而没有成单群体的人数,让平台成单率维持在一个较高且稳定的状态,或者让订单的单均应答时长保持在一个较短的时间区间内,对提升网约车用户的叫车体验,提高网约车用户的留存,是非常必要的。
其中,平台成单率主要与呼叫订单数、接单司机数两个因素有关,并且随着城市和时刻的变化而变化。单均应答时长也有类似的规律。某一时刻的乘客多、司机少,不能很好满足乘客的出行需求;反之,某一时刻司机多、乘客少时,对于运力资源是一种浪费。
因此,在保证平台成单率或单均应答时长处于一个稳定区间的前提下,合理地调配运力资源,使得司机运力既不缺乏也不冗余,具有重要的现实意义。
针对上述问题,本发明基于各城市各小时历史相关数据,拟合测算成单率、单均应答时长、司机缺乏系数等指标间分城市分小时的量化关系,预测出各城市未来某时刻需要的合理司机数,从而可以有效解决叫车需求与司机运力分布不均的问题,进一步提升线上运营的准确性以及司机运力调度的效率。
具体地,发明人通过实验证明,各城市各时刻的成单率,与呼单量、应答司机数之间没有明显的量化关系,而是与司机缺乏系数有较好的量化关系。司机缺乏系数可以通过以下表达式见下述公式:
司机缺乏系数=统计时刻呼单量/统计时刻应答司机数。
基于上述研究,本申请提供多个实施例可以针对上述的研究提供有效的解决方案,具体描述如下。
实施例一
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车相关数据的处理进行描述,但是应该理解,这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如,本申请可以应用于不同的运输***环境,包括陆地,海洋,或航空等,或其任意组合。运输***的交通工具可以包括出租车、私家车、顺风车、公共汽车、火车、子弹头列车、高速铁路、地铁、船只、飞机、宇宙飞船、热气球、或无人驾驶车辆等,或其任意组合。本申请还可以包括用于可以提供资源的任何服务***,例如,用于发送和/或接收快递的***、用于买卖双方交易的服务***。本申请的***或方法的应用可以包括网页、浏览器的插件、客户端终端、定制***、内部分析***、或人工智能机器人等,或其任意组合。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”、“请求方”、“服务人员”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”、“资源”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是乘客、驾驶员、操作员等,或其任意组合。在本申请中,“乘客”和“乘客终端”可以互换使用,“驾驶员”和“驾驶员终端”可以互换使用。
本申请中的术语“服务请求”和“订单”和“资源请求”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。
本申请中使用的定位技术可以基于全球定位***(Global Positioning System,GPS)、全球导航卫星***(Global Navigation Satellite System,GLONASS),罗盘导航***(COMPASS)、伽利略定位***、准天顶卫星***(Quasi-Zenith Satellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位***可以在本申请中互换使用。
图1是本申请一些实施例的资源处理***100的框图。例如,资源处理***100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。资源处理***100可以包括服务器110、网络120、服务请求方终端130、服务提供方终端140和数据库150中的一种或多种,服务器110中可以包括执行指令操作的处理器。
在一些实施例中,服务器110可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器110可以是分布式***)。在一些实施例中,服务器110相对于终端,可以是本地的、也可以是远程的。例如,服务器110可以经由网络120访问存储在服务请求方终端130、服务提供方终端140、或数据库150、或其任意组合中的信息和/或数据。作为另一示例,服务器110可以直接连接到服务请求方终端130、服务提供方终端140和数据库150中至少一个,以访问存储的信息和/或数据。在一些实施例中,服务器110可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等,或者它们的任意组合。在一些实施例中,服务器110可以在具有本申请中图2所示的一个或多个组件的电子设备200上实现。
在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务请求方终端130获得的服务请求来确定目标车辆。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、专用指令集处理器(Application Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
网络120可以用于信息和/或数据的交换。在一些实施例中,资源处理***100中的一个或多个组件(例如,服务器110,服务请求方终端130,服务提供方终端140和数据库150)可以向其他组件发送信息和/或数据。例如,服务器110可以经由网络120从服务请求方终端130获取服务请求。在一些实施例中,网络120可以是任何类型的有线或者无线网络,或者是他们的结合。仅作为示例,网络120可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched TelephoneNetwork,PSTN)、蓝牙网络、ZigBee网络、或近场通信(Near Field Communication,NFC)网络等,或其任意组合。在一些实施例中,网络120可以包括一个或多个网络接入点。例如,网络120可以包括有线或无线网络接入点,例如基站和/或网络交换节点,资源处理***100的一个或多个组件可以通过该接入点连接到网络120以交换数据和/或信息。
在一些实施例中,服务请求方终端130的用户可以是除服务实际需求者之外的其他人。例如,服务请求方终端130的用户A可以使用服务请求方终端130来为服务实际需求者B发起服务请求(比如,用户A可以为自己的朋友B叫车),或者从服务器110接收服务信息或指令等。在一些实施例中,服务提供方终端140的用户可以是服务实际提供者,也可以是除服务实际提供者之外的其他人。例如,服务提供方终端140的用户C可以使用服务提供方终端140接收由服务实际提供者D提供服务的服务请求(比如用户C可以为自己雇用的司机D接单),和/或来自服务器110的信息或指令。在一些实施例中,“服务请求方”和“服务请求方终端”可以互换使用,“服务提供方”和“服务提供方终端”可以互换使用。
在一些实施例中,服务请求方终端130可以包括移动设备、平板计算机、膝上型计算机、或机动车辆中的内置设备等,或其任意组合。在一些实施例中,移动设备可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,或其任意组合。在一些实施例中,智能家居设备可以包括智能照明设备、智能电器设备的控制设备、智能监控设备、智能电视、智能摄像机、或对讲机等,或其任意组合。在一些实施例中,可穿戴设备可包括智能手环、智能鞋带、智能玻璃、智能头盔、智能手表、智能服装、智能背包、智能配件等、或其任何组合。在一些实施例中,智能移动设备可以包括智能手机、个人数字助理(PersonalDigital Assistant,PDA)、游戏设备、导航设备、或销售点(point of sale,POS)设备等,或其任意组合。在一些实施例中,虚拟现实设备和/或增强现实设备可以包括虚拟现实头盔、虚拟现实玻璃、虚拟现实贴片、增强现实头盔、增强现实玻璃、或增强现实贴片等,或其任意组合。例如,虚拟现实设备和/或增强现实设备可以包括各种虚拟现实产品等。在一些实施例中,机动车辆中的内置设备可以包括车载计算机、车载电视等。在一些实施例中,服务请求方终端130可以是具有用于定位服务请求方和/或服务请求方终端的位置的定位技术的设备。
在一些实施例中,服务提供方终端140可以是与服务请求方终端130类似或相同的设备。在一些实施例中,服务提供方终端140可以是具有定位技术的设备,用于定位服务提供方和/或服务提供方终端的位置。在一些实施例中,服务请求方终端130和/或服务提供方终端140可以与其他定位设备通信以确定服务请求方、服务请求方终端130、服务提供方、或服务提供方终端140、或其任意组合的位置。在一些实施例中,服务请求方终端130和/或服务提供方终端140可以将定位信息发送给服务器110。
数据库150可以存储数据和/或指令。在一些实施例中,数据库150可以存储从服务请求方终端130和/或服务提供方终端140获得的数据。在一些实施例中,数据库150可以存储在本申请中描述的示例性方法的数据和/或指令。在一些实施例中,数据库150可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory,ROM)等,或其任意组合。作为举例,大容量存储器可以包括磁盘、光盘、固态驱动器等;可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等;易失性读写存储器可以包括随机存取存储器(Random Access Memory,RAM);RAM可以包括动态RAM(Dynamic RandomAccess Memory,DRAM),双倍数据速率同步动态RAM(Double Date-Rate Synchronous RAM,DDR SDRAM);静态RAM(Static Random-Access Memory,SRAM),晶闸管RAM(Thyristor-Based Random Access Memory,T-RAM)和零电容器RAM(Zero-RAM)等。作为举例,ROM可以包括掩模ROM(Mask Read-Only Memory,MROM)、可编程ROM(Programmable Read-OnlyMemory,PROM)、可擦除可编程ROM(Programmable Erasable Read-only Memory,PEROM)、电可擦除可编程ROM(Electrically Erasable Programmable read only memory,EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。在一些实施例中,数据库150可以在云平台上实现。仅作为示例,云平台可以包括私有云、公有云、混合云、社区云、分布式云、跨云、多云或者其它类似的等,或其任意组合。
在一些实施例中,数据库150可以连接到网络120以与资源处理***100(例如,服务器110,服务请求方终端130,服务提供方终端140等)中的一个或多个组件通信。资源处理***100中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到资源处理***100中的一个或多个组件(例如,服务器110,服务请求方终端130,服务提供方终端140等);或者,在一些实施例中,数据库150也可以是服务器110的一部分。
在一些实施例中,资源处理***100中的一个或多个组件(例如,服务器110,服务请求方终端130,服务提供方终端140等)可以具有访问数据库150的权限。在一些实施例中,当满足一定条件时,资源处理***100中的一个或多个组件可以读取和/或修改与服务请求方、服务提供方、或公众、或其任意组合有关的信息。例如,服务器110可以在接收服务请求之后读取和/或修改一个或多个用户的信息。作为另一示例,服务提供方终端140可以在从服务请求方终端130接收服务请求时访问与服务请求方有关的信息,但是服务提供方终端140可以不修改服务请求方的相关信息。
在一些实施例中,可以通过请求服务来实现资源处理***100中的一个或多个组件的信息交换。服务请求的对象可以是任何产品。在一些实施方案中,产品可以是有形产品或非物质产品。有形产品可包括食品、药品、商品、化学产品、电器、服装、汽车、房屋、或奢侈品等,或其任意组合。非物质产品可以包括服务产品、金融产品、知识产品、或互联网产品等,或其任意组合。互联网产品可以包括单独的主机产品、网络产品、移动互联网产品、商业主机产品、或嵌入式产品等,或其任意组合。互联网产品可以用在移动终端的软件、程序、或***等,或者它们的任意组合中。移动终端可以包括平板电脑、笔记本电脑、移动电话、个人数字助理(Personal Digital Assistant,PDA)、智能手表、销售点(Point of sales,POS)设备、车载电脑、车载电视、或可穿戴设备等,或其任意组合。例如,互联网产品可以是计算机或移动电话中使用的任何软件和/或应用程序。软件和/或应用程序可以涉及社交、购物、运输、娱乐时间、学习、或投资等,或其任意组合。在一些实施例中,与运输有关的软件和/或应用程序可以包括旅行软件和/或应用程序、车辆调度软件和/或应用程序、绘图软件和/或应用程序等。在车辆调度软件和/或应用程序中,车辆可包括马、马车、人力车(例如,独轮车、自行车、三轮车等)、汽车(例如,出租车、公共汽车、私家车等)、火车、地铁、船只、飞机(例如,飞机、直升机、航天飞机、火箭、热气球等)等,或其任意组合。
图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110、服务请求方终端130、服务提供方终端140的电子设备200的示例性硬件和软件组件的示意图。例如,处理器可以用于电子设备200上,并且用于执行本申请中的功能。
电子设备200可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的资源模型训练方法或资源缺口预测方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的存储介质240,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备200还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口250。
为了便于说明,在电子设备200中仅描述了一个处理器。然而,应当注意,本申请中的电子设备200还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备200的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
下面以网约车所在的场景为例对下面的方法实施例和装置实施例进行详细描述,可以知道的是,网约车仅仅为一个示例性的描述,并不多本申请造成任何限制。
实施例二
本实施例提供一种资源模型训练方法。本实施例中的方法可以由图1所示的服务器110执行,也可以由与上述的数据库150通信连接的一设备执行。图3示出了本申请一个实施例中的资源模型训练方法的流程图。下面对图3所示的资源模型训练方法的流程进行详细描述。
步骤S301,获取一区域的训练数据。
上述的训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数。
上述的第一时间段可以是当前时间之前的三个月、五个月、一年等时间段。
在一种实施方式中,上述的获取一区域的训练数据,可以被实现为:获取一城市的训练数据。例如,可以获取上海市的训练数据。则可以获取上海市中的在第一时间段中的所有网约车相关数据,其中,包括:下单数、成交数、司机数等。
在另一种实施方式中,上述的获取一区域的训练数据,可以被实现为:获取限定区域内的训练数据。上述的限定区域可以是一个城市的主城区,如,杭州的上城区、下城区、西湖区等;或者是多个距离较近的城市,例如,杭州、上海、南京等。
在另一种实施方式中,上述的获取一区域的训练数据,可以被实现为:获取携带的属性相同的区域的训练数据,所述属性包括:地理位置属性、居住人群类型。地理位置属性可以包括南方的一线城市,例如,上海、广州、深圳等。居住人群类型可以包括民族类型、工作性质类型等,例如,少数民族聚居区域、上班族聚居区域等。
以网约车为例,对数据的存储进行说明:分城市分时刻(小时,按发单时间)采集呼单量、应答司机数、成单率指标数据,将其作为训练样本。由于需要统计每个城市约近半年的数据,数据量庞大,明细数据来自平台离线分布式文件***(Hive)。分布式采集后,可以按时间/城市分区,三个指标写入HDFS(Hadoop Distributed File System,中文称:分布式文件***)进行分布式存储。
步骤S302,将所述训练数据按照设定的时间段长度分成多段子数据。
上述的设定的时间段长度包括一小时,步骤S302:将所述训练数据中每天对应小时时间段的数据形成一子数据,形成二十四组子数据。
具体地,可以将每天的00:00-00:59的数据作为第一组子数据,将每天的01:00-01:59的数据作为第二组子数据,以此类推,将每天的23:00-23:59的数据作为第二十四组子数据。
步骤S303,根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数。
上述的资源缺乏系数可以表示下单量与可供应资源数的比值。
在一个实例中,资源请求数可用M表示,资源供应数用N表示,则资源缺乏系数可以表示为:M/N。在网约车中,资源请求数可表示呼单量,也就是乘客下单数量;资源供应数可表示应答司机数,也就是司机接单数。
上述的步骤S302可以将训练数据分成二十四组子数据,则可以计算出二十四组子数据对应的资源缺乏系数。
步骤S304,将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型。
资源预测模型可以用于表示出所述资源缺乏系数与所述资源供应数之间的关系。
上述的待训练模型包括:线性回归模型、多项式回归模型、指数回归模型、正则项回归模型中的至少一种。
例如,如果历史数据中的资源缺乏系数与资源供应数之间呈现线性关系,则可以选择线性回归模型作为待训练模型。
在选择待训练模型时,可以先根据该区域中的历史数据描绘出散点图。比如,以北京5月份订单数据为例,如图4所示,司机缺乏系数与成单率的分时刻散点图。图4中示出了司机缺乏系数与成单率之间的关系的示意图,其中分别包括了二十四组小图,每个小图分别表示一小时时间段中的司机缺乏系数与成单率之间关系。如图5所示,司机缺乏系数与单均应答时长的时刻散点图。图5中示出了司机缺乏系数与单均应答时长之间的关系的示意图,其中分别包括了二十四组小图,每个小图分别表示一小时时间段中的司机缺乏系数与单均应答时长之间关系。图4和图5可以看出,每个时刻对应的小图单独来看,司机缺乏系数与单均应答时长之间,以及司机缺乏系数与单均应答时长之间,分别具有较好的线性。
步骤S304可以被实现为:将所述二十四组子数据及每组所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到二十四个的资源预测模型。
在其它实现方式中,也可以将训练数据分成十二组、八组、五组等。例如,可以将训练数据按照每天相邻两小时为一类,分成十二组。再例如,可以将训练数据按照每天相邻三小时为一类,分成八组。再例如,可以将训练数据按照每天的早上上班时间段7:00-9:30为一组,中午11:00-13:30为一组,下午下班时间段17:00-19:30为一组,凌晨时间段23:00-5:00为一组,其它时间段为一组,分成五组。
通过对每一组子数据代入待训练模型中进行训练可以得到一个资源预测模型,每个资源预测模型可以用于对对应时间段中的资源数据情况进行预测。
由于与资源缺乏系数相关的因素主要有资源成单率和响应资源请求的时间长度,下面分别针对这两个方面以网约车为例进行详细描述。
在一种实施方式中,对于每个城市,分别拟合各小时单均应答时长(此处设为Y)与司机缺乏系数(此处设为内X)的量化模型,拟合过程可以表现为回归问题,该量化模型为机器学习模型。该量化模型可能涉及到线性回归、多项式拟合、指数拟合等方法,且为回归模型,训练样本可以不存在标签。在一个实例中,对于一天中的二十四个小时,针对每个小时分别训练一个模型,总共训练二十四个模型。
上述的资源使用数据还包括:响应资源请求的时间长度;步骤S304可以被实现为:将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述响应资源请求的时间长度的第一关系模型,将所述第一关系模型作为资源预测模型。
进一步地,步骤S304可以被实现为:
a.将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第一初步模型;
b.根据所述初步模型计算得到响应资源请求的时间长度的预测值;
c.将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤a、b、c,直到所述损失值小于设定值,损失值小于设定值时对应的第一初步模型作为资源预测模型。
上述的设定值可以是按照需要设置的一个较小的值,例如,可以是0.03、0.06、0.1、0.01等。当然也可以是其它合适的较小的值。
第二时间段最近一周、最近两周等时间段。则测试数据可以表示为训练数据所在区域中的最近一周或最近两周等时间段的资源使用数据。
上述的步骤c可以被实现为:将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
具体地,可以通过以下公式计算得到:
损失函数使用平方损失函数,基于损失函数不断回传调优模型的网络参数:
L(Y1,f(X))=(Y1-f(X))2;
其中,Y1表示响应资源请求的时间长度;f(X)中的参数为未知参数时表示待训练模型;f(X)中的参数经过训练确定位具体的值时表示资源预测模型;X表示资源缺乏系数。
进一步地,在测试数据中,对应的经验损失最小问题可以表示为(均方误差):
通过将经验损失最小,可以使用训练得到的模型能够更好地适应资源预测的需求。
上述的步骤a可以通过以下任意一种方式实现:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
在另一种实施方式中,对于每个城市,分别拟合各小时成单率(此处设为Y)与司机缺乏系数(此处设为X)的量化模型,拟合过程本质上是个回归问题,该量化模型为机器学习模型,该模型涉及到线性回归、多项式拟合、指数拟合等方法,且为回归模型,训练样本可以不存在标签。对于一天中的二十四个小时,针对每个小时分别训练一个模型,总共可以训练二十四个模型。
上述资源使用数据还包括:资源成单率,步骤S304可以被实现为:将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述资源成单率的第二关系模型,将所述第二关系模型作为资源预测模型。
进一步地,步骤S304可以被实现为:
d.将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第二初步模型;
e.根据所述初步模型计算得到资源成单率的预测值;
f.将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤d、e、f,直到所述损失值小于设定值,损失值小于设定值时对应的第二初步模型作为资源预测模型。
上述的设定值可以是按照需要设置的一个较小的值,例如,可以是0.03、0.06、0.1、0.01等。当然也可以是其它合适的较小的值。
第二时间段最近一周、最近两周等时间段。则测试数据可以表示为训练数据所在区域中的最近一周或最近两周等时间段的资源使用数据。
上述的步骤c可以被实现为:将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
具体地,可以通过以下公式计算得到:
损失函数使用平方损失函数,基于损失函数不断回传调优模型的网络参数:
L(Y2,f(X))=(Y2-f(X))2;
其中,Y2表示响应资源请求的时间长度;f(X)中的参数为未知参数时表示待训练模型;f(X)中的参数经过训练确定位具体的值时表示资源预测模型;X表示资源缺乏系数。
上述的步骤d可以通过以下任意一种方式实现:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
本申请实施例提供的资源模型训练方法,采用历史数据对模型进行训练可以得到资源缺乏系数与所述资源供应数之间的关系,与现有技术中仅仅能够对以及发生的事件才能够得到资源是否缺乏的问题,则可以在需要得知一些区域是否存在资源缺乏的情况下就能够通过资源预测模型进行预测。
实施例三
本实施例提供一种资源缺口预测方法。本实施例中的方法可以由图1所示的服务器110、服务提供端140执行,也可以由与上述的数据库150通信连接的一设备执行。图6示出了本申请一个实施例中的资源缺口预测方法的流程图。下面对图6所示的资源缺口预测方法的流程进行详细描述。
步骤S401,将一目标区域中的历史数据输入订单量预测模型中对待预测时间段的订单量进行预测,得到订单预测量。
步骤S402,将所述订单预测量输入资源预测模型进行计算,得到所述目标区域的资源缺乏系数。
步骤S403,根据所述资源缺乏系数和所述订单预测量计算所述目标区域的资源缺口。
上述的资源缺口表示该目标区域需要增加的资源数量。
在一种情况下,对于以成单率为运营目的的运力预测:
根据成单率运营目标、成单率与司机缺乏系数的量化模型(上述的第二关系模型),可以得到目标司机缺乏系数。再根据目标司机缺乏系数、预测的下单量、和司机缺乏系数与下单量的关系公式,可以得到目标应答司机数;根据目标应答司机数和当前运力情况可以得到运力缺口。
具体地,第一关系模型输入:成单率运营目标值、城市id、要预测的时刻(比如12点)、平台预测出的未来某时刻(如12点)的下单量、当前运力情况(实际应答司机数)。
目前,已经有相关文献可以实现根据历史数据预测出将来时间段的下单量,具体可以包括:hot-winters三次指数平滑法、自回归积分滑动平均模型(ARIMA,全称:autoregression integration moving average)等方式预测出某地区未来某时刻的下单量。
第一关系模型输出:预测时刻的运力缺口,即预测的时刻(比如12点)要增加的司机数(若返回0或负值,说明当前运力饱和或存在冗余)。
举例说明:比如,当前时刻为11点,要预测12点时北京地区的合理接单司机数,则需要将城市id(北京)、要预测的时刻(12点)、平台预测出的未来某时刻(12点)的下单量(比如15万单)、当前运力情况(11点的实际应答司机数)、以及成单率运营目标值(比如要完成80%的成单率),利用上述的资源预测模型可以获得预测时刻要增加的司机数。
在另一种情况下,对于以单均应答时长为运营目的的运力预测:
根据单均应答时长运营目标、单均应答时长与司机缺乏系数的量化模型,可以得到目标司机缺乏系数;再根据目标司机缺乏系数、预测的下单量、和司机缺乏系数与下单量的关系公式,可以得到目标应答司机数;根据目标应答司机数和当前运力情况可以得到运力缺口。
第二关系模型输入:单均应答时长运营目标值、城市id、要预测的时刻(比如12点)、平台预测出的未来某时刻(比如12点)的下单量、当前运力情况(实际应答司机数)。
第二关系模型输出:预测时刻的运力缺口,即预测的时刻(比如12点)要增加的司机数(若返回0或负值,说明当前运力饱和或存在冗余)。
本申请实施例提供的资源缺口预测方法,通过资源预测模型进行预测,得到目标区域可能的资源缺乏系数,以进一步地得到资源缺口,方便为目标区域补充合适量的资源,不造成浪费,也能更好地满足资源请求。
实施例四
基于同一申请构思,本申请实施例中还提供了与资源模型训练方法对应的资源模型训练装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述资源模型训练方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
图7是示出本申请的一些实施例的资源模型训练装置的框图,该资源模型训练装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图所示,资源模型训练装置可以包括:获取模块501、划分模块502、计算模块503、训练模块504,其中,
获取模块501,用于获取一区域的训练数据,所述训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数;
划分模块502,用于将所述训练数据按照设定的时间段长度分成多段子数据;
计算模块503,用于根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数;
训练模块504,用于将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型,所述资源预测模型表示出所述资源缺乏系数与所述资源使用数据中各数据之间的关系。
上述的资源使用数据还包括:响应资源请求的时间长度;所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述响应资源请求的时间长度的第一关系模型,将所述第一关系模型作为资源预测模型。
其中,训练模块504,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第一初步模型;
根据所述初步模型计算得到响应资源请求的时间长度的预测值;
将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第一初步模型作为资源预测模型。
其中,训练模块504,还用于:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
进一步地,训练模块504,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
上述的资源使用数据还包括:资源成单率;进一步地,训练模块504,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述资源成单率的第二关系模型,将所述第二关系模型作为资源预测模型。
其中,训练模块504,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第二初步模型;
根据所述初步模型计算得到资源成单率的预测值;
将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第二初步模型作为资源预测模型。
上述的训练模块504,还用于:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
上述的训练模块504,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
上述的待训练模型可以包括:线性回归模型、多项式回归模型、指数回归模型、正则项回归模型中的至少一种。
上述的划分模块502,还用于:
将所述训练数据中每天对应小时时间段的数据形成一子数据,形成二十四组子数据;
所述训练模块504,还用于:
将所述二十四组子数据及每组所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到二十四个的资源预测模型。
上述的获取模块501,还用于:
获取一城市的训练数据;或者,
获取限定区域内的训练数据;或者,
获取携带的属性相同的区域的训练数据,所述属性包括:地理位置属性、居住人群类型。
上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
实施例五
基于同一申请构思,本申请实施例中还提供了与资源缺口预测方法对应的资源缺口预测装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述资源缺口预测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
图8是示出本申请的一些实施例的资源缺口预测装置的框图,该资源缺口预测装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图所示,资源缺口预测装置可以包括:预测模块601、第一计算模块602及第二计算模块603,其中,
预测模块601,用于将一目标区域中的历史数据输入订单量预测模型中对待预测时间段的订单量进行预测,得到订单预测量;
第一计算模块602,用于将所述订单预测量输入上述的资源模型训练方法训练得到的资源预测模型进行计算,得到所述目标区域的资源缺乏系数;
第二计算模块603,用于根据所述资源缺乏系数和所述订单预测量计算所述目标区域的资源缺口,所述资源缺口表示该目标区域需要增加的资源数量。
上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
此外,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的资源模型训练方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的资源缺口预测方法的步骤。
本申请实施例所提供的资源模型训练方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的资源模型训练方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本申请实施例所提供的资源缺口预测方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的资源缺口预测方法的步骤,具体可参见上述方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (28)
1.一种资源模型训练方法,其特征在于,包括:
获取一区域的训练数据,所述训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数;
将所述训练数据按照设定的时间段长度分成多段子数据;
根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数,所述资源缺乏系数用于表征下单量与可供应资源数的差异;
将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型,所述资源预测模型表示出所述资源缺乏系数与所述资源使用数据中各数据之间的关系。
2.如权利要求1所述的方法,其特征在于,所述资源使用数据还包括:响应资源请求的时间长度;所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述响应资源请求的时间长度的第一关系模型,将所述第一关系模型作为资源预测模型。
3.如权利要求2所述的方法,其特征在于,所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第一初步模型;
根据所述初步模型计算得到响应资源请求的时间长度的预测值;
将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第一初步模型作为资源预测模型。
4.如权利要求3所述的方法,其特征在于,将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值的步骤,包括:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
5.如权利要求3所述的方法,其特征在于,所述将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数的步骤,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
6.如权利要求1所述的方法,其特征在于,所述资源使用数据还包括:资源成单率,所述资源成单率表示资源请求数与实际接收请求数的比例;所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述资源成单率的第二关系模型,将所述第二关系模型作为资源预测模型。
7.如权利要求6所述的方法,其特征在于,所述将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第二初步模型;
根据所述初步模型计算得到资源成单率的预测值;
将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第二初步模型作为资源预测模型。
8.如权利要求7所述的方法,其特征在于,将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值的步骤,包括:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
9.如权利要求8所述的方法,其特征在于,所述将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数的步骤,包括:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
10.如权利要求1-9任意一项所述的方法,其特征在于,所述待训练模型包括:线性回归模型、多项式回归模型、指数回归模型、正则项回归模型中的至少一种。
11.如权利要求1-9任意一项所述的方法,其特征在于,所述设定的时间段长度包括一小时,所述将所述训练数据按照设定的时间段长度分成多段子数据的步骤,包括:
将所述训练数据中每天对应小时时间段的数据形成一子数据,形成二十四组子数据;
所述将每段所述子数据及该段所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型的步骤,包括:
将所述二十四组子数据及每组所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到二十四个的资源预测模型。
12.如权利要求1-9任意一项所述的方法,其特征在于,所述获取一区域的训练数据的步骤,包括:
获取一城市的训练数据;或者,
获取限定区域内的训练数据;或者,
获取携带的属性相同的区域的训练数据,所述属性包括:地理位置属性、居住人群类型。
13.一种资源缺口预测方法,其特征在于,包括:
将一目标区域中的历史数据输入订单量预测模型中对待预测时间段的订单量进行预测,得到订单预测量;
将所述订单预测量输入权利要求1-12任意一项所述的资源模型训练方法训练得到的资源预测模型进行计算,得到所述目标区域的资源缺乏系数;
根据所述资源缺乏系数和所述订单预测量计算所述目标区域的资源缺口,所述资源缺口表示该目标区域需要增加的资源数量。
14.一种资源模型训练装置,其特征在于,包括:
获取模块,用于获取一区域的训练数据,所述训练数据包括当前时间之前的第一时间段的资源使用数据,所述资源使用数据包括:资源供应数、资源请求数;
划分模块,用于将所述训练数据按照设定的时间段长度分成多段子数据;
计算模块,用于根据所述资源供应数及所述资源请求数计算得到每段子数据对应的资源缺乏系数,所述资源缺乏系数用于表征下单量与可供应资源数的差异;
训练模块,用于将每段所述子数据对应的资源缺乏系数分别输入待训练模型中调整所述待训练模型中的参数,得到所述时间段长度对应的每个时间段的资源预测模型,所述资源预测模型表示出所述资源缺乏系数与所述资源使用数据中各数据之间的关系。
15.如权利要求14所述的装置,其特征在于,所述资源使用数据还包括:响应资源请求的时间长度;所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述响应资源请求的时间长度的第一关系模型,将所述第一关系模型作为资源预测模型。
16.如权利要求15所述的装置,其特征在于,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第一初步模型;
根据所述初步模型计算得到响应资源请求的时间长度的预测值;
将所述响应资源请求的时间长度的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第一初步模型作为资源预测模型。
17.如权利要求16所述的装置,其特征在于,所述训练模块,还用于:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
18.如权利要求16所述的装置,其特征在于,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述响应资源请求的时间长度作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
19.如权利要求14所述的装置,其特征在于,所述资源使用数据还包括:资源成单率,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,调整所述待训练模型中的参数,经过多次循环调整所述待训练模型中的参数;训练得到资源缺乏系数与所述资源成单率的第二关系模型,将所述第二关系模型作为资源预测模型。
20.如权利要求19所述的装置,其特征在于,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,在计算过程中调整所述待训练模型中的参数,得到第二初步模型;
根据所述初步模型计算得到资源成单率的预测值;
将所述资源成单率的预测值与对应时间段中的测试数据中与该预测值对应的实际值计算损失值,所述测试数据包括当前时间之前的第二时间段的资源使用数据;
循环上述的步骤,直到所述损失值小于设定值,损失值小于设定值时对应的第二初步模型作为资源预测模型。
21.如权利要求20所述的装置,其特征在于,所述训练模块,还用于:
将所述预测值与对应时间段中的测试数据中与该预测值对应的实际值使用平方损失函数计算损失值。
22.如权利要求21所述的装置,其特征在于,所述训练模块,还用于:
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用梯度下降法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用牛顿法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用拉格朗日法计算调整所述待训练模型中的参数;或者,
将所述每段所述子数据对应的资源缺乏系数作为待训练模型的输入,将所述资源成单率作为所述待训练模型的输出,使用交替方向乘子法计算调整所述待训练模型中的参数。
23.如权利要求14-22任意一项所述的装置,其特征在于,所述待训练模型包括:线性回归模型、多项式回归模型、指数回归模型、正则项回归模型中的至少一种。
24.如权利要求14-22任意一项所述的装置,其特征在于,所述划分模块,用于:
将所述训练数据中每天对应小时时间段的数据形成一子数据,形成二十四组子数据;
所述训练模块,还用于:
将所述二十四组子数据及每组所述子数据对应的资源缺乏系数据分别输入待训练模型中调整所述待训练模型中的参数,得到二十四个的资源预测模型。
25.如权利要求14-22任意一项所述的装置,其特征在于,所述获取模块,还用于:
获取一城市的训练数据;或者,
获取限定区域内的训练数据;或者,
获取携带的属性相同的区域的训练数据,所述属性包括:地理位置属性、居住人群类型。
26.一种资源缺口预测装置,其特征在于,包括:
预测模块,用于将一目标区域中的历史数据输入订单量预测模型中对待预测时间段的订单量进行预测,得到订单预测量;
第一计算模块,用于将所述订单预测量输入权利要求1-12任意一项所述的资源模型训练方法训练得到的资源预测模型进行计算,得到所述目标区域的资源缺乏系数;
第二计算模块,用于根据所述资源缺乏系数和所述订单预测量计算所述目标区域的资源缺口,所述资源缺口表示该目标区域需要增加的资源数量。
27.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至13任一所述的方法的步骤。
28.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至13任一所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811474770.4A CN111275229B (zh) | 2018-12-04 | 2018-12-04 | 资源模型训练方法、资源缺口预测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811474770.4A CN111275229B (zh) | 2018-12-04 | 2018-12-04 | 资源模型训练方法、资源缺口预测方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111275229A CN111275229A (zh) | 2020-06-12 |
CN111275229B true CN111275229B (zh) | 2022-07-05 |
Family
ID=71002928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811474770.4A Active CN111275229B (zh) | 2018-12-04 | 2018-12-04 | 资源模型训练方法、资源缺口预测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275229B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931101B (zh) * | 2020-06-30 | 2024-06-18 | 汉海信息技术(上海)有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN112580889A (zh) * | 2020-12-25 | 2021-03-30 | 北京嘀嘀无限科技发展有限公司 | 服务资源预估方法、装置、电子设备及存储介质 |
CN113220452A (zh) * | 2021-05-10 | 2021-08-06 | 北京百度网讯科技有限公司 | 资源分配方法、模型训练方法、装置和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092699A (zh) * | 2013-01-10 | 2013-05-08 | 中国南方电网有限责任公司超高压输电公司 | 一种云计算资源预分配实现方法 |
CN105373840A (zh) * | 2015-10-14 | 2016-03-02 | 深圳市天行家科技有限公司 | 代驾订单预测方法和代驾运力调度方法 |
WO2016207901A2 (en) * | 2015-06-26 | 2016-12-29 | Optibus Ltd. | System and method for real time scheduling |
CN108629503A (zh) * | 2018-04-28 | 2018-10-09 | 南通大学 | 一种基于深度学习的出租车上车需求量的预测方法 |
-
2018
- 2018-12-04 CN CN201811474770.4A patent/CN111275229B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092699A (zh) * | 2013-01-10 | 2013-05-08 | 中国南方电网有限责任公司超高压输电公司 | 一种云计算资源预分配实现方法 |
WO2016207901A2 (en) * | 2015-06-26 | 2016-12-29 | Optibus Ltd. | System and method for real time scheduling |
CN105373840A (zh) * | 2015-10-14 | 2016-03-02 | 深圳市天行家科技有限公司 | 代驾订单预测方法和代驾运力调度方法 |
CN108629503A (zh) * | 2018-04-28 | 2018-10-09 | 南通大学 | 一种基于深度学习的出租车上车需求量的预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111275229A (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109863526B (zh) | 为按需服务提供信息的***和方法 | |
CN109074622B (zh) | 确定运输服务路线的***及方法 | |
TWI670677B (zh) | 用於推薦預估到達時間的系統和方法 | |
CN111476588B (zh) | 订单需求预测方法、装置、电子设备及可读存储介质 | |
US11011057B2 (en) | Systems and methods for generating personalized destination recommendations | |
AU2018102202A4 (en) | Systems and methods for cheat examination | |
CN110869953A (zh) | 推荐交通出行服务的***和方法 | |
EP3635706B1 (en) | Methods and systems for estimating time of arrival | |
JP6632723B2 (ja) | サービスの順序列を更新するためのシステム及び方法 | |
US20200300650A1 (en) | Systems and methods for determining an estimated time of arrival for online to offline services | |
CN111275229B (zh) | 资源模型训练方法、资源缺口预测方法、装置及电子设备 | |
US11068815B2 (en) | Systems and methods for vehicle scheduling | |
CN108885726A (zh) | 服务时间点预测***和方法 | |
TW201903660A (zh) | 區域劃分系統和方法 | |
CN111260164A (zh) | 一种运力调度方法以及装置 | |
CN111861175A (zh) | 供需状态确定方法、装置、服务器及存储介质 | |
CN110750709A (zh) | 一种服务推荐方法及装置 | |
CN111489214A (zh) | 订单分配方法、条件设置方法、装置及电子设备 | |
CN111199440A (zh) | 事件预估方法、装置以及电子设备 | |
WO2019154208A1 (en) | Systems and methods for determining operation strategy for service platform | |
CN110832513B (zh) | 用于按需服务的***和方法 | |
CN111222932A (zh) | 订单周期计算方法、装置及电子设备 | |
CN111612183A (zh) | 信息处理方法、装置、电子设备及计算机可读存储介质 | |
CN111915043A (zh) | 服务数据处理方法、装置、服务器及存储介质 | |
CN112036774A (zh) | 服务策略的评估方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |