CN108845496A - 一种自动化码头agv调度方法及*** - Google Patents

一种自动化码头agv调度方法及*** Download PDF

Info

Publication number
CN108845496A
CN108845496A CN201810499201.9A CN201810499201A CN108845496A CN 108845496 A CN108845496 A CN 108845496A CN 201810499201 A CN201810499201 A CN 201810499201A CN 108845496 A CN108845496 A CN 108845496A
Authority
CN
China
Prior art keywords
task case
task
case
agv
training set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810499201.9A
Other languages
English (en)
Other versions
CN108845496B (zh
Inventor
曾庆成
王泽浩
朱禹仲
王征
陈康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN201810499201.9A priority Critical patent/CN108845496B/zh
Publication of CN108845496A publication Critical patent/CN108845496A/zh
Application granted granted Critical
Publication of CN108845496B publication Critical patent/CN108845496B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自动化码头AGV调度方法及***,所述调度方法包括以下步骤:步骤1:输入模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;步骤2:输入未作业任务箱列表V,初始化调度策略π;针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业;步骤3:判断未作业任务箱是否全部完成分配;步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真;步骤5:利用新训练集S’对DBN网络模型进行训练更新,更新后的DBN网络模型作为下一轮AGV任务分配使用的DBN网络模型。本申请将深度学习网络模型引入到AGV实时调度分配中,实现了AGV任务分配的实时最优。

Description

一种自动化码头AGV调度方法及***
技术领域
本发明属于自动化码头作业调度决策技术领域,具体涉及一种自动化码头AGV调度方法及***。
背景技术
在自动化码头中,自动导引车(automated guided vehicle,AGV)用于完成岸桥与自动堆垛起重机之间的集装箱水平运输,但是其作业效率受自身条件、作业环境、码头布局等因素影响,因此,准确把握AGV调度是码头提高作业效率的关键。高效的集装箱装卸作业水平能提高码头作业效率、缩短船舶在港时间,而AGV与岸桥、场桥作业的协同性是影响船舶装卸效率的重要因素之一,在理想状态下,岸桥与场桥无需等待AGV即可无延迟装卸集装箱。由于AGV数量的增加会导致拥堵,因此AGV与岸桥、场桥之间高水平的协同性无法通过单纯增加AGV数量实现,反而最终影响岸桥与场桥的作业效率。因此,需要设计一种高效率的AGV调度方法,已经成为提高自动化码头作业效率的关键。
发明内容
为了解决上述技术问题,本发明提供了一种自动化码头AGV调度方法及***。
本发明通过以下技术方案实现:
一种自动化码头AGV调度方法,包括以下步骤:
步骤1:为所有AGV随机分配初始作业任务并进行作业;设定模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
步骤2:建立未作业任务箱列表V,初始化调度策略π;
针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业,所述当前时刻为空闲AGV到达交换区的时刻;
步骤3:判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入步骤4至步骤5进行调度策略的更新;
步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
步骤5:通过模拟仿真筛选出仿真最优任务箱i*后,对DBN网络模型进行训练更新;针对产生的空闲AGV,返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,步骤2中筛选策略最优任务箱π(VT)采用偏好函数进行,具体包括如下过程:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,:步骤4中,根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*
Z(i)=WHHn+r+WEEn+r,i∈VT (4)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离。
进一步地,在上述技术方案中,步骤5中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
进一步地,在上述技术方案中,步骤2中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (9)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (14)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
本发明还包括一种自动化码头AGV调度***,包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块;
算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表;
策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息,将使用当前调度策略π筛选出的策略最优任务箱π(VT)分配给当前时刻空闲AGV进行作业;
任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息,判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新;
模拟仿真模块用于根据算法参数设置模块输入的设定值,对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
调度策略实时更新模块用于对DBN网络模型进行训练更新;当产生空闲AGV时,返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,模拟仿真模块中,根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*
Z(i)=WHHn+r+WEEn+r,i∈VT (20)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
在调度策略实时更新模块中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
进一步地,在上述技术方案中,策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (25)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括调度策略评估模块,包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (30)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
本发明的有益效果为:
(1)本发明所述的调度方法及***综合考虑岸桥的作业效率和AGV的空载行驶距离,构建集装箱评价标准体系;同时利用两两比较的偏好函数对所有未作业集装箱进行评估,选出最优集装箱完成AGV分配,可在短时间内实时筛选最优任务箱;
(2)本发明所述的调度方法及***将新兴技术深度学习引入到AGV实时调度分配中,针对环境的动态变化,利用DBN网络模型实时更新AGV的当前调度策略,实现了AGV任务分配的实时最优;
(3)本发明所述的调度方法及***将训练集进行实时更新,完成了旧样本与新样本在总训练集当中的动态平衡,并给予每一个训练集样本不同的权重,使得可靠度强的样本对调度结果拥有更大的影响;
(4)本发明所述的调度方法及***可根据码头实际需求改变岸桥作业效率与AGV空载行驶距离的相对权重,对重视程度高的部分给予更高权重,从而产生相应的调度方案。
附图说明
下面结合附图和具体实施方法对本发明作进一步详细的说明。
图1为所述调度方法的流程图;
图2为所述调度方法的算法流程图;
图3为自动化码头的布局及装卸图;
图4为AGV运行区的运行路线图;
图5为所述调度***模块图。
具体实施方法
下面结合附图和实施例对本发明的技术方案进行清楚、完整的描述。
实施例1
如图1-4所示,一种自动化码头AGV调度方法,包括以下步骤:
步骤1:为所有AGV随机分配初始作业任务并进行作业;设定模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
步骤2:建立未作业任务箱列表V,初始化调度策略π;
针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业,所述当前时刻为空闲AGV到达交换区的时刻;
步骤3:判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入步骤4至步骤5进行调度策略的更新;
步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
步骤5:通过模拟仿真筛选出仿真最优任务箱i*后,对DBN网络模型进行训练更新;针对产生的空闲AGV,返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,步骤2中筛选策略最优任务箱π(VT)采用偏好函数进行,具体包括如下过程:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,:步骤4中,根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*
Z(i)=WHHn+r+WEEn+r,i∈VT (4)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离。
进一步地,在上述技术方案中,步骤5中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
由于模拟仿真所依据的当前策略不一定是真正的最优策略,因此产生的训练集存在一定误差,为减轻此误差对调度结果的影响,本申请引入权重至训练集样本(i*,i),对可靠度强的样本给予更高权重,经过公式(8)计算得到权重后,任务箱i*与i之间的模拟仿真评价值相差越大,则权重越大,则说明该样本对DBN网络训练的影响也越大;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
其中,本申请所述训练集的表现形式为任务箱两两比较,包括两个任务箱的偏好值Fe(m,n)和两个任务箱的总偏好值R(m,n);
随着训练集的累积,新训练集S’对训练效果的影响会不断减小,针对此问题,本申请实时更新训练集,假设新产生的训练集大小始终为d,新样本在本轮训练集更新后留下的概率为I/(d+I),在s轮训练集更新后的概率为(I/(d+I))s,随着训练集不断更新,旧样本留存的概率越来越小,减轻了旧样本对调度策略更新的影响,同时提高了算法的运算速度。
进一步地,在上述技术方案中,步骤2中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (9)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
其中,所述出口箱表示需要由堆场作业区运输至岸桥作业区的任务箱,所述进口箱表示需要由岸桥作业区运输至堆场作业区的任务箱;
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (14)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
如图5所示,本发明还包括一种自动化码头AGV调度***,包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块;
算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表;
策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息,将使用当前调度策略π筛选出的策略最优任务箱π(VT)分配给当前时刻空闲AGV进行作业;
任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息,判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新;
模拟仿真模块用于根据算法参数设置模块输入的设定值,对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
调度策略实时更新模块用于对DBN网络模型进行训练更新;当产生空闲AGV时,返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,模拟仿真模块中,根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*
Z(i)=WHHn+r+WEEn+r,i∈VT (20)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
在调度策略实时更新模块中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
进一步地,在上述技术方案中,策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (25)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括调度策略评估模块,包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (30)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
通过上述实施例所述的技术方案,本发明所述的本发明所述的调度方法及***综合考虑岸桥的作业效率和AGV的空载行驶距离,构建集装箱评价标准体系;同时利用两两比较的偏好函数对所有未作业集装箱进行评估,选出最优集装箱完成AGV分配,可在短时间内实时筛选最优任务箱。
以上所述,仅为本发明较佳的具体实施方法,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种自动化码头AGV调度方法,其特征在于,包括以下步骤:
步骤1:为所有AGV随机分配初始作业任务并进行作业;设定模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
步骤2:建立未作业任务箱列表V,初始化调度策略π;
针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业,所述当前时刻为空闲AGV到达交换区的时刻;
步骤3:判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入步骤4至步骤5进行调度策略的更新;
步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
步骤5:通过模拟仿真筛选出仿真最优任务箱i*后,对DBN网络模型进行训练更新;针对产生的空闲AGV,返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。
2.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:步骤2中筛选策略最优任务箱π(VT)采用偏好函数进行,具体包括如下过程:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
3.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:步骤4中,根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*
Z(i)=WHHn+r+WEEn+r,i∈VT (4)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
步骤5中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
4.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:步骤2中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (9)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
5.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:还包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (14)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
6.一种自动化码头AGV调度***,其特征在于:包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块;
算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表;
策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息,将使用当前调度策略π筛选出的策略最优任务箱π(VT)分配给当前时刻空闲AGV进行作业;
任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息,判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新;
模拟仿真模块用于根据算法参数设置模块输入的设定值,对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
调度策略实时更新模块用于对DBN网络模型进行训练更新;当产生空闲AGV时,返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。
7.根据权利要求6所述的自动化码头AGV调度***,其特征在于:策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
8.根据权利要求6所述的自动化码头AGV调度***,其特征在于:模拟仿真模块中,根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*
Z(i)=WHHn+r+WEEn+r,i∈VT (20)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
在调度策略实时更新模块中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
9.根据权利要求6所述的自动化码头AGV调度***,其特征在于:策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (25)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
10.根据权利要求6所述的自动化码头AGV调度***,其特征在于:还包括调度策略评估模块,包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (30)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
CN201810499201.9A 2018-05-23 2018-05-23 一种自动化码头agv调度方法及*** Active CN108845496B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810499201.9A CN108845496B (zh) 2018-05-23 2018-05-23 一种自动化码头agv调度方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810499201.9A CN108845496B (zh) 2018-05-23 2018-05-23 一种自动化码头agv调度方法及***

Publications (2)

Publication Number Publication Date
CN108845496A true CN108845496A (zh) 2018-11-20
CN108845496B CN108845496B (zh) 2021-06-25

Family

ID=64213274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810499201.9A Active CN108845496B (zh) 2018-05-23 2018-05-23 一种自动化码头agv调度方法及***

Country Status (1)

Country Link
CN (1) CN108845496B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444599A (zh) * 2020-03-23 2020-07-24 兰剑智能科技股份有限公司 一种agv项目仿真与监控方法及***
CN111949035A (zh) * 2020-08-24 2020-11-17 兰剑智能科技股份有限公司 Agv调度***中多车互锁解锁的方法、装置及设备
CN112764405A (zh) * 2021-01-25 2021-05-07 青岛港国际股份有限公司 基于时间预估模型的agv调度方法
CN112836974A (zh) * 2021-02-05 2021-05-25 上海海事大学 一种基于dqn和mcts的箱区间多场桥动态调度方法
CN112990617A (zh) * 2019-12-02 2021-06-18 杭州海康机器人技术有限公司 智能移动机器人的调度方法和调度装置
CN113110330A (zh) * 2021-04-15 2021-07-13 青岛港国际股份有限公司 一种基于全局最优匹配的agv动态调度管理方法
CN115049324A (zh) * 2022-08-17 2022-09-13 上海国际港务(集团)股份有限公司 码头agv车调度方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458788A (zh) * 2008-12-19 2009-06-17 天津市市政工程设计研究院 集装箱码头物流仿真优化***
CN103164782A (zh) * 2011-12-16 2013-06-19 招商局国际信息技术有限公司 一种集装箱卡车智能调度***及方法
CN104281894A (zh) * 2014-10-30 2015-01-14 大连海事大学 基于航道与泊位资源的船舶调度优化方法
CN107025141A (zh) * 2017-05-18 2017-08-08 成都海天数联科技有限公司 一种基于大数据混合作业模型的调度方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458788A (zh) * 2008-12-19 2009-06-17 天津市市政工程设计研究院 集装箱码头物流仿真优化***
CN103164782A (zh) * 2011-12-16 2013-06-19 招商局国际信息技术有限公司 一种集装箱卡车智能调度***及方法
CN104281894A (zh) * 2014-10-30 2015-01-14 大连海事大学 基于航道与泊位资源的船舶调度优化方法
CN107025141A (zh) * 2017-05-18 2017-08-08 成都海天数联科技有限公司 一种基于大数据混合作业模型的调度方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RI CHOE等: "Online preference learning for adaptive dispatching of AGVs in an automated container terminal", 《APPLIED SOFT COMPUTING》 *
W.W. COHEN等: "Learning to order things", 《JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990617A (zh) * 2019-12-02 2021-06-18 杭州海康机器人技术有限公司 智能移动机器人的调度方法和调度装置
CN111444599A (zh) * 2020-03-23 2020-07-24 兰剑智能科技股份有限公司 一种agv项目仿真与监控方法及***
CN111949035A (zh) * 2020-08-24 2020-11-17 兰剑智能科技股份有限公司 Agv调度***中多车互锁解锁的方法、装置及设备
CN112764405A (zh) * 2021-01-25 2021-05-07 青岛港国际股份有限公司 基于时间预估模型的agv调度方法
WO2022156440A1 (zh) * 2021-01-25 2022-07-28 青岛港国际股份有限公司 基于时间预估模型的agv调度方法
CN112836974A (zh) * 2021-02-05 2021-05-25 上海海事大学 一种基于dqn和mcts的箱区间多场桥动态调度方法
CN112836974B (zh) * 2021-02-05 2024-01-23 上海海事大学 一种基于dqn和mcts的箱区间多场桥动态调度方法
CN113110330A (zh) * 2021-04-15 2021-07-13 青岛港国际股份有限公司 一种基于全局最优匹配的agv动态调度管理方法
CN113110330B (zh) * 2021-04-15 2022-11-22 青岛港国际股份有限公司 一种基于全局最优匹配的agv动态调度管理方法
CN115049324A (zh) * 2022-08-17 2022-09-13 上海国际港务(集团)股份有限公司 码头agv车调度方法、装置、计算机设备和存储介质
CN115049324B (zh) * 2022-08-17 2022-11-04 上海国际港务(集团)股份有限公司 码头agv车调度方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN108845496B (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN108845496A (zh) 一种自动化码头agv调度方法及***
Liu et al. Bi-objective optimization for the container terminal integrated planning
CN101585453B (zh) 集装箱码头出口箱堆场自动分配方法
Bierwirth et al. A follow-up survey of berth allocation and quay crane scheduling problems in container terminals
Murty et al. Hongkong International Terminals gains elastic capacity using a data-intensive decision-support system
CN110322128A (zh) 车货匹配方法、装置及计算机存储介质
CN101789093A (zh) 一种集装箱码头泊位与岸桥分配方法
CN101458788A (zh) 集装箱码头物流仿真优化***
CN103246969B (zh) 一种物流调配的实现方法和装置
Guo et al. Berth allocation problem with uncertain vessel handling times considering weather conditions
CN101986313A (zh) 基于知识的集装箱码头泊位与岸桥调度方法
CN110070237A (zh) 基于货物配送点、货物体积和车型的货物配载计算方法
CN109523173A (zh) 一种集装箱港口生产调度方法
CN107451720A (zh) 面向自动化集装箱码头的船次作业计划评价方法
Xing et al. Dispatch problem of automated guided vehicles for serving tandem lift quay crane
Moutaoukil et al. Modeling a logistics pooling strategy for Agri-Food SMEs
Rouky et al. A robust metaheuristic for the rail shuttle routing problem with uncertainty: a real case study in the Le Havre Port
CN114331075A (zh) 堆场拖车调度方法、装置、设备及存储介质
CN109978270A (zh) 一种集装箱船航次装箱量预测方法
Yu et al. Yard template generation for automated container terminal based on bay sharing strategy
van Vianen et al. Simulation-based operational control of a dry bulk terminal
CN113743739B (zh) 一种基于混合整数规划、组合优化算法的agv调度方法
Dong et al. QCs scheduling scheme of genetic algorithm (GA) and improved firefly algorithm (FA)
CN115545369A (zh) 自动化码头岸桥资源策划决策方法、终端以及介质
CN112734111A (zh) 一种水平运输任务agv动态时间预估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant