CN114493053B - 一种基于双阶段回归的航空网络波及效应推断方法 - Google Patents

一种基于双阶段回归的航空网络波及效应推断方法 Download PDF

Info

Publication number
CN114493053B
CN114493053B CN202210400965.4A CN202210400965A CN114493053B CN 114493053 B CN114493053 B CN 114493053B CN 202210400965 A CN202210400965 A CN 202210400965A CN 114493053 B CN114493053 B CN 114493053B
Authority
CN
China
Prior art keywords
delay
airport
equation
time slice
flight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210400965.4A
Other languages
English (en)
Other versions
CN114493053A (zh
Inventor
杜文博
曹先彬
陈莘文
谭滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202210400965.4A priority Critical patent/CN114493053B/zh
Publication of CN114493053A publication Critical patent/CN114493053A/zh
Application granted granted Critical
Publication of CN114493053B publication Critical patent/CN114493053B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于双阶段回归的航空网络波及效应推断方法,属于航班延误预测技术领域,解决了现有延误传播分析模型固化且基于理想化假设建立的问题。包括构建各时间片所有机场间的邻接矩阵,生成各机场的延误状态向量;根据动力学函数库和邻接矩阵构建航班延误模型;根据延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;从所有机场中采样得到多个机场组合,采用加权赤池信息量准则对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于各优化方程得到延误传播方程;根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。实现了航空网络波及效应的准确预测。

Description

一种基于双阶段回归的航空网络波及效应推断方法
技术领域
本发明涉及航班延误预测技术领域,尤其涉及一种基于双阶段回归的航空网络波及效应推断方法。
背景技术
随着民航产业的快速发展,航班延误问题逐渐成为世界级挑战。导致航班延误的原因有很多,但是航空交通网络固有的传播效应是使得航班延误持续恶化的关键因素。由于传播效应,诸如不同航班共用飞机,飞机到港延误在离港航班上维持,以及地面资源共用致使到港延误传播到下游其他飞机等因素,都使得航班延误不断累积,使得任何初始延误都可能不断放大进而影响到整个航空交通网络。因此,对航班延误传播机制的研究是重要而又具有挑战性的。
国内外研究学者对于航班延误传播问题进行过***的研究。经济统计类方法最开始被应用于分析延误传播问题上。20世纪90年代,Boswell等人借助统计学方法开发航班延误的模型;1999年,Beatty等人提出了延误乘法器来评估初始延误影响。而后,随着二十世纪末复杂网络研究的兴起,从复杂网络的角度出发也催生了对延误问题的新理解,延误传播可以看作是航空网络中的各节点通过相互作用而涌现出的一种集体行为。
尽管目前针对延误传播的研究已取得了一定进展,但仍存在不足。主流使用的运筹学、经济统计学等传统方法,如回归分析、统计推断的方法往往通过分析,直接得到延误传播的结果,如某机场是否对其他机场有显著性影响,而忽视了模拟***的动态运行特性,尤其是时序上的变化情况。而复杂网络方法虽然可以挖掘到航班延误的中观特性,但仍然缺少准确描述延误传播变化规律的微观模型。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种基于双阶段回归的航空网络波及效应推断方法,用以解决现有延误传播分析模型固化且基于理想化假设建立的问题。
本发明实施例提供了一种基于双阶段回归的航空网络波及效应推断方法,包括如下步骤:
基于所有机场的航班历史数据,构建各时间片所有机场间的邻接矩阵;根据各机场在各时间片的延误时间,生成各机场的延误状态向量;
根据动力学函数库和邻接矩阵,构建航班延误模型;根据延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;
从所有机场中采样得到多个机场组合,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于各优化方程得到延误传播方程;
根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
基于上述方法的进一步改进,根据动力学函数库和邻接矩阵,构建航班延误模型,包括:
根据动力学函数库中的自调控动力学函数库,构建航班自身延误方程,用于表示航班自身累积造成的下一时间片延误情况;
根据动力学函数库中的相互作用动力学函数库,构建相邻机场延误方程,用于表示相邻机场延误传播造成的下一时间片延误情况;
根据航班自身延误函数、相邻机场延误函数和邻接矩阵,构建航班延误模型。
基于上述方法的进一步改进,航班自身延误方程F(·)用下式表示:
Figure 375787DEST_PATH_IMAGE001
所述相邻机场延误方程G(·)用下式表示:
Figure 859727DEST_PATH_IMAGE002
所述航班延误模型用下式表示:
Figure 811502DEST_PATH_IMAGE003
其中,
Figure 815230DEST_PATH_IMAGE004
i机场在t k 时间片的延误状态向量导数,N F N G 分别为对应的动力学函数库中基函数项的数量,
Figure 210571DEST_PATH_IMAGE005
Figure 666960DEST_PATH_IMAGE006
分别为对应的动力学函数库中第n个基函数项,ω F,n ω G,n 分别为对应的动力学函数库中第n个基函数项的系数,
Figure 156847DEST_PATH_IMAGE007
i机场在t k 时间片的延误时间,
Figure 749502DEST_PATH_IMAGE008
j机场在t k 时间片的延误时间,N为与i机场相邻的延误机场集合,
Figure 565012DEST_PATH_IMAGE009
t k 时间片发生延误的j机场到i机场的航班流量。
基于上述方法的进一步改进,延误状态向量导数根据各机场的延误状态向量,采用下式的五点近似法计算得到:
Figure 749175DEST_PATH_IMAGE010
其中,
Figure 573912DEST_PATH_IMAGE011
Figure 552232DEST_PATH_IMAGE012
Figure 23796DEST_PATH_IMAGE013
Figure 720357DEST_PATH_IMAGE014
分别为i机场的延误状态向量中对应时间片的延误时间。
基于上述方法的进一步改进,通过LASSO回归方法拟合航班延误模型时,将航班自身延误方程F(·)和相邻机场延误方程G(·)中基函数项系数组成的向量,作为损失函数中的罚函数项;
损失函数用下式表示:
Figure 817626DEST_PATH_IMAGE015
其中,F 0(·)和G 0(·)分别为初步拟合方程中F(·)和G(·)的初步拟合结果,ω F ω G 分别为F 0(·)和G 0(·)中基函数项系数组成的向量,T为时间片总数量,λ为罚函数项的调整参数,λ>0。
基于上述方法的进一步改进,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,包括:
遍历当前机场组合对应的初步拟合方程中所有基函数项,每移除任意一个基函数项,得到当前待优化拟合方程,基于当前机场组合对应的邻接矩阵和其中各机场的延误状态向量,计算得到当前待优化拟合方程的加权赤池信息量;
从小到大排序得到的所有加权赤池信息量;
按照加权赤池信息量排序后的顺序,在初步拟合方程中逐个移除对应的基函数项,分别计算移除后的赤池信息量,直至移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项;以移除M项后的初步拟合方程作为当前机场组合对应的优化方程。
基于上述方法的进一步改进,加权赤池信息量wAIC用下式表示:
Figure 899720DEST_PATH_IMAGE016
其中,
Figure 525873DEST_PATH_IMAGE017
为移除
Figure 444151DEST_PATH_IMAGE018
得到的加权赤池信息量,
Figure 610690DEST_PATH_IMAGE019
为当前机场组合对应的初步拟合方程中F(·)或G(·)中被移除的第n个基函数项,m为当前机场组合中所有机场的延误状态向量中延误时间的总数量,MSE f,n 为当前待优化拟合方程的拟合结果相对于实际结果的均方差,p为当前待优化方程中基函数项数量,ω f,n
Figure 766865DEST_PATH_IMAGE018
的系数;实际结果是与拟合结果对应的相同时间片的延误状态向量导数。
基于上述方法的进一步改进,移除M项后的赤池信息量根据下式计算得到:
Figure 845810DEST_PATH_IMAGE020
其中,
Figure 985805DEST_PATH_IMAGE021
为对初步拟合方程移除M项后剩余的基函数项,p M 为移除M项后剩余的基函数项数量,MSE M 是移除M项后得到拟合方程的拟合结果相对于实际结果的均方差。
基于上述方法的进一步改进,根据延误传播方程得到所有机场在对应时间片的延误时间包括:将发生延误的机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间。
基于上述方法的进一步改进,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,包括:
获取延误源的延误时间片,以及在延误时间片的延误时间;
基于延误传播方程,代入在延误时间片延误源到相邻机场的实际航班流量,得到延误源的相邻机场的延误传播方程,作为待计算延误传播方程;
将相邻机场在延误时间片的延误时间代入待计算延误传播方程,得到延误源的相邻机场在延误时间片的延误时间导数;
根据延误源的相邻机场在延误时间片的延误时间导数和延误时间,得到延误源的相邻机场在延误时间片下一时间片的延误时间。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、针对航空网络延误传播问题情景,通过LASSO回归和加权赤池信息量准则两个阶段推导出延误传播动力学方程,从而推断出延误导致的航空网络波及效应。该方法利用了加权赤池信息量准则来综合权衡估计模型的复杂度和拟合数据的优良性,弥补了LASSO回归方法易陷入过拟合导致动力学方程泛化能力较弱的缺陷,提升了动力学方程的泛化能力,同时也加强了对噪声的鲁棒性,确保了航空延误传播动力学方程的准确性,实现了延误波及的准确预测;
2、重点关注航空延误传播问题,从相邻航班间的延误数据关系出发,从网络动力学的角度,通过数据驱动计算出延误传播所满足的动力学方程,更具有实际应用价值,对航班延误进行有效分析,提高波及影响的评估准确性,便于提前进行预防,减少经济损失。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件;
图1为本发明实施例中基于双阶段回归的航空网络波及效应推断方法的流程图;
图2为本发明实施例中机场有向图的示意图;
图3为本发明实施例中航空网络波及效应的应用示例图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
本发明的一个具体实施例,公开了一种基于双阶段回归的航空网络波及效应推断方法,如图1所示,包括如下步骤:
S11:基于所有机场的航班历史数据,构建各时间片所有机场间的邻接矩阵;根据各机场在各时间片的延误时间,生成各机场的延误状态向量;
需要说明的是,航班延误存在以一天为周期的涨落现象,一般选择某一天所有机场的航班历史数据。对于一天的数据,按照固定的时间段切分得到多个时间片。优选地,以半小时为间隔,切分得到48个时间片。
构建各时间片所有机场间的邻接矩阵,包括:
①以所有机场作为节点,构建有向连边;如图2中有向实线所示;
②以各个时间片下相邻两个机场的航班流量作为对应的连边的权重,得到有向图;
示例性地,在图2中,
Figure 690455DEST_PATH_IMAGE022
为在t时间片下i机场到j机场的航班流量,即航班数量。
③根据有向图,得到各时间片所有机场间的邻接矩阵;邻接矩阵对角线上的元素为0。
具体来说,在t k 时间片机场间的邻接矩阵
Figure 966716DEST_PATH_IMAGE023
表示如下:
Figure 718028DEST_PATH_IMAGE024
公式(1)
示例性地,如果有20个机场,则每个时间片得到一个20×20的邻接矩阵。
对于每个机场而言,将总时间划成相同的T个时间片,各时间片的机场延误时间
Figure 345318DEST_PATH_IMAGE007
由对应时间片内该机场所有航班的延误时间求和而得到。
最后,按时间片顺序依次组合,生成每个机场的延误状态向量
Figure 588081DEST_PATH_IMAGE025
i=1,2,...,DD为机场数量。
S12:根据动力学函数库和邻接矩阵,构建航班延误模型;根据延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;
需要说明的是,本实施例从机场自身延误累积和相邻机场延误传播两个维度,考虑造成的航班延误波及情况,因此,分别使用动力学函数库中的不同基函数定义两个维度的延误方程,构建航班延误模型。动力学函数库中的基函数包括:多项式函数、指数函数、三角函数、对数函数和激活函数等,用于表示不同延误因素导致的不同延误传播关系。
具体来说,根据动力学函数库中的自调控动力学函数库(self-regulationfunction),构建航班自身延误方程F(·),用于表示航班自身累积造成的下一时间片延误情况,如下所示:
Figure 718848DEST_PATH_IMAGE001
公式(2)
其中,N F 为自调控动力学函数库中基函数项数量,
Figure 388863DEST_PATH_IMAGE005
为自调控动力学函数库中第n个基函数项,ω F,n 为自调控动力学函数库中第n个基函数项系数,
Figure 254182DEST_PATH_IMAGE007
i机场在t k 时间片的延误时间。
根据动力学函数库中的相互作用动力学函数库(pairwise function),构建相邻机场延误方程G(·),用于表示相邻机场延误传播造成的下一时间片延误情况,如下所示:
Figure 35057DEST_PATH_IMAGE002
公式(3)
其中,N G 为相互作用动力学函数库中基函数项数量,
Figure 551489DEST_PATH_IMAGE006
为相互作用动力学函数库中第n个基函数项,ω G,n 为自调控动力学函数库中第n个基函数项系数,
Figure 392406DEST_PATH_IMAGE007
i机场在t k 时间片的延误时间,
Figure 977977DEST_PATH_IMAGE008
j机场在t k 时间片的延误时间。
相邻机场延误方程从相邻航班间的延误数据关系出发,从网络动力学的角度对其进行分析拟合,关注航班延误引起的后续航班时序上的变化,对航班延误进行有效分析,提高波及影响的评估准确性。
根据航班自身延误函数、相邻机场延误函数和邻接矩阵,构建航班延误模型,如下所示:
Figure 562542DEST_PATH_IMAGE003
公式(4)
其中,
Figure 933480DEST_PATH_IMAGE004
i机场在t k 时间片的延误状态向量导数,用于反映由于航班自身延误累计以及其他相邻机场延误影响下的延误变化趋势,N为与i机场相邻的延误机场集合,
Figure 945299DEST_PATH_IMAGE009
t k 时间片发生延误的j机场到i机场的航班流量,j机场与i机场相邻。
示例性地,在表1中列出了部分基函数,用于构建航班自身延误方程中的
Figure 503319DEST_PATH_IMAGE026
和相邻机场延误方程中的
Figure 642307DEST_PATH_IMAGE027
表1 动力学函数库中基函数示意图
Figure 867752DEST_PATH_IMAGE028
由于基函数有很多,具体使用哪些基函数及其系数是未知的,通过LASSO回归方法拟合航班延误模型,就是用于确定出方程中明确的基函数项及其系数。
需要说明的是,由于基函数项数量较多,容易陷入过拟合,因此,将航班自身延误方程F(·)和相邻机场延误方程G(·)中基函数项系数组成的向量,作为损失函数中的罚函数项对其进行约束,最终损失函数用下式表示:
Figure 784893DEST_PATH_IMAGE029
公式(5)
其中,F 0(·)和G 0(·)分别为初步拟合方程中F(·)和G(·)的初步拟合结果,ω F ω G 分别为F 0(·)和G 0(·)中基函数项系数组成的向量,T为时间片总数量,λ为罚函数项的调整参数,λ>0。
λ越大,则越多的基函数项系数会被拟合为0。一般预先设置固定值,示例性地,设置为0.2,也可以根据实际拟合结果进行调整。
需要说明的是,公式(5)中的状态向量导数
Figure 361368DEST_PATH_IMAGE030
反映了由于航班自身延误累计以及其他相邻机场延误影响下的延误变化趋势,根据各机场的延误状态向量,采用下式的五点近似法计算得到,作为拟合过程中的实际结果:
Figure 539932DEST_PATH_IMAGE031
公式(6)
其中,
Figure 619884DEST_PATH_IMAGE032
Figure 973505DEST_PATH_IMAGE033
Figure 771697DEST_PATH_IMAGE034
Figure 314805DEST_PATH_IMAGE035
分别为i机场的延误状态向量中对应时间片的延误时间。
拟合时,需要使公式(5)中求和部分最小,即根据
Figure 249263DEST_PATH_IMAGE036
得到的拟合结果要尽可能与实际结果
Figure 39364DEST_PATH_IMAGE030
接近。同时,使公式(5)中罚函数项最小,表示让拟合方程的各项系数不能太大,太大则模型复杂,容易导致过拟合,泛化能力弱,即只对某机场某天数据拟合准确,换一组历史数据,准确率就会大大下降。本实施例中LASSO回归实现了拟合准确度与避免过拟合两项上的平衡。
LASSO回归可以通过类似于求导的方法,直接计算出各项系数的精确值,当损失函数的计算梯度为0时,回归结束,得到确定了基函数项及其系数的初步拟合方程。
S13:从所有机场中采样得到多个机场组合,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于各优化方程得到延误传播方程;
通过拓扑采样,从D个机场中随机选取S个机场,重复D s 次得到多组采样数据,即多个机场组合。
需要说明的是,如果根据初步拟合方程得到的各机场对应的拟合方程中基函数项差异比较大,S可以取小一点,示例性地,设置S为1;反之,如果基函数项比较接近,S可以设置为D/2。示例性地,从20个机场中随机选取10个机场,重复20次,得到20个机场组合。
由于在步骤S11中已经获取了各时间片所有机场间的邻接矩阵,各机场的延误状态向量,那么拓扑采样得到的多个机场组合,就可以从所有机场间的邻接矩阵中选取组合中对应机场间的航班流量数据,得到各时间片每个机场组合的邻接矩阵,以及,其中各机场的延误状态向量。
根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,包括:
①遍历当前机场组合对应的初步拟合方程中所有基函数项,每移除任意一个基函数项,得到当前待优化拟合方程,基于当前机场组合的邻接矩阵和其中各机场的延误状态向量,计算得到当前待优化拟合方程的加权赤池信息量;
需要说明的是,加权赤池信息量(weighted Akaike's Information Criterion,简称wAIC)用下式表示:
Figure 308540DEST_PATH_IMAGE037
公式(7)
其中,
Figure 576710DEST_PATH_IMAGE038
为移除
Figure 631254DEST_PATH_IMAGE039
得到的加权赤池信息量,
Figure 592257DEST_PATH_IMAGE040
为当前机场组合对应的初步拟合方程中F(·)或G(·)中被移除的第n个基函数项,m为当前机场组合中所有机场的延误状态向量中延误时间的总数量,MSE f,n 为当前待优化拟合方程的拟合结果相对于实际结果的均方差,p为当前待优化方程中基函数项数量,ω f,n
Figure 850194DEST_PATH_IMAGE039
的系数;实际结果是与拟合结果对应的相同时间片的延误状态向量导数。
示例性地,基于步骤S12得到的初步拟合方程,基于当前机场组合的邻接矩阵,展开得到当前机场组合对应的初步拟合方程为:
Figure 922055DEST_PATH_IMAGE041
遍历移除上述方程中的3个基函数项,以移除第1个基函数项为例,得到
Figure 831105DEST_PATH_IMAGE042
方程,作为当前待优化拟合方程,p为2,ω f,n a,将当前机场组合的延误状态向量中的对应时间片的延误时间代入当前待优化拟合方程中,得到多个拟合结果;再将当前机场组合的延误状态向量中的延误时间代入公式(7),得到多个对应时间片的延误状态向量导数
Figure 697430DEST_PATH_IMAGE030
,作为与拟合结果对应的实际结果,根据拟合结果和实际结果,计算得到均方差MSE f,n
②从小到大排序得到的所有加权赤池信息量;
需要说明的是,移除某一个基函数项后,得到的方程的偏差及复杂度,该值越小越好;某基函数项系数越小则说明该项对拟合方程整体影响越小。因此,加权赤池信息量越小,则某基函数项越应该被优先移除。
由此可见,本方法利用加权赤池信息量准则来综合权衡估计模型的复杂度和拟合数据的优良性,弥补了LASSO回归方法易陷入过拟合导致动力学方程泛化能力较弱的缺陷,提升了动力学方程的泛化能力,同时也加强了对噪声的鲁棒性,确保了航空延误传播动力学方程的准确性。
③按照加权赤池信息量排序后的顺序,在初步拟合方程中逐个移除对应的基函数项,计算移除后的赤池信息量,直至移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项;以移除M项后的初步拟合方程作为当前机场组合对应的优化方程。
需要说明的是,移除M项后的赤池信息量根据下式计算得到:
Figure 957510DEST_PATH_IMAGE043
公式(8)
其中,
Figure 819680DEST_PATH_IMAGE044
为对初步拟合方程移除M项后剩余的基函数项,p M 为移除M项后剩余的基函数项数量,MSE M 是移除M项后得到拟合方程的拟合结果相对于实际结果的均方差。
移除停止的条件是:当移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项时,应当移除的项数
Figure 583237DEST_PATH_IMAGE045
用下式表示:
Figure 620463DEST_PATH_IMAGE046
公式(9)
移除停止后,以移除M项后的初步拟合方程作为当前机场组合对应的优化方程,即为F 0(·)和G 0(·)分别移除
Figure 367839DEST_PATH_IMAGE047
Figure 515924DEST_PATH_IMAGE048
项后得到的结果。
按照步骤S13得到D s 个机场组合对应的优化方程后,再对每个基函数项的系数取均值,得到延误传播方程。
示例性地,2个机场组合分别对应的优化方程为:
Figure 150299DEST_PATH_IMAGE049
则延误传播方程为:
Figure 624005DEST_PATH_IMAGE050
现有延误传播分析方法多基于预建立的传播模型,而这些传播模型是根据航班运行进行一定简化和理想化假设建立的,并不能准确反映延误传播的实际情况,本实施例中通过数据驱动计算出延误传播所满足的动力学方程,更具实际应用价值。
S14:根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
具体地,将实际延误机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
需要说明的是,得到延误传播方程后,当某时刻某机场(延误源)产生延误时,可以根据方程估计第一层波及效应,即相邻机场(邻居)的延误变化趋势及其下一时间片的延误情况;接着根据第一层波及效应影响的机场延误情况,估计再下一个时间片上的第二层波及效应,即邻居的邻居可能发生的延误情况;依次递推下去,即可得到该延误源对整个航空网络未来的波及效应。
具体来说,根据延误传播方程得到所有机场在对应时间片的延误时间,是将发生延误的机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间。
其中,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,包括:
①获取延误源的延误时间片,以及在延误时间片的延误时间;
②基于延误传播方程,代入在延误时间片延误源到相邻机场的实际航班流量,得到延误源的相邻机场的延误传播方程,作为待计算延误传播方程;
③将相邻机场在延误时间片的延误时间代入待计算延误传播方程,得到延误源的相邻机场在延误时间片的延误时间导数;
④根据延误源的相邻机场在延误时间片的延误时间导数和延误时间,得到延误源的相邻机场相对于延误源的下一时间片的延误时间。
示例性地,延误传播方程为:
Figure 593098DEST_PATH_IMAGE051
,如图3所示,1号机场发生延误,延误时刻对应的时间片是t 1,1号机场作为延误源,推断相邻的2号机场的延误变化趋势,此时,i=2,与2号机场相邻的延误机场集合N中是1号机场,那么根据延误传播方程,因延误源造成的2号机场的延误传播方程为:
Figure 279295DEST_PATH_IMAGE052
如果1号机场的
Figure 532290DEST_PATH_IMAGE053
Figure 645740DEST_PATH_IMAGE054
,而且,因2号机场在t 1时还未发生延误,
Figure 102129DEST_PATH_IMAGE055
,代入上述方程得到2号机场在t 1的延误时间导数:
Figure 857595DEST_PATH_IMAGE056
由此得到,2号机场在t 2的延误时间
Figure 715830DEST_PATH_IMAGE057
,其中h为时间片的单位时间,如果是30分钟,则1号机场的在t 1时间片的延误会造成2号机场在t 2时间片延误1小时。
与现有技术相比,本实施例提供的一种基于双阶段回归的航空网络波及效应推断方法,针对航空网络延误传播问题情景,通过LASSO回归和加权赤池信息量准则两个阶段推导出延误传播动力学方程,从而推断出延误导致的航空网络波及效应。该方法利用了加权赤池信息量准则来综合权衡估计模型的复杂度和拟合数据的优良性,弥补了LASSO回归方法易陷入过拟合导致动力学方程泛化能力较弱的缺陷,提升了动力学方程的泛化能力,同时也加强了对噪声的鲁棒性,确保了航空延误传播动力学方程的准确性,实现了延误波及的准确预测;重点关注航空延误传播问题,从相邻航班间的延误数据关系出发,从网络动力学的角度,通过数据驱动计算出延误传播所满足的动力学方程,更具有实际应用价值,对航班延误进行有效分析,提高波及影响的评估准确性,便于提前进行预防,减少经济损失。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于双阶段回归的航空网络波及效应推断方法,其特征在于,包括如下步骤:
基于所有机场的航班历史数据,构建各时间片所有机场间的邻接矩阵;根据各机场在各时间片的延误时间,生成各机场的延误状态向量;
根据动力学函数库和邻接矩阵,构建航班延误模型;根据所述延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;
从所述所有机场中采样得到多个机场组合,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对所述每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于所述各优化方程得到延误传播方程;
根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
2.根据权利要求1所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述根据动力学函数库和邻接矩阵,构建航班延误模型,包括:
根据动力学函数库中的自调控动力学函数库,构建航班自身延误方程,用于表示航班自身累积造成的下一时间片延误情况;
根据动力学函数库中的相互作用动力学函数库,构建相邻机场延误方程,用于表示相邻机场延误传播造成的下一时间片延误情况;
根据航班自身延误函数、相邻机场延误函数和邻接矩阵,构建航班延误模型。
3.根据权利要求2所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述航班自身延误方程F(·)用下式表示:
Figure 112240DEST_PATH_IMAGE001
所述相邻机场延误方程G(·)用下式表示:
Figure 457771DEST_PATH_IMAGE002
所述航班延误模型用下式表示:
Figure 811392DEST_PATH_IMAGE003
其中,
Figure 344004DEST_PATH_IMAGE004
i机场在t k 时间片的延误状态向量导数,N F N G 分别为对应的动力学函数库中基函数项的数量,
Figure 122998DEST_PATH_IMAGE005
Figure 323035DEST_PATH_IMAGE006
分别为对应的动力学函数库中第n个基函数项,ω F,n ω G,n 分别为对应的动力学函数库中第n个基函数项的系数,
Figure 598290DEST_PATH_IMAGE007
i机场在t k 时间片的延误时间,
Figure 883777DEST_PATH_IMAGE008
j机场在t k 时间片的延误时间,N为与i机场相邻的延误机场集合,
Figure 151948DEST_PATH_IMAGE009
t k 时间片发生延误的j机场到i机场的航班流量。
4.根据权利要求3所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述延误状态向量导数根据各机场的延误状态向量,采用下式的五点近似法计算得到:
Figure 206491DEST_PATH_IMAGE010
其中,
Figure 901915DEST_PATH_IMAGE011
Figure 923966DEST_PATH_IMAGE012
Figure 730248DEST_PATH_IMAGE013
Figure 904878DEST_PATH_IMAGE014
分别为i机场的延误状态向量中对应时间片的延误时间。
5.根据权利要求3或4所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述通过LASSO回归方法拟合航班延误模型时,将航班自身延误方程F(·)和相邻机场延误方程G(·)中基函数项系数组成的向量,作为损失函数中的罚函数项;
所述损失函数用下式表示:
Figure 771203DEST_PATH_IMAGE015
其中,F 0(·)和G 0(·)分别为初步拟合方程中F(·)和G(·)的初步拟合结果,ω F ω G 分别为F 0(·)和G 0(·)中基函数项系数组成的向量,T为时间片总数量,λ为罚函数项的调整参数,λ>0。
6.根据权利要求5所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对所述每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,包括:
遍历当前机场组合对应的初步拟合方程中所有基函数项,每移除任意一个基函数项,得到当前待优化拟合方程,基于当前机场组合对应的邻接矩阵和其中各机场的延误状态向量,计算得到当前待优化拟合方程的加权赤池信息量;
从小到大排序得到的所有加权赤池信息量;
按照所述加权赤池信息量排序后的顺序,在所述初步拟合方程中逐个移除对应的基函数项,分别计算移除后的赤池信息量,直至移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项;以移除M项后的初步拟合方程作为当前机场组合对应的优化方程。
7.根据权利要求6所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述加权赤池信息量wAIC用下式表示:
Figure 516436DEST_PATH_IMAGE016
其中,
Figure 126409DEST_PATH_IMAGE017
为移除
Figure 155545DEST_PATH_IMAGE018
得到的加权赤池信息量,
Figure 458350DEST_PATH_IMAGE019
为当前机场组合对应的初步拟合方程中F(·)或G(·)中被移除的第n个基函数项,m为当前机场组合中所有机场的延误状态向量中延误时间的总数量,MSE f,n 为当前待优化拟合方程的拟合结果相对于实际结果的均方差,p为当前待优化方程中基函数项数量,ω f,n
Figure 674568DEST_PATH_IMAGE018
的系数;所述实际结果是与拟合结果对应的相同时间片的延误状态向量导数。
8.根据权利要求6所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述移除M项后的赤池信息量根据下式计算得到:
Figure 340429DEST_PATH_IMAGE020
其中,
Figure 224071DEST_PATH_IMAGE021
为对初步拟合方程移除M项后剩余的基函数项,p M 为移除M项后剩余的基函数项数量,MSE M 是移除M项后得到拟合方程的拟合结果相对于实际结果的均方差。
9.根据权利要求6所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,根据延误传播方程得到所有机场在对应时间片的延误时间包括:将发生延误的机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将所述延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间。
10.根据权利要求9所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,包括:
获取延误源的延误时间片,以及在所述延误时间片的延误时间;
基于所述延误传播方程,代入在延误时间片延误源到相邻机场的实际航班流量,得到所述延误源的相邻机场的延误传播方程,作为待计算延误传播方程;
将所述相邻机场在延误时间片的延误时间代入所述待计算延误传播方程,得到延误源的相邻机场在延误时间片的延误时间导数;
根据所述延误源的相邻机场在延误时间片的延误时间导数和延误时间,得到延误源的相邻机场在延误时间片下一时间片的延误时间。
CN202210400965.4A 2022-04-18 2022-04-18 一种基于双阶段回归的航空网络波及效应推断方法 Active CN114493053B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210400965.4A CN114493053B (zh) 2022-04-18 2022-04-18 一种基于双阶段回归的航空网络波及效应推断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210400965.4A CN114493053B (zh) 2022-04-18 2022-04-18 一种基于双阶段回归的航空网络波及效应推断方法

Publications (2)

Publication Number Publication Date
CN114493053A CN114493053A (zh) 2022-05-13
CN114493053B true CN114493053B (zh) 2022-07-08

Family

ID=81489628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210400965.4A Active CN114493053B (zh) 2022-04-18 2022-04-18 一种基于双阶段回归的航空网络波及效应推断方法

Country Status (1)

Country Link
CN (1) CN114493053B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392355A (zh) * 2017-06-27 2017-11-24 北京航空航天大学 一种基于差分进化算法的多机场协同调度鲁棒优化方法
CN109872074A (zh) * 2019-03-04 2019-06-11 中国民航大学 基于sis的航空网络延误传播模型及建立方法
CN111144631A (zh) * 2019-12-19 2020-05-12 南京航空航天大学 基于贝叶斯网络算法的航班延误实时概率预测方法
CN111191843A (zh) * 2019-12-30 2020-05-22 南京航空航天大学 一种基于时序网络传播动力学方程的机场延误预测方法
WO2020240177A1 (en) * 2019-05-28 2020-12-03 Sita Information Networking Computing Uk Limited System and method for flight arrival time prediction
CN114037122A (zh) * 2021-10-15 2022-02-11 青岛民航凯亚***集成有限公司 基于大数据挖掘处理分析的航班延误预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392355A (zh) * 2017-06-27 2017-11-24 北京航空航天大学 一种基于差分进化算法的多机场协同调度鲁棒优化方法
CN109872074A (zh) * 2019-03-04 2019-06-11 中国民航大学 基于sis的航空网络延误传播模型及建立方法
WO2020240177A1 (en) * 2019-05-28 2020-12-03 Sita Information Networking Computing Uk Limited System and method for flight arrival time prediction
CN111144631A (zh) * 2019-12-19 2020-05-12 南京航空航天大学 基于贝叶斯网络算法的航班延误实时概率预测方法
CN111191843A (zh) * 2019-12-30 2020-05-22 南京航空航天大学 一种基于时序网络传播动力学方程的机场延误预测方法
CN114037122A (zh) * 2021-10-15 2022-02-11 青岛民航凯亚***集成有限公司 基于大数据挖掘处理分析的航班延误预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于ARIMA模型的机场航班延误预测技术研究;莫凡等;《航空计算技术》;20180525(第03期);全文 *

Also Published As

Publication number Publication date
CN114493053A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN110427433B (zh) 一种区块链共识方法和存储介质
CN109615163B (zh) 一种基于时序仿真的空地联合容量计算方法
CN110223517A (zh) 基于时空相关性的短时交通流量预测方法
CN111598148A (zh) 一种基于历史容量相似特征的容量评估方法及设备
WO2020248228A1 (zh) 一种Hadoop平台计算节点负载预测方法
CN111191843B (zh) 一种基于时序网络传播动力学方程的机场延误预测方法
CN116468186B (zh) 一种航班链延误时间预测方法、电子设备及存储介质
CN111581454A (zh) 基于深度图压缩算法的并行查询表现预测***及方法
CN108846523A (zh) 一种基于贝叶斯网的航班离港滑行时间动态预测方法
Chiapino et al. Feature clustering for extreme events analysis, with application to extreme stream-flow data
CN111597757A (zh) 基于多目标加点准则的gp模型辅助slpso算法
CN114493053B (zh) 一种基于双阶段回归的航空网络波及效应推断方法
CN114647985A (zh) 锋面过境预测模型的训练方法及锋面过境的预测方法
CN108039068B (zh) 一种基于航班延误传播的加权航空网络社团结构划分方法
CN115270928A (zh) 一种无人机集群目标的联合跟踪方法
CN113806857A (zh) 一种基于变分图自编码器的高速列车节能制动方法
Gianazza Smoothed traffic complexity metrics for airspace configuration schedules
CN116384814A (zh) 基于机器学习对多因素影响下机场跑道容量的评估方法
CN116386312A (zh) 一种交通量预测模型的构建方法和***
CN116205120A (zh) 一种基于深度学习组合模型的航班运行网络延误预测方法
CN115061444A (zh) 一种融合概率网络和强化学习的工艺参数实时优化方法
CN113393136B (zh) 空中交通管制***延误传播特性发现方法、***及设备
Meng et al. Performance prediction of a modular product variant with RS-SVM
Masdarolomoor et al. Finding community structure in complex networks using parallel approach
Mang et al. Research on Flight delay Prediction based on Multi-Model Fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant