CN114493053B - 一种基于双阶段回归的航空网络波及效应推断方法 - Google Patents
一种基于双阶段回归的航空网络波及效应推断方法 Download PDFInfo
- Publication number
- CN114493053B CN114493053B CN202210400965.4A CN202210400965A CN114493053B CN 114493053 B CN114493053 B CN 114493053B CN 202210400965 A CN202210400965 A CN 202210400965A CN 114493053 B CN114493053 B CN 114493053B
- Authority
- CN
- China
- Prior art keywords
- delay
- airport
- equation
- time slice
- flight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000000694 effects Effects 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 47
- 239000011159 matrix material Substances 0.000 claims abstract description 37
- 238000005457 optimization Methods 0.000 claims abstract description 18
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 118
- 239000000126 substance Substances 0.000 claims description 16
- 230000003111 delayed effect Effects 0.000 claims description 15
- 101100001672 Emericella variicolor andG gene Proteins 0.000 claims description 9
- 238000009825 accumulation Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 239000008280 blood Substances 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 5
- 230000010006 flight Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 230000001934 delay Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 229910052595 hematite Inorganic materials 0.000 description 3
- 239000011019 hematite Substances 0.000 description 3
- LIKBJVNGSGBSGK-UHFFFAOYSA-N iron(3+);oxygen(2-) Chemical compound [O-2].[O-2].[O-2].[Fe+3].[Fe+3] LIKBJVNGSGBSGK-UHFFFAOYSA-N 0.000 description 3
- 230000002265 prevention Effects 0.000 description 2
- 102220515664 Zinc finger protein Helios_S13D_mutation Human genes 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于双阶段回归的航空网络波及效应推断方法,属于航班延误预测技术领域,解决了现有延误传播分析模型固化且基于理想化假设建立的问题。包括构建各时间片所有机场间的邻接矩阵,生成各机场的延误状态向量;根据动力学函数库和邻接矩阵构建航班延误模型;根据延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;从所有机场中采样得到多个机场组合,采用加权赤池信息量准则对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于各优化方程得到延误传播方程;根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。实现了航空网络波及效应的准确预测。
Description
技术领域
本发明涉及航班延误预测技术领域,尤其涉及一种基于双阶段回归的航空网络波及效应推断方法。
背景技术
随着民航产业的快速发展,航班延误问题逐渐成为世界级挑战。导致航班延误的原因有很多,但是航空交通网络固有的传播效应是使得航班延误持续恶化的关键因素。由于传播效应,诸如不同航班共用飞机,飞机到港延误在离港航班上维持,以及地面资源共用致使到港延误传播到下游其他飞机等因素,都使得航班延误不断累积,使得任何初始延误都可能不断放大进而影响到整个航空交通网络。因此,对航班延误传播机制的研究是重要而又具有挑战性的。
国内外研究学者对于航班延误传播问题进行过***的研究。经济统计类方法最开始被应用于分析延误传播问题上。20世纪90年代,Boswell等人借助统计学方法开发航班延误的模型;1999年,Beatty等人提出了延误乘法器来评估初始延误影响。而后,随着二十世纪末复杂网络研究的兴起,从复杂网络的角度出发也催生了对延误问题的新理解,延误传播可以看作是航空网络中的各节点通过相互作用而涌现出的一种集体行为。
尽管目前针对延误传播的研究已取得了一定进展,但仍存在不足。主流使用的运筹学、经济统计学等传统方法,如回归分析、统计推断的方法往往通过分析,直接得到延误传播的结果,如某机场是否对其他机场有显著性影响,而忽视了模拟***的动态运行特性,尤其是时序上的变化情况。而复杂网络方法虽然可以挖掘到航班延误的中观特性,但仍然缺少准确描述延误传播变化规律的微观模型。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种基于双阶段回归的航空网络波及效应推断方法,用以解决现有延误传播分析模型固化且基于理想化假设建立的问题。
本发明实施例提供了一种基于双阶段回归的航空网络波及效应推断方法,包括如下步骤:
基于所有机场的航班历史数据,构建各时间片所有机场间的邻接矩阵;根据各机场在各时间片的延误时间,生成各机场的延误状态向量;
根据动力学函数库和邻接矩阵,构建航班延误模型;根据延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;
从所有机场中采样得到多个机场组合,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于各优化方程得到延误传播方程;
根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
基于上述方法的进一步改进,根据动力学函数库和邻接矩阵,构建航班延误模型,包括:
根据动力学函数库中的自调控动力学函数库,构建航班自身延误方程,用于表示航班自身累积造成的下一时间片延误情况;
根据动力学函数库中的相互作用动力学函数库,构建相邻机场延误方程,用于表示相邻机场延误传播造成的下一时间片延误情况;
根据航班自身延误函数、相邻机场延误函数和邻接矩阵,构建航班延误模型。
基于上述方法的进一步改进,航班自身延误方程F(·)用下式表示:
所述相邻机场延误方程G(·)用下式表示:
所述航班延误模型用下式表示:
其中,为i机场在t k 时间片的延误状态向量导数,N F 和N G 分别为对应的动力学函数库中基函数项的数量,和分别为对应的动力学函数库中第n个基函数项,ω F,n 和ω G,n 分别为对应的动力学函数库中第n个基函数项的系数,为i机场在t k 时间片的延误时间,为j机场在t k 时间片的延误时间,N为与i机场相邻的延误机场集合,为t k 时间片发生延误的j机场到i机场的航班流量。
基于上述方法的进一步改进,延误状态向量导数根据各机场的延误状态向量,采用下式的五点近似法计算得到:
基于上述方法的进一步改进,通过LASSO回归方法拟合航班延误模型时,将航班自身延误方程F(·)和相邻机场延误方程G(·)中基函数项系数组成的向量,作为损失函数中的罚函数项;
损失函数用下式表示:
其中,F 0(·)和G 0(·)分别为初步拟合方程中F(·)和G(·)的初步拟合结果,ω F 和ω G 分别为F 0(·)和G 0(·)中基函数项系数组成的向量,T为时间片总数量,λ为罚函数项的调整参数,λ>0。
基于上述方法的进一步改进,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,包括:
遍历当前机场组合对应的初步拟合方程中所有基函数项,每移除任意一个基函数项,得到当前待优化拟合方程,基于当前机场组合对应的邻接矩阵和其中各机场的延误状态向量,计算得到当前待优化拟合方程的加权赤池信息量;
从小到大排序得到的所有加权赤池信息量;
按照加权赤池信息量排序后的顺序,在初步拟合方程中逐个移除对应的基函数项,分别计算移除后的赤池信息量,直至移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项;以移除M项后的初步拟合方程作为当前机场组合对应的优化方程。
基于上述方法的进一步改进,加权赤池信息量wAIC用下式表示:
其中,为移除得到的加权赤池信息量,为当前机场组合对应的初步拟合方程中F(·)或G(·)中被移除的第n个基函数项,m为当前机场组合中所有机场的延误状态向量中延误时间的总数量,MSE f,n 为当前待优化拟合方程的拟合结果相对于实际结果的均方差,p为当前待优化方程中基函数项数量,ω f,n 为的系数;实际结果是与拟合结果对应的相同时间片的延误状态向量导数。
基于上述方法的进一步改进,移除M项后的赤池信息量根据下式计算得到:
基于上述方法的进一步改进,根据延误传播方程得到所有机场在对应时间片的延误时间包括:将发生延误的机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间。
基于上述方法的进一步改进,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,包括:
获取延误源的延误时间片,以及在延误时间片的延误时间;
基于延误传播方程,代入在延误时间片延误源到相邻机场的实际航班流量,得到延误源的相邻机场的延误传播方程,作为待计算延误传播方程;
将相邻机场在延误时间片的延误时间代入待计算延误传播方程,得到延误源的相邻机场在延误时间片的延误时间导数;
根据延误源的相邻机场在延误时间片的延误时间导数和延误时间,得到延误源的相邻机场在延误时间片下一时间片的延误时间。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、针对航空网络延误传播问题情景,通过LASSO回归和加权赤池信息量准则两个阶段推导出延误传播动力学方程,从而推断出延误导致的航空网络波及效应。该方法利用了加权赤池信息量准则来综合权衡估计模型的复杂度和拟合数据的优良性,弥补了LASSO回归方法易陷入过拟合导致动力学方程泛化能力较弱的缺陷,提升了动力学方程的泛化能力,同时也加强了对噪声的鲁棒性,确保了航空延误传播动力学方程的准确性,实现了延误波及的准确预测;
2、重点关注航空延误传播问题,从相邻航班间的延误数据关系出发,从网络动力学的角度,通过数据驱动计算出延误传播所满足的动力学方程,更具有实际应用价值,对航班延误进行有效分析,提高波及影响的评估准确性,便于提前进行预防,减少经济损失。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件;
图1为本发明实施例中基于双阶段回归的航空网络波及效应推断方法的流程图;
图2为本发明实施例中机场有向图的示意图;
图3为本发明实施例中航空网络波及效应的应用示例图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
本发明的一个具体实施例,公开了一种基于双阶段回归的航空网络波及效应推断方法,如图1所示,包括如下步骤:
S11:基于所有机场的航班历史数据,构建各时间片所有机场间的邻接矩阵;根据各机场在各时间片的延误时间,生成各机场的延误状态向量;
需要说明的是,航班延误存在以一天为周期的涨落现象,一般选择某一天所有机场的航班历史数据。对于一天的数据,按照固定的时间段切分得到多个时间片。优选地,以半小时为间隔,切分得到48个时间片。
构建各时间片所有机场间的邻接矩阵,包括:
①以所有机场作为节点,构建有向连边;如图2中有向实线所示;
②以各个时间片下相邻两个机场的航班流量作为对应的连边的权重,得到有向图;
③根据有向图,得到各时间片所有机场间的邻接矩阵;邻接矩阵对角线上的元素为0。
示例性地,如果有20个机场,则每个时间片得到一个20×20的邻接矩阵。
S12:根据动力学函数库和邻接矩阵,构建航班延误模型;根据延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;
需要说明的是,本实施例从机场自身延误累积和相邻机场延误传播两个维度,考虑造成的航班延误波及情况,因此,分别使用动力学函数库中的不同基函数定义两个维度的延误方程,构建航班延误模型。动力学函数库中的基函数包括:多项式函数、指数函数、三角函数、对数函数和激活函数等,用于表示不同延误因素导致的不同延误传播关系。
具体来说,根据动力学函数库中的自调控动力学函数库(self-regulationfunction),构建航班自身延误方程F(·),用于表示航班自身累积造成的下一时间片延误情况,如下所示:
根据动力学函数库中的相互作用动力学函数库(pairwise function),构建相邻机场延误方程G(·),用于表示相邻机场延误传播造成的下一时间片延误情况,如下所示:
其中,N G 为相互作用动力学函数库中基函数项数量,为相互作用动力学函数库中第n个基函数项,ω G,n 为自调控动力学函数库中第n个基函数项系数,为i机场在t k 时间片的延误时间,为j机场在t k 时间片的延误时间。
相邻机场延误方程从相邻航班间的延误数据关系出发,从网络动力学的角度对其进行分析拟合,关注航班延误引起的后续航班时序上的变化,对航班延误进行有效分析,提高波及影响的评估准确性。
根据航班自身延误函数、相邻机场延误函数和邻接矩阵,构建航班延误模型,如下所示:
其中,为i机场在t k 时间片的延误状态向量导数,用于反映由于航班自身延误累计以及其他相邻机场延误影响下的延误变化趋势,N为与i机场相邻的延误机场集合,为t k 时间片发生延误的j机场到i机场的航班流量,j机场与i机场相邻。
表1 动力学函数库中基函数示意图
由于基函数有很多,具体使用哪些基函数及其系数是未知的,通过LASSO回归方法拟合航班延误模型,就是用于确定出方程中明确的基函数项及其系数。
需要说明的是,由于基函数项数量较多,容易陷入过拟合,因此,将航班自身延误方程F(·)和相邻机场延误方程G(·)中基函数项系数组成的向量,作为损失函数中的罚函数项对其进行约束,最终损失函数用下式表示:
其中,F 0(·)和G 0(·)分别为初步拟合方程中F(·)和G(·)的初步拟合结果,ω F 和ω G 分别为F 0(·)和G 0(·)中基函数项系数组成的向量,T为时间片总数量,λ为罚函数项的调整参数,λ>0。
λ越大,则越多的基函数项系数会被拟合为0。一般预先设置固定值,示例性地,设置为0.2,也可以根据实际拟合结果进行调整。
拟合时,需要使公式(5)中求和部分最小,即根据得到的拟合结果要尽可能与实际结果接近。同时,使公式(5)中罚函数项最小,表示让拟合方程的各项系数不能太大,太大则模型复杂,容易导致过拟合,泛化能力弱,即只对某机场某天数据拟合准确,换一组历史数据,准确率就会大大下降。本实施例中LASSO回归实现了拟合准确度与避免过拟合两项上的平衡。
LASSO回归可以通过类似于求导的方法,直接计算出各项系数的精确值,当损失函数的计算梯度为0时,回归结束,得到确定了基函数项及其系数的初步拟合方程。
S13:从所有机场中采样得到多个机场组合,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于各优化方程得到延误传播方程;
通过拓扑采样,从D个机场中随机选取S个机场,重复D s 次得到多组采样数据,即多个机场组合。
需要说明的是,如果根据初步拟合方程得到的各机场对应的拟合方程中基函数项差异比较大,S可以取小一点,示例性地,设置S为1;反之,如果基函数项比较接近,S可以设置为D/2。示例性地,从20个机场中随机选取10个机场,重复20次,得到20个机场组合。
由于在步骤S11中已经获取了各时间片所有机场间的邻接矩阵,各机场的延误状态向量,那么拓扑采样得到的多个机场组合,就可以从所有机场间的邻接矩阵中选取组合中对应机场间的航班流量数据,得到各时间片每个机场组合的邻接矩阵,以及,其中各机场的延误状态向量。
根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,包括:
①遍历当前机场组合对应的初步拟合方程中所有基函数项,每移除任意一个基函数项,得到当前待优化拟合方程,基于当前机场组合的邻接矩阵和其中各机场的延误状态向量,计算得到当前待优化拟合方程的加权赤池信息量;
需要说明的是,加权赤池信息量(weighted Akaike's Information Criterion,简称wAIC)用下式表示:
其中,为移除得到的加权赤池信息量,为当前机场组合对应的初步拟合方程中F(·)或G(·)中被移除的第n个基函数项,m为当前机场组合中所有机场的延误状态向量中延误时间的总数量,MSE f,n 为当前待优化拟合方程的拟合结果相对于实际结果的均方差,p为当前待优化方程中基函数项数量,ω f,n 为的系数;实际结果是与拟合结果对应的相同时间片的延误状态向量导数。
示例性地,基于步骤S12得到的初步拟合方程,基于当前机场组合的邻接矩阵,展开得到当前机场组合对应的初步拟合方程为:
遍历移除上述方程中的3个基函数项,以移除第1个基函数项为例,得到方程,作为当前待优化拟合方程,p为2,ω f,n 为a,将当前机场组合的延误状态向量中的对应时间片的延误时间代入当前待优化拟合方程中,得到多个拟合结果;再将当前机场组合的延误状态向量中的延误时间代入公式(7),得到多个对应时间片的延误状态向量导数,作为与拟合结果对应的实际结果,根据拟合结果和实际结果,计算得到均方差MSE f,n 。
②从小到大排序得到的所有加权赤池信息量;
需要说明的是,移除某一个基函数项后,得到的方程的偏差及复杂度,该值越小越好;某基函数项系数越小则说明该项对拟合方程整体影响越小。因此,加权赤池信息量越小,则某基函数项越应该被优先移除。
由此可见,本方法利用加权赤池信息量准则来综合权衡估计模型的复杂度和拟合数据的优良性,弥补了LASSO回归方法易陷入过拟合导致动力学方程泛化能力较弱的缺陷,提升了动力学方程的泛化能力,同时也加强了对噪声的鲁棒性,确保了航空延误传播动力学方程的准确性。
③按照加权赤池信息量排序后的顺序,在初步拟合方程中逐个移除对应的基函数项,计算移除后的赤池信息量,直至移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项;以移除M项后的初步拟合方程作为当前机场组合对应的优化方程。
需要说明的是,移除M项后的赤池信息量根据下式计算得到:
按照步骤S13得到D s 个机场组合对应的优化方程后,再对每个基函数项的系数取均值,得到延误传播方程。
示例性地,2个机场组合分别对应的优化方程为:
则延误传播方程为:
现有延误传播分析方法多基于预建立的传播模型,而这些传播模型是根据航班运行进行一定简化和理想化假设建立的,并不能准确反映延误传播的实际情况,本实施例中通过数据驱动计算出延误传播所满足的动力学方程,更具实际应用价值。
S14:根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
具体地,将实际延误机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
需要说明的是,得到延误传播方程后,当某时刻某机场(延误源)产生延误时,可以根据方程估计第一层波及效应,即相邻机场(邻居)的延误变化趋势及其下一时间片的延误情况;接着根据第一层波及效应影响的机场延误情况,估计再下一个时间片上的第二层波及效应,即邻居的邻居可能发生的延误情况;依次递推下去,即可得到该延误源对整个航空网络未来的波及效应。
具体来说,根据延误传播方程得到所有机场在对应时间片的延误时间,是将发生延误的机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间。
其中,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,包括:
①获取延误源的延误时间片,以及在延误时间片的延误时间;
②基于延误传播方程,代入在延误时间片延误源到相邻机场的实际航班流量,得到延误源的相邻机场的延误传播方程,作为待计算延误传播方程;
③将相邻机场在延误时间片的延误时间代入待计算延误传播方程,得到延误源的相邻机场在延误时间片的延误时间导数;
④根据延误源的相邻机场在延误时间片的延误时间导数和延误时间,得到延误源的相邻机场相对于延误源的下一时间片的延误时间。
示例性地,延误传播方程为:,如图3所示,1号机场发生延误,延误时刻对应的时间片是t 1,1号机场作为延误源,推断相邻的2号机场的延误变化趋势,此时,i=2,与2号机场相邻的延误机场集合N中是1号机场,那么根据延误传播方程,因延误源造成的2号机场的延误传播方程为:
与现有技术相比,本实施例提供的一种基于双阶段回归的航空网络波及效应推断方法,针对航空网络延误传播问题情景,通过LASSO回归和加权赤池信息量准则两个阶段推导出延误传播动力学方程,从而推断出延误导致的航空网络波及效应。该方法利用了加权赤池信息量准则来综合权衡估计模型的复杂度和拟合数据的优良性,弥补了LASSO回归方法易陷入过拟合导致动力学方程泛化能力较弱的缺陷,提升了动力学方程的泛化能力,同时也加强了对噪声的鲁棒性,确保了航空延误传播动力学方程的准确性,实现了延误波及的准确预测;重点关注航空延误传播问题,从相邻航班间的延误数据关系出发,从网络动力学的角度,通过数据驱动计算出延误传播所满足的动力学方程,更具有实际应用价值,对航班延误进行有效分析,提高波及影响的评估准确性,便于提前进行预防,减少经济损失。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于双阶段回归的航空网络波及效应推断方法,其特征在于,包括如下步骤:
基于所有机场的航班历史数据,构建各时间片所有机场间的邻接矩阵;根据各机场在各时间片的延误时间,生成各机场的延误状态向量;
根据动力学函数库和邻接矩阵,构建航班延误模型;根据所述延误状态向量,通过LASSO回归方法拟合航班延误模型,得到初步拟合方程;
从所述所有机场中采样得到多个机场组合,根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对所述每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,基于所述各优化方程得到延误传播方程;
根据延误传播方程得到所有机场在对应时间片的延误时间,作为航空网络波及效应的推断结果。
2.根据权利要求1所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述根据动力学函数库和邻接矩阵,构建航班延误模型,包括:
根据动力学函数库中的自调控动力学函数库,构建航班自身延误方程,用于表示航班自身累积造成的下一时间片延误情况;
根据动力学函数库中的相互作用动力学函数库,构建相邻机场延误方程,用于表示相邻机场延误传播造成的下一时间片延误情况;
根据航班自身延误函数、相邻机场延误函数和邻接矩阵,构建航班延误模型。
6.根据权利要求5所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述根据各时间片每个机场组合的邻接矩阵和其中各机场的延误状态向量,采用加权赤池信息量准则,对所述每个机场组合对应的初步拟合方程进行优化,得到每个机场组合对应的优化方程,包括:
遍历当前机场组合对应的初步拟合方程中所有基函数项,每移除任意一个基函数项,得到当前待优化拟合方程,基于当前机场组合对应的邻接矩阵和其中各机场的延误状态向量,计算得到当前待优化拟合方程的加权赤池信息量;
从小到大排序得到的所有加权赤池信息量;
按照所述加权赤池信息量排序后的顺序,在所述初步拟合方程中逐个移除对应的基函数项,分别计算移除后的赤池信息量,直至移除M+1项后的赤池信息量比移除M项后的赤池信息量大,或者移除M项后只剩一个基函数项;以移除M项后的初步拟合方程作为当前机场组合对应的优化方程。
9.根据权利要求6所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,根据延误传播方程得到所有机场在对应时间片的延误时间包括:将发生延误的机场作为延误源,根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,再将所述延误源更新为相邻机场,依次递推,得到所有机场在对应时间片的延误时间。
10.根据权利要求9所述的基于双阶段回归的航空网络波及效应推断方法,其特征在于,所述根据延误传播方程,得到延误源的相邻机场相对于延误源的下一时间片的延误时间,包括:
获取延误源的延误时间片,以及在所述延误时间片的延误时间;
基于所述延误传播方程,代入在延误时间片延误源到相邻机场的实际航班流量,得到所述延误源的相邻机场的延误传播方程,作为待计算延误传播方程;
将所述相邻机场在延误时间片的延误时间代入所述待计算延误传播方程,得到延误源的相邻机场在延误时间片的延误时间导数;
根据所述延误源的相邻机场在延误时间片的延误时间导数和延误时间,得到延误源的相邻机场在延误时间片下一时间片的延误时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210400965.4A CN114493053B (zh) | 2022-04-18 | 2022-04-18 | 一种基于双阶段回归的航空网络波及效应推断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210400965.4A CN114493053B (zh) | 2022-04-18 | 2022-04-18 | 一种基于双阶段回归的航空网络波及效应推断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114493053A CN114493053A (zh) | 2022-05-13 |
CN114493053B true CN114493053B (zh) | 2022-07-08 |
Family
ID=81489628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210400965.4A Active CN114493053B (zh) | 2022-04-18 | 2022-04-18 | 一种基于双阶段回归的航空网络波及效应推断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114493053B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392355A (zh) * | 2017-06-27 | 2017-11-24 | 北京航空航天大学 | 一种基于差分进化算法的多机场协同调度鲁棒优化方法 |
CN109872074A (zh) * | 2019-03-04 | 2019-06-11 | 中国民航大学 | 基于sis的航空网络延误传播模型及建立方法 |
CN111144631A (zh) * | 2019-12-19 | 2020-05-12 | 南京航空航天大学 | 基于贝叶斯网络算法的航班延误实时概率预测方法 |
CN111191843A (zh) * | 2019-12-30 | 2020-05-22 | 南京航空航天大学 | 一种基于时序网络传播动力学方程的机场延误预测方法 |
WO2020240177A1 (en) * | 2019-05-28 | 2020-12-03 | Sita Information Networking Computing Uk Limited | System and method for flight arrival time prediction |
CN114037122A (zh) * | 2021-10-15 | 2022-02-11 | 青岛民航凯亚***集成有限公司 | 基于大数据挖掘处理分析的航班延误预测方法 |
-
2022
- 2022-04-18 CN CN202210400965.4A patent/CN114493053B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392355A (zh) * | 2017-06-27 | 2017-11-24 | 北京航空航天大学 | 一种基于差分进化算法的多机场协同调度鲁棒优化方法 |
CN109872074A (zh) * | 2019-03-04 | 2019-06-11 | 中国民航大学 | 基于sis的航空网络延误传播模型及建立方法 |
WO2020240177A1 (en) * | 2019-05-28 | 2020-12-03 | Sita Information Networking Computing Uk Limited | System and method for flight arrival time prediction |
CN111144631A (zh) * | 2019-12-19 | 2020-05-12 | 南京航空航天大学 | 基于贝叶斯网络算法的航班延误实时概率预测方法 |
CN111191843A (zh) * | 2019-12-30 | 2020-05-22 | 南京航空航天大学 | 一种基于时序网络传播动力学方程的机场延误预测方法 |
CN114037122A (zh) * | 2021-10-15 | 2022-02-11 | 青岛民航凯亚***集成有限公司 | 基于大数据挖掘处理分析的航班延误预测方法 |
Non-Patent Citations (1)
Title |
---|
基于ARIMA模型的机场航班延误预测技术研究;莫凡等;《航空计算技术》;20180525(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114493053A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110427433B (zh) | 一种区块链共识方法和存储介质 | |
CN109615163B (zh) | 一种基于时序仿真的空地联合容量计算方法 | |
CN110223517A (zh) | 基于时空相关性的短时交通流量预测方法 | |
CN111598148A (zh) | 一种基于历史容量相似特征的容量评估方法及设备 | |
WO2020248228A1 (zh) | 一种Hadoop平台计算节点负载预测方法 | |
CN111191843B (zh) | 一种基于时序网络传播动力学方程的机场延误预测方法 | |
CN116468186B (zh) | 一种航班链延误时间预测方法、电子设备及存储介质 | |
CN111581454A (zh) | 基于深度图压缩算法的并行查询表现预测***及方法 | |
CN108846523A (zh) | 一种基于贝叶斯网的航班离港滑行时间动态预测方法 | |
Chiapino et al. | Feature clustering for extreme events analysis, with application to extreme stream-flow data | |
CN111597757A (zh) | 基于多目标加点准则的gp模型辅助slpso算法 | |
CN114493053B (zh) | 一种基于双阶段回归的航空网络波及效应推断方法 | |
CN114647985A (zh) | 锋面过境预测模型的训练方法及锋面过境的预测方法 | |
CN108039068B (zh) | 一种基于航班延误传播的加权航空网络社团结构划分方法 | |
CN115270928A (zh) | 一种无人机集群目标的联合跟踪方法 | |
CN113806857A (zh) | 一种基于变分图自编码器的高速列车节能制动方法 | |
Gianazza | Smoothed traffic complexity metrics for airspace configuration schedules | |
CN116384814A (zh) | 基于机器学习对多因素影响下机场跑道容量的评估方法 | |
CN116386312A (zh) | 一种交通量预测模型的构建方法和*** | |
CN116205120A (zh) | 一种基于深度学习组合模型的航班运行网络延误预测方法 | |
CN115061444A (zh) | 一种融合概率网络和强化学习的工艺参数实时优化方法 | |
CN113393136B (zh) | 空中交通管制***延误传播特性发现方法、***及设备 | |
Meng et al. | Performance prediction of a modular product variant with RS-SVM | |
Masdarolomoor et al. | Finding community structure in complex networks using parallel approach | |
Mang et al. | Research on Flight delay Prediction based on Multi-Model Fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |