CN115440191A - 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 - Google Patents
一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 Download PDFInfo
- Publication number
- CN115440191A CN115440191A CN202211394663.7A CN202211394663A CN115440191A CN 115440191 A CN115440191 A CN 115440191A CN 202211394663 A CN202211394663 A CN 202211394663A CN 115440191 A CN115440191 A CN 115440191A
- Authority
- CN
- China
- Prior art keywords
- flight
- instruction
- safety
- detection
- outputting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000013135 deep learning Methods 0.000 title claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000004891 communication Methods 0.000 claims abstract description 19
- 238000013519 translation Methods 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims description 95
- 238000012549 training Methods 0.000 claims description 14
- 230000024703 flight behavior Effects 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000010006 flight Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000013518 transcription Methods 0.000 claims description 9
- 230000035897 transcription Effects 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 8
- 230000008447 perception Effects 0.000 claims description 7
- 230000008451 emotion Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 4
- 238000012896 Statistical algorithm Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 239000002994 raw material Substances 0.000 claims 1
- 238000007726 management method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 241001282135 Poromitra oscitans Species 0.000 description 1
- 206010048232 Yawning Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000006996 mental state Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0047—Navigation or guidance aids for a single aircraft
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0073—Surveillance aids
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Aviation & Aerospace Engineering (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Evolutionary Computation (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及民用航空空中交通管理领域,特别是一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备。本发明提出了一种基于深度学习的飞机驾驶舱安全辅助方法,通过基于深度学习的多任务空管语音识别模型、指令翻译模型和指令理解模型,对获取到的飞行员的地空通话语音信号进行处理和分析,实时检测对应航班的航线是否正常,以及飞行员的工作状态。减少了人在回路给空中交通安全带来的安全威胁,为民航空中交通管制提供了有效的安全辅助措施,提高了空管***的运行效率。
Description
技术领域
本发明涉及民用航空空中交通管理领域,特别是一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备。
背景技术
空中交通管制的任务是保障空中交通安全有序地运行,不过日益增长的空中交通流量使得民航空中交通管制业务面临前所未有的复杂交通态势,飞行冲突愈发频繁,给航空安全带来了巨大的挑战,也对空管管制指挥调度提出了更高的要求。由于飞行员缺少有效手段感知飞行环境,因此为了保证航班飞行安全,飞行员必须严格按照空中交通管制员的飞行引导调整飞行姿态,这导致管制员与飞行员之间能否对管制指令做到正确地传达和反馈,会对空中交通安全产生极大影响。同时,飞行员在执行管制指令过程中的任何行为均潜在地影响空中交通安全。目前日益增长的工作负荷会严重降低管制员的指挥效率和安全水平,在航班密集区域内更为严重,极易出现“错、忘、漏”等情况,同时,长时间的高强度紧张工作会导致管制员和飞行员双方生理和心理的疲劳,造成“人为因素”安全隐患。
所以如今需要一种基于深度学习的飞机驾驶舱安全辅助***及装置来管控人在回路给空中交通安全带来的安全风险,预先感知潜在风险和不稳定因素,防微杜渐,提高空管安全防护的性能与效率。
发明内容
本发明的目的在于为民航驾驶舱飞行员提供飞行辅助和安全检测***,减少人在回路给空中交通带来的安全隐患,提供一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备。
为了实现上述发明目的,本发明提供了以下技术方案:
一种基于深度学习的飞机驾驶舱安全辅助方法,包括以下步骤:
S1:实时获取地空通话语音信号,对所述地空通话语音信号进行预处理以及按句切分处理,输出若干单句语音信号;所述预处理包括语音采样、滤波以及预加重;
S2:将所述单句语音信号输入预构筑的多任务空管语音识别模型,提取并输出所述单句语音信号对应的转录文本、说话人角色和语种信息;
S3:将所述转录文本分别输入到预构筑的空管指令翻译模型和空管指令理解模型,输出中英文双语管制指令,以及管制指令中的重要信息;所述重要信息包括呼号、指令意图以及指令参数;
S4:获取航迹数据,提取各个航班的飞行数据,根据所述飞行数据、所述指令意图以及所述指令参数预测各个所述航班的飞行轨迹,根据所述飞行轨迹生成并输出局部空中交通态势的感知;
S5:进行安全检测并输出安全检测结果;所述安全检测包括基于轨迹的安全辅助检测和基于空管指令的安全辅助检测;
所述多任务空管语音识别模型为编码器-分类器结构,通过预先标注的数据集训练得到;所述分类器由全连接层构成;所述说话人角色包括管制员和飞行员;所述语种信息包括中文和英文;
所述空管指令翻译模型和空管指令理解模型为编码器-解码器结构,通过预先标注的数据集训练得到。作为本发明的优选方案,所述空管指令翻译模型和所述空管指令理解模型采用BART-base模型。
本发明提出了一种基于深度学习的飞机驾驶舱安全辅助方法,通过基于深度学习的多任务空管语音识别模型、指令翻译模型和指令理解模型,对获取到的飞行员的地空通话语音信号进行处理和分析,通过深度学习方法实时检测对应航班的航线是否正常,以及飞行员的工作状态。减少了人在回路给空中交通安全带来的安全威胁,为民航空中交通管制提供了有效的安全辅助措施,提高了空管***的运行效率。
作为本发明的优选方案,所述S4包括:
S41:通过航电***接收航迹数据,得到当前航班的飞行数据,并根据所述飞行数据以及所述指令意图预测当前航班的飞行轨迹;所述飞行数据包括航班位置、飞行速度和飞行姿态;
S42:通过航电***接收航迹数据,得到其他航班的飞行数据,根据所述飞行数据预测其他航班的飞行轨迹;
S43:整合空域内所有航班的预测飞行轨迹,形成局部空中交通态势的感知。
作为本发明的优选方案,所述S4中采用基于深度神经网络的概率统计算法预测各个所述航班的飞行轨迹;所述概率统计算法的步骤如下:
基于深度神经网络分层级的结构,使用高斯过程处理不同层节点之间的非线性映射关系;再以深度高斯过程的预测均值作为航班的预测标称轨迹,以深度高斯过程的预测方差作为航班的预测可信偏差范围,输出为飞行轨迹。
作为本发明的优选方案,所述航班预测的飞行轨迹概率分布函数为:
作为本发明的优选方案,所述S5包括:
S51:进行基于轨迹的安全辅助检测;所述基于轨迹的安全辅助检测包括潜在飞行冲突检测和飞行行为一致性检测;
S52:进行基于空管指令的安全辅助检测;包括管制通话规范性检测、飞行员复诵正确性检测以及基于空管通话语音和文本的工作状态检测;
S53:输出安全检测结果。本发明能够同时对管制对话进行管制用语规范性检查、飞行员复诵一致性检查、航班潜在飞行冲突检查、飞行行为一致性检查和工作状态检测,有效地为空中交通管制指挥提供安全辅助措施和安全保障。
作为本发明的优选方案,所述S51包括:
S511:进行潜在飞行冲突检测:
计算潜在飞行冲突概率,当其超过预设置的阈值,输出结果为存在潜在飞行冲突;否则输出结果为无潜在飞行冲突;
其中,所述潜在飞行冲突概率的计算方式为:在检测时间内,通过马尔科夫链蒙特卡洛方法在各个航班各个时刻的预测飞行轨迹分布中采集若干样本点,计算当前航班与任意航班在各个时间的相对距离是否满足预设的安全间隔要求,将不满足安全间隔要求的样本点个数与总样本点个数的比值作为发生潜在冲突的概率;
S512:进行飞行行为一致性检测:
通过航电***接收航迹数据,计算现有航迹和预测航迹之间的差值,判断当前航班是否偏离航线;并根据所述S3得到的所述指令意图以及所述指令参数,判断当前航班是否按管制指令调整飞行参数;
当所述航班未按时执行管制指令,输出结果为未按时进行管制指令操作;
当现有航迹不在预测轨迹的可信区间内,输出结果为偏离航线;
当所述航班未按管制指令调整飞行参数,输出结果为未按管制指令操作;
否则输出结果为飞行行为一致。本发明通过基于统计概率分布的航班轨迹预测方法和以此为基础的冲突检测方法,能在考虑管制意图的情况下预测未来一段时间的航班飞行轨迹,提高空中交通运行效率并降低管制员的工作负荷;相较于现有机载设备中的碰撞检测***,设计的冲突检测方法能够更早地发现局部空中交通态势中的潜在飞行冲突,由于飞行轨迹预测精度较高,潜在飞行冲突检测方法的性能也得到了进一步提高,能够更好地支撑空中交通管制业务。
作为本发明的优选方案,所述S52包括:
S521:根据管制意图与指令参数之间的对应关系,构建空管指令规范知识库;
S522:进行管制通话规范性检测:将所述S3中输出的所述指令意图输入到所述空管指令规范知识库,检查所述指令意图与所述指令参数是否对应;
S523:进行指令复诵正确性检测:对飞行员和管制员的指令内容进行比较,判断飞行员指令复诵内容的正确性;
S524:根据所述单句语音信号的语音以及所述转录文本,输出飞行员的工作状态。设计了基于空管语音和对应指令文本的工作状态检测方法,能够以更高的准确率对管制员和飞行员的工作状态进行综合检测,能够减少空中交通管制中的安全隐患。
作为本发明的优选方案,所述工作状态包括:
状态良好:判断标准为所述单句语音信号语气平和、无明显卡顿和情绪波动,对应的转录文本无重复或多次修改;
中度疲劳:判断标准为所述单句语音信号声音沉闷、偶尔出现卡顿,对应的转录文本存在部分词语多次重复或修改的情况;
重度疲劳:判断标准为所述单句语音信号语速变慢、声音有气无力、吐字不清,对应的转录文本存在频繁重复或修改、语义不清的情况;
状态紧张:判断标准为所述单句语音信号语速急促、声音较大、情绪波动较大,对应的转录文本出现部分字词频繁重复的情况。
作为本发明的优选方案,所述S524的工作状态判断通过工作状态检测模型实现;
所述工作状态检测模型包括基于语音的编码器和分类器,以及基于文本的编码器和分类器;
所述编码器包括一维卷积层、激活函数层和基于双向长短期记忆的循环神经网络层;所述分类器由全连接层构成。
一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的方法。
与现有技术相比,本发明的有益效果:
1.本发明提出了一种基于深度学习的飞机驾驶舱安全辅助方法,通过基于深度学习的多任务空管语音识别模型、指令翻译模型和指令理解模型,对获取到的飞行员的地空通话语音信号进行处理和分析,通过深度学习方法实时检测对应航班的航线是否正常,以及飞行员的工作状态。减少了人在回路给空中交通安全带来的安全威胁,为民航空中交通管制提供了有效的安全辅助措施,提高了空管***的运行效率。
2.本发明能够同时对管制对话进行管制用语规范性检查、飞行员复诵一致性检查、航班潜在飞行冲突检查、飞行行为一致性检查和工作状态检测,有效地为空中交通管制指挥提供安全辅助措施和安全保障。
3.本发明通过基于统计概率分布的航班轨迹预测方法和以此为基础的冲突检测方法,能在考虑管制意图的情况下预测未来一段时间的航班飞行轨迹,提高空中交通运行效率并降低管制员的工作负荷;相较于现有机载设备中的碰撞检测***,设计的冲突检测方法能够更早地发现局部空中交通态势中的潜在飞行冲突,由于飞行轨迹预测精度较高,潜在飞行冲突检测方法的性能也得到了进一步提高,能够更好地支撑空中交通管制业务。
附图说明
图1为本发明实施例1所述的一种基于深度学习的飞机驾驶舱安全辅助方法的流程示意图。
图2为本发明实施例2所述的一种基于深度学习的飞机驾驶舱安全辅助方法中多任务空管语音识别模型结构图。
图3为本发明实施例2所述的一种基于深度学习的飞机驾驶舱安全辅助方法中空管指令翻译模型结构图。
图4为本发明实施例2所述的一种基于深度学习的飞机驾驶舱安全辅助方法中空管指令理解模型结构图。
图5为本发明实施例2所述的一种基于深度学习的飞机驾驶舱安全辅助方法中飞行行为一致性检测方法流程示意图。
图6为本发明实施例2所述的一种基于深度学习的飞机驾驶舱安全辅助方法中指令复诵正确性检测方法流程示意图。
图7为本发明实施例2所述的一种基于深度学习的飞机驾驶舱安全辅助方法中工作状态检测模型结构图。
图8为本发明实施例3所述的一种利用了实施例1所述的一种基于深度学习的飞机驾驶舱安全辅助方法的一种电子设备的结构示意图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
如图1所示,一种基于深度学习的飞机驾驶舱安全辅助方法,包括以下步骤:
S1:实时获取地空通话语音信号,对所述地空通话语音信号进行预处理以及按句切分处理,输出若干单句语音信号;所述预处理包括语音采样、滤波以及预加重。
S2:将所述单句语音信号输入预构筑的多任务空管语音识别模型,提取并输出所述单句语音信号对应的转录文本、说话人角色和语种信息。
S3:将所述转录文本分别输入到预构筑的空管指令翻译模型和空管指令理解模型,输出中英文双语管制指令,以及管制指令中的重要信息;所述重要信息包括呼号、指令意图以及指令参数。
S4:获取航迹数据,提取各个航班的飞行数据,根据所述飞行数据、所述指令意图以及所述指令参数预测各个所述航班的飞行轨迹,根据所述飞行轨迹生成并输出局部空中交通态势的感知。
S5:进行安全检测并输出安全检测结果;所述安全检测包括基于轨迹的安全辅助检测和基于空管指令的安全辅助检测。
所述多任务空管语音识别模型为编码器-分类器结构,通过预先标注的数据集训练得到;所述分类器由全连接层构成;所述说话人角色包括管制员和飞行员;所述语种信息包括中文和英文。
所述空管指令翻译模型和空管指令理解模型为编码器-解码器结构,通过预先标注的数据集训练得到。
实施例2
本实施例为实施例1所述方法的一种具体实施方式,包括以下步骤:
S1:实时获取地空通话语音信号,对所述地空通话语音信号进行预处理以及按句切分处理,输出若干单句语音信号;所述预处理包括语音采样、滤波以及预加重。
S11:通过空管管制内话***实时采集空管地空通话***中的地空通话语音信号。
S12:对所述地空通话语音信号进行预处理和切分。
S121:对采集到的语音进行实时预处理,包括语音采样、滤波、预加重等。
S122:将所述地空通话语音通话中的音频信号按25ms的长度分为连续的语音信号帧,使用WebRTC的语音活动检测器判断每个语音信号帧中是否存在有效声音;若连续的20个音频信号帧全部存在有效声音,则认为句子开始,若连续的20个音频信号帧中有至少12个音频信号帧不存在有效声音,则认为句子结束。
S123:根据S122的结果将连续的管制通话语音分割成指令语音段,每段语音仅包含单个说话人的单条指令。
S2:将所述单句语音信号输入预构筑的多任务空管语音识别模型,提取并输出所述单句语音信号对应的转录文本、说话人角色和语种信息。所述说话人角色包括管制员和飞行员,所述语种信息包括中文和英文。
S21、将所述单句语音输入训练完成的所述多任务空管语音识别模型中。
S22、模型输出多任务标签概率,将概率最大的类别作为说话人角色和语种分类任务的分类结果。
S23、模型输出语音帧对应的转录文本概率,根据最大概率解码方法输出指令语音对应的文本转录结果。
其中,预构筑的多任务空管语音识别模型为编码器-分类器结构,模型结构如图2所示,所有分类器共用编码器部分,所述编码器采用wav2vec 2.0模型,所述识别分类器网络均由一层全连接层组成,分类器有语音识别器、说话人角色分类器和语种分类器。所述多任务空管语音识别模型的搭建包括以下流程:
S201、使用真实环境下采集的无标注空管语音样本对编码器部分的wav2vec 2.0进行预训练直至网络收敛。
S202、使用真实环境下采集并进行标注的空管语音样本对所述多任务空管语音识别模型进行微调训练直至网络收敛。
S203、对所述多任务空管语音识别模型进行模型压缩,对模型参数进行量化,并针对移动化设备进行优化,在不影响模型性能的条件下减小模型所需存储空间并加快模型推理速度。
S3:将所述转录文本分别输入到预构筑的空管指令翻译模型和空管指令理解模型,输出中英文双语管制指令,以及管制指令中的重要信息;所述重要信息包括呼号、指令意图以及指令参数。其中,所述指令意图是管制员根据空中交通态势引导航班飞行的总体意图,如上升、转弯等;指令参数描述了航班执行管制指令过程中需要遵守的实施细节,包含运动参数或者目的飞行状态,如速度、上升率、目的高度等。
其中,所述空管指令翻译模型和所述空管指令理解模型均基于BART架构,为编码器-解码器结构,模型结构分别如图3和图4所示,模型使用BART-base模型,在模型训练时英文以单词为单位,中文以字为单位。具体包括以下搭建流程:
S31:使用真实环境下采集的空管指令文本样本对所述空管指令翻译模型和所述空管指令理解分别进行预训练直至网络收敛。
S32:使用真实环境下采集并进行双语标签标注的空管指令文本样本对所述空管指令翻译模型进行微调训练直至网络收敛;使用真实环境下采集并进行指令意图和指令参数标签标注的空管指令文本样本对所述空管指令理解模型进行微调训练直至网络收敛。
S4:获取航迹数据,提取各个航班的飞行数据,根据所述飞行数据、所述指令意图以及所述指令参数预测各个所述航班的飞行轨迹,根据所述飞行轨迹生成并输出局部空中交通态势的感知。
S41:通过现有的航电***接收数据,得到当前航班的飞行数据(如航班位置、飞行速度和飞行姿态等信息),在考虑管制意图的情况下预测本航班的飞行轨迹。
S411:基于S3中获取的指令意图和指令参数生成当前的短期航迹。
S412:使用基于深度神经网络的概率统计算法预测航班在未来一段时间的飞行轨迹,针对时段中每一时刻预测航班的轨迹位置及其可信区间。
其中,预测方法使用深度高斯过程,保持深度神经网络分层级的结构,同时使用高斯过程处理不同层节点之间的非线性映射关系,以深度高斯过程的预测均值作为航班的预测标称轨迹,预测方差作为航班的预测可信偏差范围;
S42:通过现有的航电***接收数据,得到其他航班的飞行数据,如航班位置、飞行速度和飞行姿态等信息,预测其他航班的飞行轨迹,预测方法同样使用深度高斯过程。
S43:整合局部空域内所有航班的飞行轨迹,形成局部空中交通态势的感知。
S5:进行安全检测并输出安全检测结果;所述安全检测包括基于轨迹的安全辅助检测和基于空管指令的安全辅助检测。
S51:进行基于轨迹的安全辅助检测,包括潜在飞行冲突检测和飞行行为一致性检测;
S511:进行潜在飞行冲突检测,检测局部空中交通态势是否存在发生潜在飞行冲突的风险。即计算潜在飞行冲突概率,当其超过预设置的阈值,输出结果为存在潜在飞行冲突;否则输出结果为无潜在飞行冲突。
在潜在冲突检测的时间范围内,使用马尔科夫链蒙特卡洛方法在每一航班、每一时刻的预测飞行轨迹分布中采集大量样本点,在横向、纵向和高度方向上计算任一飞机对之间在任一时间的距离是否满足各空间维度的安全间隔要求,将不满足安全间隔要求的样本点个数与总样本点个数的比值作为发生潜在冲突的概率。
基于蒙特卡罗统计模拟思想,通过从两者轨迹分布采集大量样本点计算其发生飞行冲突的概率。在任意时刻t,从两架飞机的飞行轨迹分布中采样足够大的个轨迹点,判断轨迹点对之间是否存在横向(x)、纵向(y)或高度方向(z)上的不满足安全间隔距离的情况,即,
采样时使用马尔科夫链蒙特卡洛方法从高斯过程的时序分布中采样轨迹点位置,单个分布的轨迹点采样方法如下:
最后,向飞行员显示冲突发生概率,若发生冲突的概率大于安全阈值,则输出告警信息。
S512:如图5所示,进行飞行行为一致性检测,通过现有的航电***接收航迹数据,检测管制指令执行过程中航班的飞行行为是否与预期相符;
当所述航班未按时执行管制指令,输出结果为未按时进行管制指令操作;
当现有航迹不在预测轨迹的可信区间内,输出结果为偏离航线;
当所述航班未按管制指令调整飞行参数,输出结果为未按管制指令操作;
否则输出结果为飞行行为一致。
S5121:通过现有的航电***接收航迹数据,得到本航班飞行数据的变化情况,检测飞行员在接收到管制指令之后是否在规定时间内开始执行管制指令;
S5122:通过现有的监视设备采集本航班实时飞行轨迹,与S412得到的预测飞行轨迹进行比较,若航班实时飞行轨迹不在预测轨迹的可信区间内,则输出告警信息提醒飞行员偏离航线;
S5123:基于S3得到的指令意图和指令参数,判断航班最终是否严格按照管制指令规定的参数调整飞行姿态,具体包括检测高度变化是否满足指令要求、位置航向变化是否满足指令要求、速度变化是否满足指令要求,若结果与管制指令存在不一致则输出告警信息提醒飞行员未按管制指令操作。
S52:进行基于空管指令的安全辅助检测,包括管制通话规范性检测和飞行员复诵正确性检测。
S521:构建空管指令规范知识库,对空管指令的各种规范进行采集、提取和整理。
通过分析管制规程,建立管制意图与指令参数之间的对应关系,按类别收录空管领域所有指令的格式与规范,包括每种指令术语、参数的规范化表达、每种指令意图所对应的可能指令参数类型等,其中,空管指令规范知识库的内容来自中国民用航空局发布的关于《民用航空空中交通无线电通话用语》(英语和汉语)的标准和国际民用航空组织发布的空中交通管制标准程序中对于空中交通无线电通话用语的规范化术语要求。
S522:进行管制通话规范性检测,将S3得到的管制意图输入空管指令规范知识库,检查管制意图与指令参数或指令类型是否对应;
若指令理解结果中无明确意图或指令不符合术语规范,则提醒通话双方确认管制指令意图,避免对指令产生歧义;
S523、进行指令复诵正确性检测,基于S3得到的管制意图和S2得到的说话人角色区分结果,对飞行员和管制员的指令内容进行比较,判断飞行员指令复诵内容的正确性,具体流程如图6所示。其检测结果具体包括:
检测结果1:若连续的语音说话人角色分类结果为管制员,则检测结果为未进行指令复诵,输出无复诵告警信息;
检测结果2:若检测到飞行员进行指令复诵,但复诵时间超出规定时间,则检测结果为未在规定时间内进行指令复诵,输出超时未复诵告警信息;
检测结果3:若检测到飞行员按时进行指令复诵,但复诵内容中的指令意图与管制员发布的指令意图不匹配,则检测结果为指令意图复诵错误,输出指令意图附送错误告警信息;
检测结果4:若检测到飞行员按时进行指令复诵,但复诵内容中的指令参数与管制员发布的指令参数不匹配,则检测结果为指令参数复诵错误,输出指令参数复诵错误告警信息;
检测结果5:若检测到飞行员按时进行复诵,且复诵内容无误,则输出检测结果为复诵正确。
S524:进行工作状态检测,对S1输出的单句语音信号和S2得到的对应转录文本分别进行工作状态检测,检测管制通话过程中是否出现语气消沉、打呵欠、指令文本重复或多次更正等现象;并结合两种信息,综合判断当前说话人的工作状态。
将输出的单句语音信号和S2得到的对应转录文本输入工作状态检测模型,输出基于语音、基于文本和综合的工作状态检测结果,具体分类和判断标准包括:
状态良好:判断标准为管制语音语气平和、无明显卡顿和情绪波动,对应的转录文本无重复或多次修改;
中度疲劳:有可能表现出注意力不集中、反应时间变长等生理现象,工作效率降低,进而导致出现监听指令复诵不足、航空器呼号出错、雷达监控不足等现象等潜在飞行安全隐患,判断标准为管制语音声音沉闷、偶尔出现卡顿,对应的转录文本存在部分词语多次重复或修改的情况;
重度疲劳:有可能表现出反应迟钝等生理现象,从而出现无法响应突发异常事件、发布错误指令或错误地执行指令等直接造成飞行事故的可能,可能对管制工作产生重大隐患,判断标准为管制语音语速变慢、声音有气无力、吐字不清等,对应的转录文本存在频繁重复或修改、语义不清的情况;
状态紧张:有可能正面临特情和突发事件,出现工作人员无法正确应对的情况,在此状态下,极易产生人为因素导致的安全隐患,可能需要根据实际情况协助工作人员调整精神状态或增派人员,判断标准为管制语音语速急促、声音较大、情绪波动较大,对应的转录文本可能出现部分字词频繁重复的情况。
其中,所述工作状态检测模型包括以下搭建流程:
a、搭建工作状态检测模型框架,模型结构如图7所示,具体流程如下:
a1、分别提取语音和文本特征,将所述语音和文本分别输入对应的特征提取器中,语音使用MFCC特征,文本使用词嵌入特征,特征维度为768。
a2、分别进行语音和文本特征编码,构建语音和文本的特征编码器,两个特征编码器使用相同结构,均由2个一维卷积层(Conv1d Layer)、激活函数层(GELU)和1个循环神经网络层组成;循环神经网络采用双向长短期记忆神经网络,特征维度为768,隐藏层维度为1024。
a3、分别对得到的特征编码进行工作状态分类,分别构建基于语音和文本的工作状态分类器,两个分类器结构相同,均由1个全连接层构成。
a4、进行综合工作状态分类,构建综合工作状态分类器,分类器由一个全连接层构成,输入为语音、文本特征编码器的输出和。
b、使用真实环境下采集并进行标注的空管指令语音、文本样本对所述工作状态检测模型进行训练直至网络收敛。
S53、显示所述中英文双语指令,显示实时局部空中交通态势,显示所述管制指令意图和参数,显示所述预测的航班飞行轨迹。
实施例3
如图8所示,一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述实施例所述的一种基于深度学习的飞机驾驶舱安全辅助方法。所述输入输出接口可以包括显示器、键盘、鼠标、以及USB接口,用于输入输出数据;电源用于为电子设备提供电能。
本领域技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
当本发明上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,包括以下步骤:
S1:实时获取地空通话语音信号,对所述地空通话语音信号进行预处理以及按句切分处理,输出若干单句语音信号;所述预处理包括语音采样、滤波以及预加重;
S2:将所述单句语音信号输入预构筑的多任务空管语音识别模型,提取并输出所述单句语音信号对应的转录文本、说话人角色和语种信息;
S3:将所述转录文本分别输入到预构筑的空管指令翻译模型和空管指令理解模型,输出中英文双语管制指令,以及管制指令中的重要信息;所述重要信息包括呼号、指令意图以及指令参数;
S4:获取航迹数据,提取各个航班的飞行数据,根据所述飞行数据、所述指令意图以及所述指令参数预测各个所述航班的飞行轨迹,根据所述飞行轨迹生成并输出局部空中交通态势的感知;
S5:进行安全检测并输出安全检测结果;所述安全检测包括基于轨迹的安全辅助检测和基于空管指令的安全辅助检测;
所述多任务空管语音识别模型为编码器-分类器结构,通过预先标注的数据集训练得到;所述分类器由全连接层构成;所述说话人角色包括管制员和飞行员;所述语种信息包括中文和英文;
所述空管指令翻译模型和空管指令理解模型为编码器-解码器结构,通过预先标注的数据集训练得到。
2.根据权利要求 1所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述S4包括:
S41:通过航电***接收航迹数据,得到当前航班的飞行数据,并根据所述飞行数据以及所述指令意图预测当前航班的飞行轨迹;所述飞行数据包括航班位置、飞行速度和飞行姿态;
S42:通过航电***接收航迹数据,得到其他航班的飞行数据,根据所述飞行数据预测其他航班的飞行轨迹;
S43:整合空域内所有航班的预测飞行轨迹,形成局部空中交通态势的感知。
3.根据权利要求1所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述S4中采用基于深度神经网络的概率统计算法预测各个所述航班的飞行轨迹;所述概率统计算法的步骤如下:
基于深度神经网络分层级的结构,使用高斯过程处理不同层节点之间的非线性映射关系;再以深度高斯过程的预测均值作为航班的预测标称轨迹,以深度高斯过程的预测方差作为航班的预测可信偏差范围,输出为飞行轨迹。
5.根据权利要求1所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述S5包括:
S51:进行基于轨迹的安全辅助检测;所述基于轨迹的安全辅助检测包括潜在飞行冲突检测和飞行行为一致性检测;
S52:进行基于空管指令的安全辅助检测;包括管制通话规范性检测、飞行员复诵正确性检测以及基于空管通话语音和文本的工作状态检测;
S53:输出安全检测结果。
6.根据权利要求5所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述S51包括:
S511:进行潜在飞行冲突检测:
计算潜在飞行冲突概率,当其超过预设置的阈值,输出结果为存在潜在飞行冲突;否则输出结果为无潜在飞行冲突;
其中,所述潜在飞行冲突概率的计算方式为:在检测时间内,通过马尔科夫链蒙特卡洛方法在各个航班各个时刻的预测飞行轨迹分布中采集若干样本点,计算当前航班与任意航班在各个时间的相对距离是否满足预设的安全间隔要求,将不满足安全间隔要求的样本点个数与总样本点个数的比值作为发生潜在冲突的概率;
S512:进行飞行行为一致性检测:
通过航电***接收航迹数据,计算现有航迹和预测航迹之间的差值,判断当前航班是否偏离航线;并根据所述S3得到的所述指令意图以及所述指令参数,判断当前航班是否按管制指令调整飞行参数;
当所述航班未按时执行管制指令,输出结果为未按时进行管制指令操作;
当现有航迹不在预测轨迹的可信区间内,输出结果为偏离航线;
当所述航班未按管制指令调整飞行参数,输出结果为未按管制指令操作;
否则输出结果为飞行行为一致。
7.根据权利要求5所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述S52包括:
S521:根据管制意图与指令参数之间的对应关系,构建空管指令规范知识库;
S522:进行管制通话规范性检测:将所述S3中输出的所述指令意图输入到所述空管指令规范知识库,检查所述指令意图与所述指令参数是否对应;
S523:进行指令复诵正确性检测:对飞行员和管制员的指令内容进行比较,判断飞行员指令复诵内容的正确性;
S524:根据所述单句语音信号的语音以及所述转录文本,输出飞行员的工作状态。
8.根据权利要求7所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述工作状态包括:
状态良好:判断标准为所述单句语音信号语气平和、无明显卡顿和情绪波动,对应的转录文本无重复或多次修改;
中度疲劳:判断标准为所述单句语音信号声音沉闷、偶尔出现卡顿,对应的转录文本存在部分词语多次重复或修改的情况;
重度疲劳:判断标准为所述单句语音信号语速变慢、声音有气无力、吐字不清,对应的转录文本存在频繁重复或修改、语义不清的情况;
状态紧张:判断标准为所述单句语音信号语速急促、声音较大、情绪波动较大,对应的转录文本出现部分字词频繁重复的情况。
9.根据权利要求7所述的一种基于深度学习的飞机驾驶舱安全辅助方法,其特征在于,所述S524的工作状态判断通过工作状态检测模型实现;
所述工作状态检测模型包括基于语音的编码器和分类器,以及基于文本的编码器和分类器;
所述编码器包括一维卷积层、激活函数层和基于双向长短期记忆的循环神经网络层;所述分类器由全连接层构成。
10.一种电子设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211394663.7A CN115440191B (zh) | 2022-11-09 | 2022-11-09 | 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211394663.7A CN115440191B (zh) | 2022-11-09 | 2022-11-09 | 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115440191A true CN115440191A (zh) | 2022-12-06 |
CN115440191B CN115440191B (zh) | 2023-01-24 |
Family
ID=84252724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211394663.7A Active CN115440191B (zh) | 2022-11-09 | 2022-11-09 | 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115440191B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916565A (zh) * | 2010-06-24 | 2010-12-15 | 北京华安天诚科技有限公司 | 空管***中的语音识别方法及语音识别装置 |
CN102324230A (zh) * | 2011-06-09 | 2012-01-18 | 民航数据通信有限责任公司 | 面向空中交通管制服务的气象信息语音合成***和方法 |
CN105894863A (zh) * | 2016-06-07 | 2016-08-24 | 云南财经大学 | 一种民航飞行操作安全校验方法及其装置 |
CN106875948A (zh) * | 2017-02-22 | 2017-06-20 | 中国电子科技集团公司第二十八研究所 | 一种基于管制语音的冲突告警方法 |
CN109034516A (zh) * | 2018-05-24 | 2018-12-18 | 中国民航大学 | 一种管制负荷评估方法及装置 |
CN109859765A (zh) * | 2019-01-24 | 2019-06-07 | 朗星无人机***有限公司 | 一种无人机空管语音通信***、语音发送方法及接收方法 |
CN110335609A (zh) * | 2019-06-26 | 2019-10-15 | 四川大学 | 一种基于语音识别的地空通话数据分析方法及*** |
CN111210825A (zh) * | 2019-12-16 | 2020-05-29 | 四川大学 | 一种增强地空通话管制员情景意识感知的方法与装置 |
CN113948091A (zh) * | 2021-12-20 | 2022-01-18 | 山东贝宁电子科技开发有限公司 | 民航客机陆空通话语音识别引擎及其应用方法 |
CN114155861A (zh) * | 2021-11-23 | 2022-03-08 | 首都机场集团有限公司 | 空管语音智能监控*** |
-
2022
- 2022-11-09 CN CN202211394663.7A patent/CN115440191B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916565A (zh) * | 2010-06-24 | 2010-12-15 | 北京华安天诚科技有限公司 | 空管***中的语音识别方法及语音识别装置 |
CN102324230A (zh) * | 2011-06-09 | 2012-01-18 | 民航数据通信有限责任公司 | 面向空中交通管制服务的气象信息语音合成***和方法 |
CN105894863A (zh) * | 2016-06-07 | 2016-08-24 | 云南财经大学 | 一种民航飞行操作安全校验方法及其装置 |
CN106875948A (zh) * | 2017-02-22 | 2017-06-20 | 中国电子科技集团公司第二十八研究所 | 一种基于管制语音的冲突告警方法 |
CN109034516A (zh) * | 2018-05-24 | 2018-12-18 | 中国民航大学 | 一种管制负荷评估方法及装置 |
CN109859765A (zh) * | 2019-01-24 | 2019-06-07 | 朗星无人机***有限公司 | 一种无人机空管语音通信***、语音发送方法及接收方法 |
CN110335609A (zh) * | 2019-06-26 | 2019-10-15 | 四川大学 | 一种基于语音识别的地空通话数据分析方法及*** |
CN111210825A (zh) * | 2019-12-16 | 2020-05-29 | 四川大学 | 一种增强地空通话管制员情景意识感知的方法与装置 |
CN114155861A (zh) * | 2021-11-23 | 2022-03-08 | 首都机场集团有限公司 | 空管语音智能监控*** |
CN113948091A (zh) * | 2021-12-20 | 2022-01-18 | 山东贝宁电子科技开发有限公司 | 民航客机陆空通话语音识别引擎及其应用方法 |
Non-Patent Citations (3)
Title |
---|
吴向阳: ""基于深度学习的空管语音识别"", 《西华大学学报(自然科学版)》 * |
张文杰: ""基于语音识别的管制语音通话分析技术研究"", 《信息与电脑(理论版)》 * |
王振飞: "" 基于空管语音识别的预防跑道侵入风险方法"", 《航空计算技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115440191B (zh) | 2023-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | A real-time ATC safety monitoring framework using a deep learning approach | |
US20230177969A1 (en) | Airport control decision support system and method based on semantic recognition of controller instruction | |
Helmke et al. | Reducing controller workload with automatic speech recognition | |
CA2162030C (en) | Robust language processor and method | |
Cordero et al. | Automated speech recognition in ATC environment | |
Delpech et al. | A real-life, French-accented corpus of air traffic control communications | |
CN112133290A (zh) | 一种针对民航陆空通话领域的基于迁移学习的语音识别方法 | |
Helmke et al. | Readback error detection by automatic speech recognition and understanding | |
CN114155861A (zh) | 空管语音智能监控*** | |
Kopald et al. | Applying automatic speech recognition technology to air traffic management | |
Cordero et al. | Automated speech recognition in controller communications applied to workload measurement | |
CN111210825A (zh) | 一种增强地空通话管制员情景意识感知的方法与装置 | |
Yi et al. | Identifying and managing risks of ai-driven operations: A case study of automatic speech recognition for improving air traffic safety | |
CN110232121B (zh) | 一种基于语义网的管制指令分类方法 | |
CN114049893A (zh) | 一种基于空管语音识别的管制员违规操作监控与分析方法 | |
CN113948091A (zh) | 民航客机陆空通话语音识别引擎及其应用方法 | |
Ohneiser et al. | Understanding tower controller communication for support in Air Traffic Control displays | |
CN115440191B (zh) | 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 | |
Kleinert et al. | Apron Controller Support by Integration of Automatic Speech Recognition with an Advanced Surface Movement Guidance and Control System | |
US20200372916A1 (en) | Method and device for automatically managing audio air traffic control messages on board an aircraft | |
Rataj et al. | AcListant with Continuous Learning: Speech Recognition in Air Traffic Control | |
CN114187893A (zh) | 空管语音智能监控方法和*** | |
CN115223558A (zh) | 空管语音管理方法、***及计算机存储介质 | |
Subramanian et al. | Custom IBM Watson speech-to-text model for anomaly detection using ATC-pilot voice communication | |
Ohneiser et al. | Air traffic controller support by speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |