CN114896397A

CN114896397A - 一种基于bert-crf词向量模型的空管指令复诵检验方法

Info

Publication number: CN114896397A
Application number: CN202210465120.3A
Authority: CN
Inventors: 张玮; 马翼平; 付宗宝; 田长盛
Original assignee: Avic East China Photoelectric Shanghai Co ltd
Current assignee: Avic East China Photoelectric Shanghai Co ltd
Priority date: 2022-04-29
Filing date: 2022-04-29
Publication date: 2022-08-12

Abstract

本发明涉及一种基于BERT‑CRF词向量模型的空管指令复诵检验方法，包括：采集空管指令数据，对其进行数据清洗和标注；挖掘其语法规则、分词规则，构建空管指令复诵数据库；搭建BERT网络结构和CRF网络结构；整合BERT网络结构和CRF网络结构；使用BERT‑CRF模型将空管指令复诵文本转换为词向量模型，实现对文本信息的编码或特征提取；构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络，使用BERT‑CRF生成的词向量模型作为孪生网络的输入，判断空管指令复诵文本组合是否一致使用测试集对BERT‑CRF模型进行评估，当评估结果超过预设阈值时，固定模型结构执行本步骤，否则组织数据重复上一步骤；通过BERT‑CRF词向量模型将空管指令和复诵指令转化为词向量序列。

Description

一种基于BERT-CRF词向量模型的空管指令复诵检验方法

技术领域

本发明涉及语言分析技术领域，更具体地说，涉及一种基于BERT-CRF词向量模型的空管指令复诵检验方法。

背景技术

空管指令是空中交通管制过程中传递信息的关键载体，空管员通过空管指令对空域中的飞行活动实施统一的监督、管理和调度。在执行飞行任务时，管制员通过语音电台向飞行员发送空管指令，飞行员收到指令后会对其内容进行复诵，由人工确认双方复诵内容是否基本一致，当复诵无误时，飞行员执行相应的飞行动作。

由于语音信号在信道传递的过程中会受到各种噪声的干扰，导致飞行员接收到的空管指令出现偏差，进而复诵错误的空管指令。如果管制员和飞行员不能及时发现复诵错误，将会对飞行任务造成极大的安全隐患。为了减少相关风险，本发明提出一种基于BERT-CRF词向量模型的空管指令复诵检验方法，运用人工智能方法对空管指令实施复诵校验，实现自动化的空管指令复诵预警。

发明内容

本发明的目的在于提供一种基于BERT-CRF词向量模型的空管指令复诵检验方法，解决了空中交通管制作业中，空管指令复诵的一致性只能由人工判断的问题，实现了自动化、智能化的空管指令复诵检验。

本发明提供一种基于BERT-CRF词向量模型的空管指令复诵检验方法，包括以下步骤：

S1：采集空管指令数据，对其进行数据清洗和标注；

S2：挖掘其语法规则、分词规则，构建空管指令复诵数据库，用于后续训练；

S3：搭建BERT网络结构和CRF网络结构；

S4：整合BERT网络结构和CRF网络结构，形成BERT-CRF模型；

S5：使用空管指令复诵数据库对BERT-CRF模型进行训练，空管指令文本作为训练输入，分词标签作为模型的输出；

S6：使用测试集对BERT-CRF模型进行评估，当评估结果超过预设阈值时，固定模型结构执行步骤S6，否则组织数据重复步骤S5；

S7：通过BERT-CRF词向量模型将空管指令和复诵指令转化为词向量序列。

进一步地，所述步骤S5中的分词标签作为模型的输出仅针对模型训练过程，复诵一致性判断所使用的特征为模型中间层的词向量。

进一步地，所述步骤S3中包括使用基于多头注意力机制和位置编码的组合结构来提取特征信息；多头注意力机制提取特征的计算公式为：

MultiHead(Q,K,V)＝Concat(head₁,...,head_n)W^O

head_i＝Attention(XW_i ^Q,XW_i ^K,XW_i ^V)

进一步地，所述步骤S3中还包括对BERT在空管指令复诵语料库中进行预训练。

进一步地，所述预训练包括以下步骤：

S31：屏蔽训练，随机遮挡输入中的一些词汇，并基于上下文预测被遮挡的词汇，使得文本表示当前语境；

S32：下一句预测，判断两句话是否连续。

进一步地，所述步骤S3中还包括计算每一种位置标签序列的得分，所述得分的计算公式如下：

其中，n为句子的长度，X＝(X₁，X₂，…，X_n)为输入空管复诵指令文字序列，Y＝(Y₁，Y₂，…，Y_n)为其对应的位置标签序列；A表示位置标签之间的转移概率，

表示第i个字对应的位置标签Yi的概率。

进一步地，所述步骤S3中还包括对所有的位置标签序列分数进行归一化，并使得正确序列分数最大，计算方法如下式所示：

进一步地，所述步骤S5中还包括计算相邻两轮迭代结束后词向量层网络节点数值之差的平方和，达到局部极小值时即停止训练。

进一步地，所述步骤S7中还包括将待处理的空管指令文本输入上述词向量模型，计算得到词向量层网络节点的输出数值即为表征文本指令的词向量。

进一步地，所述基于BERT-CRF词向量模型的空管指令复诵检验方法还包括构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络，使用BERT-CRF生成的词向量模型作为孪生网络的输入，判断空管指令复诵文本组合是否一致。

本发明提供的基于BERT-CRF词向量模型的空管指令复诵检验方法，使用人工智能方法对空管指令实施复诵校验，实现自动化、智能化的空管指令复诵预警，解决了空中交通管制作业中，空管指令复诵的一致性只能由人工判断的问题，以提升空中交通管制作业的安全性，提高管制员的工作效率。

附图说明

图1为本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法的流程示意图。

图2为基于BERT-CRF空管指令词向量生成模型结构示意图。

图3(a)-图3(b)为BERT模型的结构说明图。

图4为CRF模型的结构说明图。

图5为初始预训练后BERT-CRF模型生成的词向量在二维空间中的映射图。

图6为经过10轮迭代后BERT-CRF模型生成的词向量在二维空间中的映射图。

图7为经过20轮迭代后BERT-CRF模型生成的词向量在二维空间中的映射图。

图8为空管指令复诵相似度计算孪生网络模型结构示意图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

空中交通管制指令是一种典型的调度指令，有着严格的指令规范要求和指令复诵要求。本实施例依据某机场数据设备中取出的空管指令文字数据，建立了空管指令复诵语料库。语料库能涵盖所有类型的空管指令，具有一定的代表性。

图1为本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法的流程示意图。请参照图1，本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法，包括以下步骤：

S1：采集空管指令数据，对其进行数据清洗和标注；

S3：搭建BERT网络结构和CRF网络结构；

S4：整合BERT网络结构和CRF网络结构，形成BERT-CRF模型；

S5：使用空管指令复诵数据库对BERT-CRF模型进行训练，空管指令文本作为训练输入，分词标签作为模型的输出；(此输出仅针对模型训练过程，后续复诵一致性判断所使用的特征为模型中间层的词向量)

S6：使用测试集对BERT-CRF模型进行评估，当评估结果超过预设阈值(根据具体的工况和需求而定，如90％)时，固定模型结构执行步骤S6，否则组织数据重复步骤S5；

图2为基于BERT-CRF空管指令词向量生成模型结构示意图，图3(a)-图3(b)为BERT模型的结构说明图。参阅图2、图3的(a)和图3的(b)，具体实现步骤如下：

步骤一：搭建BERT网络结构，如图3的(a)所示，其中E[CLS]为字块嵌入数据，EA为句块嵌入数据，E0为位置嵌入数据，T0为BERT输出的特征数据即空管指令文字。Trm代表图3的(b)所示的Encoder结构，使用基于多头注意力机制和位置编码的组合结构来提取特征信息；多头注意力机制提取特征的计算公式为：

MultiHead(Q,K,V)＝Concat(head₁,...,head_n)W^O

head_i＝Attention(XW_i ^Q,XW_i ^K,XW_i ^V)

步骤二：对BERT在空管指令复诵语料库中进行预训练，训练任务包括：步骤S31：屏蔽训练，随机遮挡输入中的一些词汇，并基于上下文预测被遮挡的词汇，使得文本表示当前语境；步骤S32：下一句预测，判断两句话是否连续。预训练的模型不需要改变基础模型架构，只需要在下游任务中对BERT进行微调，减少了使用者的训练时间和硬件要求。

图4为CRF模型的结构说明图。如图4所示，步骤三：建立CRF模型结构，其中，n为句子的长度，X＝(X₁，X₂，…，X_n)为输入空管复诵指令文字序列，Y＝(Y₁，Y₂，…，Y_n)为其对应的位置标签序列；A表示位置标签之间的转移概率，

表示第i个字对应的位置标签Yi的概率；计算每一种位置标签序列的得分，所述得分的计算公式如下：

步骤四：对所有的位置标签序列分数进行归一化，并使得正确序列分数最大，计算方法如下式所示：

步骤五：整合BERT结构和CRF结构形成如图2所示的BERT-CRF空管指令词向量生成模型。

步骤六：将空管指令文本作为模型输入、对应的分词标签作为模型输出，对BERT-CRF词向量生成模型进行训练；计算相邻两轮迭代结束后词向量层网络节点数值之差的平方和，达到局部极小值时即停止训练。图5至图7所示为训练过程，经过若干轮迭代后，模型具有良好的区分效果。

步骤S7中还包括将待处理的空管指令文本输入上述词向量模型，计算得到词向量层网络节点的输出数值即为表征文本指令的词向量。

实施例2

图8为空管指令复诵相似度计算孪生网络模型结构示意图。如图8所示，本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法还包括构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络，使用BERT-CRF生成的词向量模型作为孪生网络的输入，判断空管指令复诵文本组合是否一致。

具体地，本实施例由四个模块构成，分别为输入模块、信息交互模块、语义表征模块和语义判断模块，其中输入模块即为实施方式一所描述的空管指令词向量生成模型。实现步骤如下：

步骤一：由输入模块生成词向量。对空管指令S_A和复诵指令S_B进行预处理后。通过统计空管指令长度，将输入文本长度设置为30，文本长度不足则补零，过长则截取。再通过词向量模型将空管指令S_A和复诵指令S_B转化为词向量序列，即通过该模块可以得到管制员发送的空管指令序列

和飞行员发送的复诵指令序列

其中，

代表空管指令G_A中第i个词的向量。

步骤二：信息交互模块计算。先根据空管指令序列T_A和复诵指令序列T_B生成相似度矩阵E；然后通过相似度矩阵E、空管指令序列T_A和复诵指令序列T_B生成含有交互信息的向量序列H_A和H_B，其维度与T_A相同；其次将T_A和H_A、T_B和H_B进行增强信息，生成含向量序列m_a和m_b；最后将m_a和m_b作为本模块的输出内容。

步骤三：步骤二中的相似度矩阵E表征了空管指令和复诵指令中词与词之间的关系，其计算公式如下：

其中n为文本输入长度最大值。

为空管指令序列T_A中第i个词与复诵指令序列T_B中第j个词的交互信息，

代表空管指令T_A中第i个词的词向量，

代表复诵指令T_B中第j个词的词向量。

步骤四：计算含有交互信息的向量序列

和

和

计算方法如下式所示：

其中

是

的加权平均和，表示

与