CN114896397A - 一种基于bert-crf词向量模型的空管指令复诵检验方法 - Google Patents
一种基于bert-crf词向量模型的空管指令复诵检验方法 Download PDFInfo
- Publication number
- CN114896397A CN114896397A CN202210465120.3A CN202210465120A CN114896397A CN 114896397 A CN114896397 A CN 114896397A CN 202210465120 A CN202210465120 A CN 202210465120A CN 114896397 A CN114896397 A CN 114896397A
- Authority
- CN
- China
- Prior art keywords
- bert
- crf
- model
- word vector
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于BERT‑CRF词向量模型的空管指令复诵检验方法,包括:采集空管指令数据,对其进行数据清洗和标注;挖掘其语法规则、分词规则,构建空管指令复诵数据库;搭建BERT网络结构和CRF网络结构;整合BERT网络结构和CRF网络结构;使用BERT‑CRF模型将空管指令复诵文本转换为词向量模型,实现对文本信息的编码或特征提取;构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络,使用BERT‑CRF生成的词向量模型作为孪生网络的输入,判断空管指令复诵文本组合是否一致使用测试集对BERT‑CRF模型进行评估,当评估结果超过预设阈值时,固定模型结构执行本步骤,否则组织数据重复上一步骤;通过BERT‑CRF词向量模型将空管指令和复诵指令转化为词向量序列。
Description
技术领域
本发明涉及语言分析技术领域,更具体地说,涉及一种基于BERT-CRF词向量模型的空管指令复诵检验方法。
背景技术
空管指令是空中交通管制过程中传递信息的关键载体,空管员通过空管指令对空域中的飞行活动实施统一的监督、管理和调度。在执行飞行任务时,管制员通过语音电台向飞行员发送空管指令,飞行员收到指令后会对其内容进行复诵,由人工确认双方复诵内容是否基本一致,当复诵无误时,飞行员执行相应的飞行动作。
由于语音信号在信道传递的过程中会受到各种噪声的干扰,导致飞行员接收到的空管指令出现偏差,进而复诵错误的空管指令。如果管制员和飞行员不能及时发现复诵错误,将会对飞行任务造成极大的安全隐患。为了减少相关风险,本发明提出一种基于BERT-CRF词向量模型的空管指令复诵检验方法,运用人工智能方法对空管指令实施复诵校验,实现自动化的空管指令复诵预警。
发明内容
本发明的目的在于提供一种基于BERT-CRF词向量模型的空管指令复诵检验方法,解决了空中交通管制作业中,空管指令复诵的一致性只能由人工判断的问题,实现了自动化、智能化的空管指令复诵检验。
本发明提供一种基于BERT-CRF词向量模型的空管指令复诵检验方法,包括以下步骤:
S1:采集空管指令数据,对其进行数据清洗和标注;
S2:挖掘其语法规则、分词规则,构建空管指令复诵数据库,用于后续训练;
S3:搭建BERT网络结构和CRF网络结构;
S4:整合BERT网络结构和CRF网络结构,形成BERT-CRF模型;
S5:使用空管指令复诵数据库对BERT-CRF模型进行训练,空管指令文本作为训练输入,分词标签作为模型的输出;
S6:使用测试集对BERT-CRF模型进行评估,当评估结果超过预设阈值时,固定模型结构执行步骤S6,否则组织数据重复步骤S5;
S7:通过BERT-CRF词向量模型将空管指令和复诵指令转化为词向量序列。
进一步地,所述步骤S5中的分词标签作为模型的输出仅针对模型训练过程,复诵一致性判断所使用的特征为模型中间层的词向量。
进一步地,所述步骤S3中包括使用基于多头注意力机制和位置编码的组合结构来提取特征信息;多头注意力机制提取特征的计算公式为:
MultiHead(Q,K,V)=Concat(head1,...,headn)WO
headi=Attention(XWi Q,XWi K,XWi V)
进一步地,所述步骤S3中还包括对BERT在空管指令复诵语料库中进行预训练。
进一步地,所述预训练包括以下步骤:
S31:屏蔽训练,随机遮挡输入中的一些词汇,并基于上下文预测被遮挡的词汇,使得文本表示当前语境;
S32:下一句预测,判断两句话是否连续。
进一步地,所述步骤S3中还包括计算每一种位置标签序列的得分,所述得分的计算公式如下:
进一步地,所述步骤S3中还包括对所有的位置标签序列分数进行归一化,并使得正确序列分数最大,计算方法如下式所示:
进一步地,所述步骤S5中还包括计算相邻两轮迭代结束后词向量层网络节点数值之差的平方和,达到局部极小值时即停止训练。
进一步地,所述步骤S7中还包括将待处理的空管指令文本输入上述词向量模型,计算得到词向量层网络节点的输出数值即为表征文本指令的词向量。
进一步地,所述基于BERT-CRF词向量模型的空管指令复诵检验方法还包括构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络,使用BERT-CRF生成的词向量模型作为孪生网络的输入,判断空管指令复诵文本组合是否一致。
本发明提供的基于BERT-CRF词向量模型的空管指令复诵检验方法,使用人工智能方法对空管指令实施复诵校验,实现自动化、智能化的空管指令复诵预警,解决了空中交通管制作业中,空管指令复诵的一致性只能由人工判断的问题,以提升空中交通管制作业的安全性,提高管制员的工作效率。
附图说明
图1为本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法的流程示意图。
图2为基于BERT-CRF空管指令词向量生成模型结构示意图。
图3(a)-图3(b)为BERT模型的结构说明图。
图4为CRF模型的结构说明图。
图5为初始预训练后BERT-CRF模型生成的词向量在二维空间中的映射图。
图6为经过10轮迭代后BERT-CRF模型生成的词向量在二维空间中的映射图。
图7为经过20轮迭代后BERT-CRF模型生成的词向量在二维空间中的映射图。
图8为空管指令复诵相似度计算孪生网络模型结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
空中交通管制指令是一种典型的调度指令,有着严格的指令规范要求和指令复诵要求。本实施例依据某机场数据设备中取出的空管指令文字数据,建立了空管指令复诵语料库。语料库能涵盖所有类型的空管指令,具有一定的代表性。
图1为本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法的流程示意图。请参照图1,本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法,包括以下步骤:
S1:采集空管指令数据,对其进行数据清洗和标注;
S2:挖掘其语法规则、分词规则,构建空管指令复诵数据库,用于后续训练;
S3:搭建BERT网络结构和CRF网络结构;
S4:整合BERT网络结构和CRF网络结构,形成BERT-CRF模型;
S5:使用空管指令复诵数据库对BERT-CRF模型进行训练,空管指令文本作为训练输入,分词标签作为模型的输出;(此输出仅针对模型训练过程,后续复诵一致性判断所使用的特征为模型中间层的词向量)
S6:使用测试集对BERT-CRF模型进行评估,当评估结果超过预设阈值(根据具体的工况和需求而定,如90%)时,固定模型结构执行步骤S6,否则组织数据重复步骤S5;
S7:通过BERT-CRF词向量模型将空管指令和复诵指令转化为词向量序列。
本发明提供的基于BERT-CRF词向量模型的空管指令复诵检验方法,使用人工智能方法对空管指令实施复诵校验,实现自动化、智能化的空管指令复诵预警,解决了空中交通管制作业中,空管指令复诵的一致性只能由人工判断的问题,以提升空中交通管制作业的安全性,提高管制员的工作效率。
图2为基于BERT-CRF空管指令词向量生成模型结构示意图,图3(a)-图3(b)为BERT模型的结构说明图。参阅图2、图3的(a)和图3的(b),具体实现步骤如下:
步骤一:搭建BERT网络结构,如图3的(a)所示,其中E[CLS]为字块嵌入数据,EA为句块嵌入数据,E0为位置嵌入数据,T0为BERT输出的特征数据即空管指令文字。Trm代表图3的(b)所示的Encoder结构,使用基于多头注意力机制和位置编码的组合结构来提取特征信息;多头注意力机制提取特征的计算公式为:
MultiHead(Q,K,V)=Concat(head1,...,headn)WO
headi=Attention(XWi Q,XWi K,XWi V)
步骤二:对BERT在空管指令复诵语料库中进行预训练,训练任务包括:步骤S31:屏蔽训练,随机遮挡输入中的一些词汇,并基于上下文预测被遮挡的词汇,使得文本表示当前语境;步骤S32:下一句预测,判断两句话是否连续。预训练的模型不需要改变基础模型架构,只需要在下游任务中对BERT进行微调,减少了使用者的训练时间和硬件要求。
图4为CRF模型的结构说明图。如图4所示,步骤三:建立CRF模型结构,其中,n为句子的长度,X=(X1,X2,…,Xn)为输入空管复诵指令文字序列,Y=(Y1,Y2,…,Yn)为其对应的位置标签序列;A表示位置标签之间的转移概率,表示第i个字对应的位置标签Yi的概率;计算每一种位置标签序列的得分,所述得分的计算公式如下:
步骤四:对所有的位置标签序列分数进行归一化,并使得正确序列分数最大,计算方法如下式所示:
步骤五:整合BERT结构和CRF结构形成如图2所示的BERT-CRF空管指令词向量生成模型。
步骤六:将空管指令文本作为模型输入、对应的分词标签作为模型输出,对BERT-CRF词向量生成模型进行训练;计算相邻两轮迭代结束后词向量层网络节点数值之差的平方和,达到局部极小值时即停止训练。图5至图7所示为训练过程,经过若干轮迭代后,模型具有良好的区分效果。
步骤S7中还包括将待处理的空管指令文本输入上述词向量模型,计算得到词向量层网络节点的输出数值即为表征文本指令的词向量。
实施例2
图8为空管指令复诵相似度计算孪生网络模型结构示意图。如图8所示,本发明实施例提供的基于BERT-CRF词向量模型的空管指令复诵检验方法还包括构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络,使用BERT-CRF生成的词向量模型作为孪生网络的输入,判断空管指令复诵文本组合是否一致。
具体地,本实施例由四个模块构成,分别为输入模块、信息交互模块、语义表征模块和语义判断模块,其中输入模块即为实施方式一所描述的空管指令词向量生成模型。实现步骤如下:
步骤一:由输入模块生成词向量。对空管指令SA和复诵指令SB进行预处理后。通过统计空管指令长度,将输入文本长度设置为30,文本长度不足则补零,过长则截取。再通过词向量模型将空管指令SA和复诵指令SB转化为词向量序列,即通过该模块可以得到管制员发送的空管指令序列 和飞行员发送的复诵指令序列其中,代表空管指令GA中第i个词的向量。
步骤二:信息交互模块计算。先根据空管指令序列TA和复诵指令序列TB生成相似度矩阵E;然后通过相似度矩阵E、空管指令序列TA和复诵指令序列TB生成含有交互信息的向量序列HA和HB,其维度与TA相同;其次将TA和HA、TB和HB进行增强信息,生成含向量序列ma和mb;最后将ma和mb作为本模块的输出内容。
步骤三:步骤二中的相似度矩阵E表征了空管指令和复诵指令中词与词之间的关系,其计算公式如下:
步骤六:语义表征模块计算。语义表征模块由两个并行的BiGRU网络组成,网络结构如图7所示,模块将词向量ma和mb输入到BiGRU网络中生成语义向量hA和hB。词向量输入到BiGRU网络生成语义向量的计算过程如下式所示。
rt=σ(Wrx+Urht-1)
zt=σ(Wzx+Uzht-1)
步骤七:语义判断模块计算。空管指令SA和复诵指令SB经过前三层模块处理后形成语义向量hA={qA1,qA2,...,qAn}和hB={qB1,qB2,...,qBn},语义判断模块的原理是计算语义向量hA和hB的距离作为空管指令SA和复诵指令SB的相似度,使用曼哈顿距离作计算语义向量hA和hA的距离,计算方法如下式所示。
其中,S(h,hB)代表语义相似度,qAi代表hA向量第i个值,σ(·)函数为sigmiod函数。
步骤八:计算相似度分值,计算方法如下式所示。
若Score≥0.9则复诵一致,否则复诵不一致。
基于上文的描述可知,本发明优点在于:
1、本发明提供的基于BERT-CRF词向量模型的空管指令复诵检验方法,使用人工智能方法对空管指令实施复诵校验,实现自动化、智能化的空管指令复诵预警,解决了空中交通管制作业中,空管指令复诵的一致性只能由人工判断的问题,以提升空中交通管制作业的安全性,提高管制员的工作效率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,包括以下步骤:
S1:采集空管指令数据,对其进行数据清洗和标注;
S2:挖掘其语法规则、分词规则,构建空管指令复诵数据库,用于后续训练;
S3:搭建BERT网络结构和CRF网络结构;
S4:整合BERT网络结构和CRF网络结构,形成BERT-CRF模型;
S5:使用空管指令复诵数据库对BERT-CRF模型进行训练,空管指令文本作为训练输入,分词标签作为模型的输出;
S6:使用测试集对BERT-CRF模型进行评估,当评估结果超过预设阈值时,固定模型结构执行步骤S6,否则组织数据重复步骤S5;
S7:通过BERT-CRF词向量模型将空管指令和复诵指令转化为词向量序列。
2.根据权利要求1所述的基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,所述步骤S5中的分词标签作为模型的输出仅针对模型训练过程,复诵一致性判断所使用的特征为模型中间层的词向量。
4.根据权利要求1所述的基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,所述步骤S3中还包括对BERT在空管指令复诵语料库中进行预训练。
5.根据权利要求4所述的基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,所述预训练包括以下步骤:
S31:屏蔽训练,随机遮挡输入中的一些词汇,并基于上下文预测被遮挡的词汇,使得文本表示当前语境;
S32:下一句预测,判断两句话是否连续。
8.根据权利要求1所述的基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,所述步骤S5中还包括计算相邻两轮迭代结束后词向量层网络节点数值之差的平方和,达到局部极小值时即停止训练。
9.根据权利要求1所述的基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,所述步骤S7中还包括将待处理的空管指令文本输入上述词向量模型,计算得到词向量层网络节点的输出数值即为表征文本指令的词向量。
10.根据权利要求1所述的基于BERT-CRF词向量模型的空管指令复诵检验方法,其特征在于,所述基于BERT-CRF词向量模型的空管指令复诵检验方法还包括构建包含输入模块、信息交互模块、语义表征模块和语义判断模块的孪生网络;
使用BERT-CRF生成的词向量模型作为孪生网络的输入,判断空管指令复诵文本组合是否一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210465120.3A CN114896397A (zh) | 2022-04-29 | 2022-04-29 | 一种基于bert-crf词向量模型的空管指令复诵检验方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210465120.3A CN114896397A (zh) | 2022-04-29 | 2022-04-29 | 一种基于bert-crf词向量模型的空管指令复诵检验方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114896397A true CN114896397A (zh) | 2022-08-12 |
Family
ID=82719059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210465120.3A Pending CN114896397A (zh) | 2022-04-29 | 2022-04-29 | 一种基于bert-crf词向量模型的空管指令复诵检验方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114896397A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116522165A (zh) * | 2023-06-27 | 2023-08-01 | 武汉爱科软件技术股份有限公司 | 一种基于孪生结构的舆情文本匹配***及方法 |
-
2022
- 2022-04-29 CN CN202210465120.3A patent/CN114896397A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116522165A (zh) * | 2023-06-27 | 2023-08-01 | 武汉爱科软件技术股份有限公司 | 一种基于孪生结构的舆情文本匹配***及方法 |
CN116522165B (zh) * | 2023-06-27 | 2024-04-02 | 武汉爱科软件技术股份有限公司 | 一种基于孪生结构的舆情文本匹配***及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110609891A (zh) | 一种基于上下文感知图神经网络的视觉对话生成方法 | |
CN110134946B (zh) | 一种针对复杂数据的机器阅读理解方法 | |
CN111709244B (zh) | 一种用于矛盾纠纷事件因果关系识别的深度学习方法 | |
WO2022048194A1 (zh) | 事件主体识别模型优化方法、装置、设备及可读存储介质 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN109933792A (zh) | 基于多层双向lstm和验证模型的观点型问题阅读理解方法 | |
CN110727844B (zh) | 一种基于生成对抗网络的在线评论商品特征观点提取方法 | |
CN109614612A (zh) | 一种基于seq2seq+attention的中文文本纠错方法 | |
CN115238045B (zh) | 一种生成式事件论元抽取方法、***及存储介质 | |
CN114239574A (zh) | 一种基于实体和关系联合学习的矿工违规行为知识抽取方法 | |
CN116484024A (zh) | 一种基于知识图谱的多层次知识库构建方法 | |
CN115203406A (zh) | 一种基于RoBERTa模型的长文本信息立场检测方法 | |
Zhu et al. | Relationship extraction method for urban rail transit operation emergencies records | |
CN114896397A (zh) | 一种基于bert-crf词向量模型的空管指令复诵检验方法 | |
CN110334340B (zh) | 基于规则融合的语义分析方法、装置以及可读存储介质 | |
CN116910013A (zh) | 基于语义流图挖掘的***日志异常检测方法 | |
CN111597816A (zh) | 一种自注意力命名实体识别方法、装置、设备及存储介质 | |
CN113642862A (zh) | 基于bert-mbigru-crf模型的电网调度指令命名实体识别方法及*** | |
CN114492460A (zh) | 基于衍生提示学习的事件因果关系抽取方法 | |
CN114548116A (zh) | 一种基于语序与语义联合分析的中文文本检错方法及*** | |
CN117909918A (zh) | 一种基于融合特征的监护仪故障预测方法和*** | |
CN117151346A (zh) | 一种基于智慧学习的民航专业教学培训*** | |
CN116910196A (zh) | 一种基于多任务学习的校园安全突发事件抽取方法 | |
CN116578671A (zh) | 一种情感-原因对提取方法及装置 | |
CN115098687A (zh) | 面向电力sdh光传输***调度运行的告警排查方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |